网站的站内搜索看似是个小功能,但是要把它做好还是要费点劲的。对于一些数据量非常小的网站,很多网站都是采用 like查询来实现站内搜索功能,确实很方便,但是数据库大了用like查询就很慢了,如果要同时搜索标题和内容就更糟糕了。
很多大型资讯类网站或论坛采用百度提供的站内搜索,这样省掉了很多事情,搜索速度也快,还不用耗自己服务器资源。但是需要百度已经收录...
+阅读全文百度站长平台的原创保护工具已经推出很久了,但是一直在内测,火端上周在百度站长平台的一个活动中提交了内测报名资料,今天收到消息通过了。
搜索引擎都喜欢原创的内容,但由于一些搜索算法不给力,导致很多的原创文章的搜索排名还不如转载文章,也让很多原创的博主慢慢失去了原创的动力。好在搜索引擎都意识到这个问题,百度、360搜索都有原创保护功能,百度的还在内测,360搜索需要发邮件申请,估计要正式开放还需要一段时间...
+阅读全文火端网络开发的百度好搜网页搜索小偷程序很多人在用,非常简单方便,很快就可以搭建一个搜索引擎网站。但是仍有很多人想做完全独立的搜索引擎,而不是小偷程序,下面火端网络就分析独立的搜索引擎有哪些难点。
难点一:数据采集
互联网的网站页面到底有多少亿个?我想这个应该连百度、Google都难以计算,而且每天都还在疯涨。如果我们要采集大量网页数据,那就要准备很多台服务器,并且不断的采集,而采集这些数据需要开发专门的软件,并不是我们用web语言(php、jsp、.net)就能轻松搞定的。采集的页面我们还需要筛选,哪些是有用的哪些是没有用的,这些我们都要大量的算法来实现...
+阅读全文很多人想到搜索引擎就想到百度,认为百度在中国搜索引擎市场是永远的老大,没错!百度目前仍然是中国互联网搜索引擎老大,未来5~10年可能也还是老大,但现在慢慢的已经被搜狗和360分掉很多份额了。
火端网络手上的几个站都是360搜索和搜狗来流量比百度多,而且是长期都是如此,我们的部分客户的站也是这样...
+阅读全文