gigablast搜索引擎简介




今天看ftp日志记录,发现gigablastbot爬虫,http://www.gigablast.com/spider.html,一开始以为又是象larbin什么采集程序。原来gigablast.com也是一个十分重要的搜索引擎。

Gigablast 由前Infoseek工程师Matt Wells创立,2002年3月展示pre-beta版,2002年7月21日发布Beta版。Gigablast提供常规搜索即网页(web),图像(images),视频(video)等,Gigablast的数据库目前仍偏小,大约1.5亿网页,但也提供网页快照(cached),一个特色功能是即时索引网页,即Fresh Results功能,你的网页刚提交它就能搜索。

但有一点我还是不明白,既然是搜索引擎,肯定能在最短的时间内对新网页做出反应。从日志记录中也能看出,基本上一些常见的蜘蛛也都来爬过。但为什么对搜索结果释放却不尽相同,有人说那些蜘蛛是“Fresh Crawl” spider,大致意思是相当于那种先锋蜘蛛,先不管三七二十一尽可能把所有网页收录,然后经过高级蜘蛛筛选判断,释放搜索结果,像百度可能要等上一个月,虽然Baiduspider每天都来过。但我想,这其中除了算法上的一些差异,人为因素判断还是影响很大的:???:

最后,gigablast的网站登陆入口是http://www.gigablast.com/index.php?page=about&subPage=addUrl,可以向gigablast搜索引擎提交网站地址。

延伸阅读:

About dreamfree:

每天梦想睡到自然醒的孩纸伤不起...zZ

Find all posts by dreamfree | Visit Website


Leave a Reply

使用新浪微博登陆


分类目录

文章存档

Event

欢迎上海地区摄影爱好者或自信MM参加 自然醒blog 线下活动:暴走上海街拍 or 人像外拍,详情点击图片链接

永久有效 7.49 美金 Godaddy 优惠