站内搜索

Loading

推荐

Google blog search(博客搜索)不收录博客文章可能原因

如果要想让google blog search尽快收录博客内容,可以利用google blogsearch的ping服务加快网页收录速度。 通过 Google“博客搜索”Ping API,用户可以程序化的方式将博客内容的更新通知给 Google“博客搜索”引擎。

但是最近好长时间以来,发现google blog search没有更新、正常收录博客日志了。一开始以为是为wordpress写的robots.txt 格式错误,限制了Google Blog Search蜘蛛Blogsearch Bot爬行,现在想想原因可能由于feed地址托管在feedsky上的缘故,谷歌博客搜索引擎的蜘蛛不能正确抓取托管在feedsky上的feed,尤其你的feed地址型为feed.dreamfreeblog.com(个人猜测,呵呵)。所以手动在博客首页又另外添加了RSS 2.0的原始feed地址,事实上证明是正确的,最近已收录正常。

根据Google Blog Search Help的描述,要想博客被GG Blog Search收录索引,如果能够提供RSS、Atom、XML等feed格式的大多数Blog平台,均可实现这一功能。这也许就是为什么只提供经过托管的feed,而没有WordPress博客原始默认的RSS/Atom地址不能被谷歌博客搜索抓取了。

PS:为什么我的博客中较早的博客文章内容不能被收录。Google Blog Search Help也给出了解答:由于谷歌博客搜索根据网站的feeds索引,如果在给出正确rss/atom等feed地址或GG提供博客搜索服务前,那么那些较老的日志是不能被收录的。对于绝大数博客,这个时间差不多是在2005年6月份。如果在这时间之后,你的博客不被正常收录,那就该检查检查feed地址或提交你的博客地址。

不过话又说回来,虽然Google Blog Search也提供按照页面内容相关性排序结果,但主要还是根据收录时间排列。较早的日志不能收录问题也不大。

[Post to Twitter] 分享到 Twitter! 

延伸阅读:

20 comments to Google blog search(博客搜索)不收录博客文章可能原因

Leave a Reply

 

 

 

You can use these HTML tags

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>