Google blog search(博客搜索)不收录博客文章可能原因
如果要想让google blog search尽快收录博客内容,可以利用google blogsearch的ping服务加快网页收录速度。 通过 Google“博客搜索”Ping API,用户可以程序化的方式将博客内容的更新通知给 Google“博客搜索”引擎。
但是最近好长时间以来,发现google blog search没有更新、正常收录博客日志了。一开始以为是为wordpress写的robots.txt 格式错误,限制了Google Blog Search蜘蛛Blogsearch Bot爬行,现在想想原因可能由于feed地址托管在feedsky上的缘故,谷歌博客搜索引擎的蜘蛛不能正确抓取托管在feedsky上的feed,尤其你的feed地址型为feed.dreamfreeblog.com(个人猜测,呵呵)。所以手动在博客首页又另外添加了RSS 2.0的原始feed地址,事实上证明是正确的,最近已收录正常。
根据Google Blog Search Help的描述,要想博客被GG Blog Search收录索引,如果能够提供RSS、Atom、XML等feed格式的大多数Blog平台,均可实现这一功能。这也许就是为什么只提供经过托管的feed,而没有WordPress博客原始默认的RSS/Atom地址不能被谷歌博客搜索抓取了。
PS:为什么我的博客中较早的博客文章内容不能被收录。Google Blog Search Help也给出了解答:由于谷歌博客搜索根据网站的feeds索引,如果在给出正确rss/atom等feed地址或GG提供博客搜索服务前,那么那些较老的日志是不能被收录的。对于绝大数博客,这个时间差不多是在2005年6月份。如果在这时间之后,你的博客不被正常收录,那就该检查检查feed地址或提交你的博客地址。
不过话又说回来,虽然Google Blog Search也提供按照页面内容相关性排序结果,但主要还是根据收录时间排列。较早的日志不能收录问题也不大。
文章来源:睡到自然醒blog[http://www.dreamfreeblog.com]
文章链接地址: http://www.dreamfreeblog.com/not-indexed-google-blog-search-258.html 收藏本文到网摘:




哇我是沙发!
[回复]
咦为什么我没有头像?
[回复]
dreamfree reply on 2008-08-17 11:13 pm:
呵呵,这头像还不够吓人吗
[回复]
用 Google XML Sitemaps 这个插件也可以加快 Google 的抓取吧
[回复]
dreamfree reply on 2008-08-17 11:15 pm:
对,google抓取没什么问题,All in One SEO这个插件有这个XML Sitemap功能
但google blog search是根据rss抓取的,不提供原始的rss订阅源是不能正确抓取收录的
[回复]
我也发现好久没有收录了,不过他给我的贡献值也不高,关于feed,我主页也提供了原本的rss,这样读者可以自由选取!
[回复]
dreamfree reply on 2008-08-17 11:17 pm:
一般的博客主题都会提供rss/atom/xml订阅源,后来有了feedsky好像被我都删掉了,GG博客搜索也就是从那时不开始更新的
[回复]
还真没遇到过这种问题
[回复]
dreamfree reply on 2008-08-17 11:19 pm:
你的订阅地址可能就是domain/feed.php格式的,所以不存在这个现象,呵呵
[回复]
没有检查过呢,不过它是在我的ping列表的。
[回复]
dreamfree reply on 2008-08-17 11:20 pm:
嘿嘿,在ping列表里但没订阅源谷歌博客蜘蛛还是不能抓取
[回复]
我站点的收录量总在变 不稳定啊不稳定.
[回复]
XML 用起来google就搞定了~~baidu就不好对付了哦~~
[回复]
[...] 一直以为wordpress插件冲突、没能提供正确订阅源而像Google blog search(博客搜索)不能收录一样,或者由于网上说过的feedsky或默认rss/atom/xml输出如果使用了wordpress文章编辑中的more标签截断功能而不能正确输出全文。 [...]
我解除了Feedsky的转向 Google Blogsearch就立即收录了 看来果然是兼容问题?
[回复]
其实不要去掉Feedsky绑定的域名,你只要另外提供一个默认的feed就行了,你可以试试,形如domain/feed
[回复]
[...] 同时从百度提交博客网址方法“输入博客地址或RSS地址”来看,百度博客搜索引擎也是通过抓取博客rss feed地址更新收录。因此,如果不能被百度博客搜索正常收录,可以参考Google blog search(博客搜索)不收录博客文章可能原因。简单的说,不收录的原因很可能是由于feedsky托管等原因没正确提供默认的domain/feed地址。 [...]
[...] 一直以为wordpress插件冲突、没能提供正确订阅源而像Google blog search(博客搜索)不能收录一样,或者由于网上说过的feedsky或默认rss/atom/xml输出如果使用了wordpress文章编辑中的more标签截断功能而不能正确输出全文。 [...]