Google blog search(博客搜索)不收录博客文章可能原因

如果要想让google blog search尽快收录博客内容,可以利用google blogsearch的ping服务加快网页收录速度。 通过 Google“博客搜索”Ping API,用户可以程序化的方式将博客内容的更新通知给 Google“博客搜索”引擎。

但是最近好长时间以来,发现google blog search没有更新、正常收录博客日志了。一开始以为是为wordpress写的robots.txt 格式错误,限制了Google Blog Search蜘蛛Blogsearch Bot爬行,现在想想原因可能由于feed地址托管在feedsky上的缘故,谷歌博客搜索引擎的蜘蛛不能正确抓取托管在feedsky上的feed,尤其你的feed地址型为feed.dreamfreeblog.com(个人猜测,呵呵)。所以手动在博客首页又另外添加了RSS 2.0的原始feed地址,事实上证明是正确的,最近已收录正常。

根据Google Blog Search Help的描述,要想博客被GG Blog Search收录索引,如果能够提供RSS、Atom、XML等feed格式的大多数Blog平台,均可实现这一功能。这也许就是为什么只提供经过托管的feed,而没有WordPress博客原始默认的RSS/Atom地址不能被谷歌博客搜索抓取了。

PS:为什么我的博客中较早的博客文章内容不能被收录。Google Blog Search Help也给出了解答:由于谷歌博客搜索根据网站的feeds索引,如果在给出正确rss/atom等feed地址或GG提供博客搜索服务前,那么那些较老的日志是不能被收录的。对于绝大数博客,这个时间差不多是在2005年6月份。如果在这时间之后,你的博客不被正常收录,那就该检查检查feed地址或提交你的博客地址。

不过话又说回来,虽然Google Blog Search也提供按照页面内容相关性排序结果,但主要还是根据收录时间排列。较早的日志不能收录问题也不大。

转载请保留以下信息:
文章来源:睡到自然醒blog[http://www.dreamfreeblog.com]
文章链接地址: http://www.dreamfreeblog.com/not-indexed-google-blog-search-258.html

收藏本文到网摘: Del.icio.us Google书签 Digg Live Bookmark Technorati Furl Yahoo书签 Facebook 百度搜藏 新浪ViVi 365Key网摘 天极网摘 和讯网摘 博拉网 POCO网摘 添加到饭否 QQ书签 Digbuzz我挖网
1 Star2 Stars3 Stars4 Stars5 Stars (我要投票)
Loading ... Loading ...

  • #1
    Posted by IZK on 08月 16th, 2008 at 11:24 pm

    哇我是沙发! :em34:

    [回复]

    Wavatar
  • #2
    Posted by IZK on 08月 16th, 2008 at 11:25 pm

    咦为什么我没有头像?

    [回复]

    dreamfree reply on 2008-08-17 11:13 pm:

    呵呵,这头像还不够吓人吗 :mrgreen:

    [回复]

    Wavatar
  • #3
    Posted by Spider on 08月 17th, 2008 at 10:28 am

    用 Google XML Sitemaps 这个插件也可以加快 Google 的抓取吧

    [回复]

    dreamfree reply on 2008-08-17 11:15 pm:

    对,google抓取没什么问题,All in One SEO这个插件有这个XML Sitemap功能
    但google blog search是根据rss抓取的,不提供原始的rss订阅源是不能正确抓取收录的

    [回复]

    Wavatar
  • #4
    Posted by anliu on 08月 17th, 2008 at 2:58 pm

    我也发现好久没有收录了,不过他给我的贡献值也不高,关于feed,我主页也提供了原本的rss,这样读者可以自由选取!

    [回复]

    dreamfree reply on 2008-08-17 11:17 pm:

    一般的博客主题都会提供rss/atom/xml订阅源,后来有了feedsky好像被我都删掉了,GG博客搜索也就是从那时不开始更新的

    [回复]

    Wavatar
  • #5
    Posted by Lucifr on 08月 17th, 2008 at 6:41 pm

    还真没遇到过这种问题

    [回复]

    dreamfree reply on 2008-08-17 11:19 pm:

    你的订阅地址可能就是domain/feed.php格式的,所以不存在这个现象,呵呵

    [回复]

    Wavatar
  • #6
    Posted by Chada on 08月 17th, 2008 at 9:16 pm

    没有检查过呢,不过它是在我的ping列表的。

    [回复]

    dreamfree reply on 2008-08-17 11:20 pm:

    嘿嘿,在ping列表里但没订阅源谷歌博客蜘蛛还是不能抓取

    [回复]

    Wavatar
  • #7
    Posted by Yacca on 08月 17th, 2008 at 11:36 pm

    我站点的收录量总在变 不稳定啊不稳定.

    [回复]

    Wavatar
  • #8
    Posted by 别用鼠标点我 on 08月 18th, 2008 at 2:16 pm

    XML 用起来google就搞定了~~baidu就不好对付了哦~~ :em41:

    [回复]

    Wavatar
  • #9

    [...] 一直以为wordpress插件冲突、没能提供正确订阅源而像Google blog search(博客搜索)不能收录一样,或者由于网上说过的feedsky或默认rss/atom/xml输出如果使用了wordpress文章编辑中的more标签截断功能而不能正确输出全文。 [...]

    Wavatar
  • #10
    Posted by Eureka on 09月 23rd, 2008 at 9:14 pm

    我解除了Feedsky的转向 Google Blogsearch就立即收录了 看来果然是兼容问题?

    [回复]

    Wavatar
  • #11
    Posted by dreamfree on 09月 23rd, 2008 at 10:07 pm

    其实不要去掉Feedsky绑定的域名,你只要另外提供一个默认的feed就行了,你可以试试,形如domain/feed

    [回复]

    Wavatar
  • #12

    [...] 同时从百度提交博客网址方法“输入博客地址或RSS地址”来看,百度博客搜索引擎也是通过抓取博客rss feed地址更新收录。因此,如果不能被百度博客搜索正常收录,可以参考Google blog search(博客搜索)不收录博客文章可能原因。简单的说,不收录的原因很可能是由于feedsky托管等原因没正确提供默认的domain/feed地址。 [...]

    Wavatar
  • #13

    [...] 一直以为wordpress插件冲突、没能提供正确订阅源而像Google blog search(博客搜索)不能收录一样,或者由于网上说过的feedsky或默认rss/atom/xml输出如果使用了wordpress文章编辑中的more标签截断功能而不能正确输出全文。 [...]

    Wavatar
Share your opinion! Post your thoughts.