Posts Tagged ‘博客搜索引擎’
Technorati无法访问, Technorati被封遭GWF和谐?
博客左侧的收藏到Technorati的LOGO图标发现显示叉叉,不能显示只有描述标记 “add to technorati”。仔细想想,感觉昨天就出现了那个不能正确读取的Technorati图标,当时也没太在意,以为网速慢打不开网站的原因。
打开Technorati首页,不是那种网速慢而慢慢加载的感觉,估计Technorati不能访问真的是由于被伟大的GWF屏蔽罩住了。
Technorati可以说是一个出色的实时博客搜索引擎,能在相当短的时间内收录刚发表的日志。Technorati由Dave Sifry创建,老家位于美国加州的旧金山。Technorati支持tag(tag:)和反向链接(link:)等语法搜索。Technorati作为博客搜索引擎,可能比不上谷歌博客搜索google blog search,但Technorati对博客圈的reactions互连整合还是有一定优势的。Technorati对博客的推广、发展很有参考价值,尤其是大家熟悉的Technorati top 100 blogs。
但愿Technorati无法访问只是暂时问题吧,或者Technorati能尽快解封。
Google博客搜索首页改版更新(谷歌中国中文版)
继十月初谷歌博客搜索 Google Blog Search 英文版改版 后,谷歌中国中文版的Google博客搜索首页也更新改版了,值得注意的是,除了和美国英文版Google Blog Search的左侧分类导航中大致类似的科技、娱乐、体育外,中文版的谷歌博客搜索稍作了调整,多了情感、生活、杂谈等栏目。
改版后的谷歌博客搜索引擎(Google Blogsearch)排名算法亟需改进
在前几天的谷歌博客搜索Google Blog Search首页改版后,新的谷歌博客搜索引擎受到广泛关注,但一个新事物的出现往往会带来利与弊的权衡和较量。
垃圾制造者(spammers)当然也会钻Google博客搜索刚改版之后一些不成熟算法的漏洞。在谷歌博客搜索首页的科技分类里,关于Zenni Optical的垃圾日志已经爬上了科技话题最热话题的第7位,Zenni Optical是一个在线眼镜销售商。同样,’50 State Phone Book’ 也排名到了第10位。虽然google工程师Matt Cutts解释google比Techmeme这类话题聚合站点对文章的索引更具包容性,但是google作为在网页搜索索引方面有强大垃圾过滤功能的搜索引擎,在博客搜索引擎首页文章聚合算法上还有待改进。
Google博客搜索首页改版:最热门博客话题文章聚合
前篇文章谷歌博客搜索 Google Blog Search 改版(英文版)从自己的角度聊了下对Google博客搜索引擎改版的感受,顺便去谷歌官方博客浏览了下,其实昨天Google官方博客上就释放了这次Google博客搜索首页改版的最新消息。
由于全世界博客网站作者发表的博客文章几乎不可想象,博客文章很可能是未来互联网数据的很大一部分来源。“我们每天通过Google阅读器阅读的博客文章也许只是整个博文海洋的冰山一角”,这些杂而庞大的博客文章话题涉及娱乐八卦,个人庆祝纪念日记,个人观点,政治见解,等等。而且“很多话题往往会被社会主流媒体所忽视”或掩盖。
因此,这次Google博客搜索首页改版能让读者浏览、发现博客圈(blogosphere)最有趣、最热门的博客、话题、文章或日志。

Google博客搜索改版后,相对于旧版Google博客搜索的按照时间相关性排列博客文章,新版博客话题的热门程度由覆盖该博客热门话题(Number of blogs covering this story)的博客文章(日志)等因素排序。这项技术部分采取了谷歌新闻(Google News)的技术,聚合最热门的博客话题文章。
谷歌博客搜索 Google Blog Search 改版(英文版)
一般搜索有关WordPress博客方面的英文文章或资讯时比较喜欢使用谷歌博客搜索(Google Blog Search)服务,因为它提供按时间排列搜索结果的格式,比较容易获取较新的新闻消息。
刚才照例打开谷歌博客搜索英文版,发现整体界面改版了,一开始还以为点错进入了Google其它的产品服务。
改版后新版Google Blog Search新首页不像以前进入时呈现的默认的简洁搜索入口界面,取而代之的是罗列了最受关注的博客话题,文章排列顺序按照覆盖的博客数量排序(Number of blogs covering this story)。Google Blog Search 改版这种做法可能类似于博客话题最热排行榜吧,让人们知道博客谈论最多的热门话题。

同时Google Blog Search 改版界面左侧罗列了政治、美国、世界聚焦、商业、科技技术、视频/游戏、科学、娱乐、电影电视、体育等11个分类话题导航目录。Google Blog Search这样改版其实可以主动引导读者阅读相关话题,有点新闻门户网站的性质。
谷歌博客搜索 Google Blog Search 中文版还未改版目前,但肯定是一个趋势。因为不管英文版Google Blog Search改版的前后,我都喜欢该博客搜索服务,都是为了获得博客方面较新的新闻消息话题,而改版后界面更加读者友好型。
最后,改版后的Google Blog Search还是beta试用版,google后面肯定还有更大的动作。
百度博客搜索 – 我承认我落伍了
今天在百度看了看有哪些产品服务,竟然百度也有百度博客搜索,我在国庆节严肃承认:我落伍了…
百度博客搜索在很大程度上和Google博客搜索有很大的相似性,从baidu博客搜索帮助说明中也可以看出:搜索结果显示文章标题,时间,搜索结果摘要,博客首页的域名的URL,并且百度博客搜索结果排序方式默认是按时间倒序排列的,最新的博客文章排在最前。也可以通过搜索结果中的“按相关性排序”的按钮进行切换,这样得到的搜索结果则是与您搜索主题最相关的博客文章排在最前。
同时从百度提交博客网址方法“输入博客地址或RSS地址”来看,百度博客搜索引擎也是通过抓取博客rss feed地址更新收录。因此,如果不能被百度博客搜索正常收录,可以参考Google blog search(博客搜索)不收录博客文章可能原因。简单的说,不收录的原因很可能是由于feedsky托管等原因没正确提供默认的domain/feed地址。
百度博客搜索提交地址:提交我的博客
Google blog search(博客搜索)不收录博客文章可能原因
如果要想让google blog search尽快收录博客内容,可以利用google blogsearch的ping服务加快网页收录速度。 通过 Google“博客搜索”Ping API,用户可以程序化的方式将博客内容的更新通知给 Google“博客搜索”引擎。
但是最近好长时间以来,发现google blog search没有更新、正常收录博客日志了。一开始以为是为wordpress写的robots.txt 格式错误,限制了Google Blog Search蜘蛛Blogsearch Bot爬行,现在想想原因可能由于feed地址托管在feedsky上的缘故,谷歌博客搜索引擎的蜘蛛不能正确抓取托管在feedsky上的feed,尤其你的feed地址型为feed.dreamfreeblog.com(个人猜测,呵呵)。所以手动在博客首页又另外添加了RSS 2.0的原始feed地址,事实上证明是正确的,最近已收录正常。
利用google blogsearch的ping服务加快网页收录速度
发现谷歌的博客搜索引擎已经好久没有更新博客内容了,怀疑还是网页头部header.php部分的RSS或FEED地址有问题,也就是Google Blog Search Help帮助页面说明的XML-RPC Client客户端没设置好。

