Posts Tagged ‘搜索引擎’

利用google blogsearch的ping服务加快网页收录速度

发现谷歌的博客搜索引擎已经好久没有更新博客内容了,怀疑还是网页头部header.php部分的RSS或FEED地址有问题,也就是Google Blog Search Help帮助页面说明的XML-RPC Client客户端没设置好。


博客被百度K的只剩两页了,郁闷寻找原因中

现在都不敢抱怨了,因为有人说如果说它坏话它也知道的,现在只能承认搜索引擎它比人聪明。博客现在又被K的只剩两页了,第二次经受浩劫,上次莫名奇妙被K后过了3天也就恢复了,这次就难说了,只能找自己原因了。也许,现在网页结构真的有问题,现在最怀疑的就是FEED代码有问题。昨天看日志LOG记录发现百度只来了几次,这可是一个不妙的信号。肯定百度每次访问发现存在大量链接错误对网站留下了不好的印象。唯一的闭门羹可能是单篇日志的feed地址,也就是/index.php/*.html/feed,这是一个死链接,打开说源代码错误,由于以前想FEED页面反正也没什么大用,还会导致“补充材料结果”,就一直懒得改,明天要好好把这个问题解决,实在不行只能robot.txt限制搜索引擎对feed页面的抓取了。

PS:貌似上次通过robot.txt限制larbin是有效的,毕竟它还是遵守robot协议的。


wordpress中利用robots.txt限制larbin爬虫访问

大致知道可以通过修改.htaccess文件限制某一特定IP或某IP段的访问,但由于俺对那种语言写法天生恐惧,也摸不着什么头脑,而且.htaccess貌似在Apache服务环境下才有效,作罢。 阅读全文…


彻底禁止所有蜘蛛访问原来的wordpress免费空间,我狠心了

今天决定狠心一下,全面禁止所有的爬虫,不管你是那家bot,尝够了被搜索引擎的惩罚,今天也来换位让你尝试下,哈哈哈,小小安慰下我受伤的心灵。


问题很严重,百度惩罚被k,建站一个月的”纪念”

昨天已经发现了这个问题,site不到任何东西,唯一还活的是dreamfreeblog.com形式的首页,本来以为是百度的暂时调整,今天看还是老样子。貌似真的被K了,恐怖中。


人肉搜索是什么意思,什么是人肉搜索引擎,人肉搜索是什么东西?

什么是人肉搜索引擎,人肉搜索引擎是什么意思啊?人肉搜索引擎初看恐怖的说,之所以恐怖,是因为一开始看到人肉搜索引擎中“人肉”二字,总不自觉想到人肉馒头…汗一下…:em06:其实,“人肉搜索引擎”与人肉并没有什么关系,但有一点,人肉搜索引擎的确是与人有关,或者说人的互动行为对人肉搜索引擎至关重要。

貌似谷歌还推出了人肉搜索引擎服务,但不是网页搜索引擎那种,好像只是提供了一个到天涯论坛提问的接口,利用论坛的力量实现“人肉搜索引擎”,而人肉搜索引擎的核心也正是论坛等网络传媒的力量。

阅读全文…


15天的等待,百度收录了睡到自然醒博客

经过15天的等待,百度终于收录了睡到自然醒博客.


gigablast搜索引擎简介

今天看ftp日志记录,发现gigablastbot爬虫,原来gigablast.com也是一个十分重要的搜索引擎。