Posts Tagged ‘收录’

一级域名与二级域名:独立域名博客or免费子域名博客

这几天经常有人加我QQ问我俺的博客是怎么一回事,太神奇了。我也只能一遍一遍的反复解释,什么用的一种博客程序wordpress搭的啊,什么还要买一个属于自己的域名啊,云云。虽然问的我有那么一点无奈,但有的问题也是很好玩的,有的问题也是自己没建博之前所疑惑的。发现许多问题稍加整理就能写出很多很多的教程,哈,高手轻拍砖哦。:em27:

记得以前逛到一个博客,作者说他的博客从blogspot 国外空间搬家到自己架设的新购买的主域名的网站上后,搜索访问流量有了明显上升。以前我也纳闷,感觉次级域名可能确实受到某些搜索引擎的歧视,不管是收录速度还是搜索排名可能多少受到影响。那到底要不要费神费事去弄什么所谓的独立域名博客呢,还是先将就着用免费二级域名博客,挺好。或者,再高级点,自己买一个便宜的CN域名,绑到你的免费博客上,也许个人主页的网址会短很多(MS这样也不大可行,你可能还需要有一个认识的有自己空间玩网站或博客的朋友,叫他给你绑)。:em43:

大家可能也经常想自己的主域名和一些免费空间提供的次级域名那种域名更受搜索引擎青睐。比如假设,在blogspot上申请的免费二级域名博客和自己买的一级域名(不管是CN还是COM域名)博客同时发布内容相同的日志,然后博客不作任何处理,那么一段时间后(比如一个月),哪种域名更能较快被收录呢?

不出意外的话,两种域名格式的博客都不会被收录,更谈不上博客搜索访问量了。因为,你的博客没有任何外部链接!你也没有进行过相关搜索引擎提交!好吧,如果同时向搜索引擎提交过,一段时间后(也许要3个月)开始了收录,理论上结果应该是收录速度和数量差不多,博客搜索访问量也应该类似。对于搜索引擎来说,你的一级域名和二级域名博客只是一个链接,一视同仁,虽然搜索引擎能识别出是顶级域名还是子域名。

那么,为什么大家还是更愿意放弃“免费”托管博客,转向独立域名博客呢,而且还要买个美国主机,也许是基于以下几种情况
1)对于博客的完全自主控制,DIY下博客主题,享受修改CSS代码到表现到外观上的奇妙变化;
2)不会被免费二级域名博客服务提供商(Blog Service Provider, BSP )无缘无故删除博客内容,比如前段时间某(些)著名网站博客BSP删除博客数据;
3)打造个性化博客,表达自己,展示自己个性;
4)还是DIY,比我喜欢折腾博客的人肯定不少。

如果还没决定好搭建独立博客,还不知道该购买哪种美国虚拟主机服务,或者还没想到用哪种博客程序,比如诱人的wordpress还是PJBLOG等。可以先到google的Google Sites设计几个静态页面建立个类似个人主页体验下吧,那种感觉应该很爽。


百度和Google搜索流量持平:两者区别就是百度反应迟钝~

从4月底建这个博客到现在差不多也半年有余了,对于所谓的搜索引擎来说,所经历的风风雨雨竟然都和Baidu有关。

从网站建立刚好一个月开始出现百度K站的迹象,到三四天后,博客被百度K的只剩两页,那时候已经算是拔毛的干净利落了。后来很长一段时间没所谓的百度流量,也感觉无所谓了。之后也没太关注百度,所有的搜索优化都是针对Google的。虽然现在的优化从主题外观上来说还是有很多缺陷,主题在Firefox下严重错位比列失调;footer部位文章的动态链接老是不能伪静态显示,干脆吓得去掉了footer;在win主机下跑php更是很不流畅,卡。

反正又过了差不多三四个月,百度开始大面积收录博客文章。慢慢也基本收录全面了,但是在搜索结果里基本上没有权重。

前两三天,惊奇的发现百度搜索流量明显提高,搜索量达到谷歌搜索量的一半。Google访问来源基本上占总PV的50%,如下图(统计时间一周 PV):baidu google 搜索流量对比

而上周,我消失很长时间刚好开始慢慢更新博客的那段时间,百度的搜索来源流量基本微乎其微,只占Google总PV流量的15%,而仅占总流量的10%不到。如下图。上周之前情况更糟。

百度 google 搜索流量对比 2

从以上数据得出结论:1)固定频率的更新是很有必要的,不能说和更新频率成正比,但和更新频率绝对有正相关;2)搜索引擎搜索流量和搜索引擎的抓取、更新频率正相关,这点相信大家肯定有体会,博客访问量越大,用户的搜索行为正反馈搜索引擎,促进搜索引擎的PV访问抓取量,这几天百度搜索量的上升明显促进了百度蜘蛛的抓取、更新索引;3)Baidu vs Google:Goolge很强大,百度反应很迟钝。以前换日志静态链接地址格式时深有体会,Goolge能迅速反应过来,并作出调整,慢慢删除旧的链接。而百度,从惩罚到恢复要花三四个月,从零权重但慢慢给予权重又要花上一两个月,还算快的。


Google blog search(博客搜索)不收录博客文章可能原因

如果要想让google blog search尽快收录博客内容,可以利用google blogsearch的ping服务加快网页收录速度。 通过 Google“博客搜索”Ping API,用户可以程序化的方式将博客内容的更新通知给 Google“博客搜索”引擎。

但是最近好长时间以来,发现google blog search没有更新、正常收录博客日志了。一开始以为是为wordpress写的robots.txt 格式错误,限制了Google Blog Search蜘蛛Blogsearch Bot爬行,现在想想原因可能由于feed地址托管在feedsky上的缘故,谷歌博客搜索引擎的蜘蛛不能正确抓取托管在feedsky上的feed,尤其你的feed地址型为feed.dreamfreeblog.com(个人猜测,呵呵)。所以手动在博客首页又另外添加了RSS 2.0的原始feed地址,事实上证明是正确的,最近已收录正常。

阅读全文…


博客被百度K的只剩两页了,郁闷寻找原因中

现在都不敢抱怨了,因为有人说如果说它坏话它也知道的,现在只能承认搜索引擎它比人聪明。博客现在又被K的只剩两页了,第二次经受浩劫,上次莫名奇妙被K后过了3天也就恢复了,这次就难说了,只能找自己原因了。也许,现在网页结构真的有问题,现在最怀疑的就是FEED代码有问题。昨天看日志LOG记录发现百度只来了几次,这可是一个不妙的信号。肯定百度每次访问发现存在大量链接错误对网站留下了不好的印象。唯一的闭门羹可能是单篇日志的feed地址,也就是/index.php/*.html/feed,这是一个死链接,打开说源代码错误,由于以前想FEED页面反正也没什么大用,还会导致“补充材料结果”,就一直懒得改,明天要好好把这个问题解决,实在不行只能robot.txt限制搜索引擎对feed页面的抓取了。

PS:貌似上次通过robot.txt限制larbin是有效的,毕竟它还是遵守robot协议的。


新网站google收录不稳定幽灵现象(收录时多时少)

新网站向google等搜索引擎提交网址后的一段时间内,往往出现收录排名不稳定的现象.


15天的等待,百度收录了睡到自然醒博客

经过15天的等待,百度终于收录了睡到自然醒博客.


各大主要搜索引擎免费网站地址提交入口

新网站建好后,一般都要先向相关搜索引擎提交网站地址,以便尽快被收录,收录时间长短不一,一个网站只需提交一页(首页),搜索引擎会自动根据网站链接结构找到其它网页。这是睡到自然醒博客整理列出的几个比较常见的免费搜索引擎提交入口,也算做个备忘,供大家参考:


google再次创造神话:3小时收录睡到自然醒博客!

昨天下午刚做好网站,准确的说应该是下午5点钟左右,做好之后也做好了等待两三天被搜索引擎收录的准备,虽然是一级域名,但毕竟先前的二级域名已经磨练了我接受等待的意志。但刚才查询收录情况时,google再次不负众望,又以一个神速收录了本博客,现在的截屏时间显示的是14小时前被收录,也就是昨天晚上8点左右,距网站建设完成不到3个小时!但奇怪的是,昨天8点以后也查询过,为什么没有记录,难道,google也有认为因素,要经过筛选审核才释放蜘蛛的爬行记录?不管怎样,再自恋下,贴个存照,嘿嘿。还有,按照先前的经验,距第一次收录主页之后,当蜘蛛再次爬行本站时,它会一股脑儿把所有的页面都收录,包括标签tag页,等等。嘿嘿。