百度蜘蛛的一些特性和我们怎么利用它来优化我
我们在做网站优化的时候最主要的就是能让搜索引擎的蜘蛛能天天爬到我们的网站上来,如果我们有办法能让搜索引擎的蜘蛛天天爬到我们的网页上来那么我们的网站关键字可以说想不上来都难啊。 要做好百度推广,更多地了解百度蜘蛛的行为活动已经它的行为特点是必不可少的,这样能够根据百度蜘蛛的活动特点进行相应的网站页面处理,当然我们谁都不可能非常了解。所以我们要掌握搜索引擎的习惯是很重要的。
百度也不可能白痴到愿意告诉你这些,还好有SEO前人替我们做了相应实验,以下为某位站长的亲身经历,希望对大家更加地了解百度蜘蛛行为有所帮助,部分内容如下:
第一,百度蜘蛛极为活跃,经常看看你的服务器日志,你就怀发现百度蜘蛛抓取的频率和数量都非常大。百度蜘蛛几乎每天都会访问我的论坛,并且至少抓取几十个网页。我的论坛只开通了不到一个月,网页数目还没有完善,但是百度蜘蛛的活动已经相当可观了。大量捕获是百度的强项,其他任何搜索引擎都没办法相比。
1、经常的引导蜘蛛爬行我们的网站
当你要让蜘蛛对你网站进行爬行的时候,最开始就是需要引导蜘蛛对你网站进行爬行了,所以这个时候我们要找一些高权重的网站,因为这些网站可以说百度的蜘蛛是频繁光顾的,然后发发帖子或者写写高质量的软文,在写的时候最好把自己的网址给留下来。这样就引导蜘蛛对你网站爬行,另外可以在一些论坛啊一些权重高的博客上也可以发发贴贴。写写文章,在写的时候一定要把链接加上去,时间长了,肯定会有不错的效果的。
但是百度中文网页数目并不是最大的,百度蜘蛛抓取的频率和网页更新情况有关。天天更新的网站一定会吸引百度蜘蛛更频繁的访问,我有一个非常明显的例子,www.zxgzs.com, 这个域名比较(老),注册已经快一年了,开始做了一个学习站,感觉更新比较麻烦,而且也没有很多时间去维护,但是这个学习站是关于电脑方面的,虽然内容不多,但是页面却不下两W(是别人的整站源码),---第一天,几个好朋友光顾了一下,9IP,没想到
2、蜘蛛爬行网站喜欢原创,新的内容。
其实百度的蜘蛛和人很像的,他也很喜欢新的事物,原创的内容。所以我们每天如果能按时按量的写一些原创的文章,百度他收录很快的。时间长了,网站的权重高了,百度他就会自动来你的网站了。有的时候如果我们实在写不出来原创的文章,写一些伪原创也是相当不错的。总的一句话,一定要做到网站的内容及时的更新。
3、良好的网站结构也很重要。
其实大家都知道搜索引擎是很喜欢静态页面的,因为静态页面是安全的,所以蜘蛛都很喜欢静态页面,当蜘蛛爬行一个网站的时候看信息的同时也在看网站的结构,如果说网站的结构有死循环页面,那么会导致蜘蛛进入以后就无法出来,一般在一些做黑帽的时候会添加这样的功能,因为当蜘蛛爬行的时候它在死循环,这样看来一些站长就会得到无限制的页面收录,然后会有明显的效果,但是本人不赞同该方法,因为该方法一但被搜索引擎发现,不仅你被收录的信息难保,就连你网站的域名可能也会被搜索引擎拉黑,所以为了自己网站安全起见,最好就是不要加入死循环的方法,以前的蜘蛛是无法叛变网站是否安全的,现在的蜘蛛有只能判断的功能,会判断出网站是否安全,所以说网站结构和蜘蛛对你网站好感的好坏起着绝对性的作用,就算你网站内部没有什么好的文章,但是罪不至死,如果说你网站内部结构有不该有的东西,这样的话你的网站可能会在搜索引擎中消失,所以大家要注意了。
第二天早上打开网站,居然发现从百度来了100多IP!!奇迹,百度蜘蛛就有这么神气,site:www.zxgzs.com,查一下,晕了,一晚上时间,被收录了2000多页??
应该说这个学习站继续做下去有点前途,但是我时间还真不够用,所以K掉了这个学习站,用这个域名做了一个笑话站,有留言,也有网友上传,轻松多了,不过这下被收录的页面全部是死链,要从头开始了吧,但是我又错了,第三天:这个笑话站又被全面抓取了,!!!,----我发现百度对天天更新的站最敏感!,彻底换内容更敏感----哈哈,看来这个机器人也是喜新厌旧的家伙啊!
最近还是因为时间不够,又用这个域名改了论坛,不知道还有没有奇迹出现--我相信只要内容够多(百度蜘蛛也贪),你站的内容如果不达到么个数目,它可能懒得理你,具体多少,好象是百度内部机密,哈哈
第二,我注意了一下蜘蛛似乎更注重页面内的因素。与Google更加重视内部,有点爬虫类的味道,越黑越深,它越是喜欢往里钻,--不相信你做100个页面,做得再漂亮,只要链接没有层次,哈哈,不好意思,你最多就孤零零的被收录可怜的一点点东西。我前两个站开通不到一个月,也很少有外部链接。但因为本身的结构是比较有层次,一些竞争不太激烈的关键词在百度的排名还不错。
第三:要想排名靠前,目标关键词应该完整匹配地出现在页面中。比如说,你想让你的网站在用户搜索”电脑学习”时出现在前面,那么在你的网页上,”电脑学习”这四个字应该完整连续的出现,而不能”电脑”出现在第一段,”学习”出现在第二段。
1、较重视第一次收录印象
网站给百度的第一印象比较重要,相对Google而言,百度搜索引擎的人为参与度较高,也就是说在某些层面上可能由人来决定是否收录网页而不是由机器来决定.所以,网站在登录百度搜索引擎之前最好把内容做得丰富点、原创内容多一点、网页关键词与内容的相关度高一点,这样才能给百度较好的初次印象.
2、对网页的更新较敏感
百度对网页的更新相对Google而言更加敏感,可能这与百度的本土性格有关.百度搜索引擎每周更新,网页视重要性有不同的更新率,频率在几天至一月之间.所以在百度的搜索结果中基本上都标明了收录时间.
3、较重视首页
百度对首页的重视程度要比Google高得多,这与上面提到的“较重视第一次收录印象”一脉相承.百度在显示搜索结果时也常常把网站首页显示出来,而不具体到某个内容页(当其认为不够重要时).相对而言,其用户体验打了折扣,而增加了其“百度快照”的用户量.
第四:百度排名算法是以网页为基础,比较少关注整个网站的主题。联系到上一点,这说明百度排名算法中比较注重内部结构缺少完整的语义分析。所以一些目前比较认同的关于site:之间那几个所谓关系到搜索质量的东西,并不是百度蜘蛛所最敏感的,
第五:百度并不被所谓的优化迷惑!!GG对优化好象远远没有百度敏感,百度尤其反感所谓的优化,不知道是用什么方法识别----我的看法是目前最”先进“ 的优化方法,好象对百度没什么大的作用,大家都这么干了,机器人是有点死脑筋,但是百度那些IT也不是吃白饭的哈,要知道他是全球最先进的中文搜索老大,,GG在中文搜索这快--哈哈,不用说了吧:)没得比!
第六:充分利用百度的一个最大的优势--大家可能觉得它的优势对我们来说就是难事了嘛:呵呵,的确是可以利用的,百度收录速度可以用海量来形容,正因为速度快,就给我们留下了可以利用的空间!---回头来还是要说到优化了:)-- 虽然百度对优化并不感冒,但是只要你优化方式友好,还是能起到不错的效果,--我比较认同适量优化!--至于到底优化到什么程度才是最佳?我也不能说出 1,2,3。呵呵--但是别忘了,因为百度收录太快,我们就可以经常使用一些不同的方法测试效果,,而且百度蜘蛛也乐意你天天给它玩新花样,呵呵,看来这个神秘的东西也是有点孩子气的哈,需要人来哄哄,也爱凑凑热闹--好象这样做还有一个好处,如果你的站从来都懒得去玩花样--哈哈,那很可能哪天蜘蛛不再光顾你的网站了,为什么? K掉了嘛!--百度蜘蛛有一个青蛙一样的眼睛吧,呵呵,动的东西再远也能看见,而且特别注意,静的东西在它身边也未必能看见
其实百度的蜘蛛还有其他很多的生活习惯,我们在下一次和大家说明一下,总结一下。
1、蜘蛛是很懒得去猜你的关键词的,所以关键词要明确。
2、蜘蛛喜欢爬行静态网站,动态网站也会爬行,但是效果没有静态网站好。
3、蜘蛛最喜欢的是原创文章,只有原创文章才会信息蜘蛛对你网站爬行。
4、蜘蛛对网站爬行是需要引导的,只有做好站外有话才会友好的引导蜘蛛对你网站爬行。
以上几点也是今天我和大家说的重点。希望大家在做网站优化的时候一定要注意这几点。相信你的关键字肯定会有一个不错的效果。
百度是全球最大的中文搜索引擎,对中文网页的搜索技术在某种程度上领先于Google,百度在某些方面与Google有相同或相似之处外它还有以下特点:
4、较重视绝对地址的链接
百度在收录网页时比较重视绝对地址的收录,百度提供的网页快照功能也没有解析相对地址的绝对路径,不知这是百度技术的疏忽还是其偏好的一大体现.
5、较重视收录日期
百度对网页的收录日期非常看重,也是其搜索结果排名的参考点,被收录得越早排名会较高,有时甚至不考虑相关性地把它认为比较重要的内容放在首位,而点击进入之后才发现是早已过时的信息或者垃圾信息.这是百度需要改进的技术.
百度使用的技术:
百度使用以下技术:“一种互联网上镜像和准镜像网站的识别方法”,这个方法解决了搜索引擎对雷同信息的重复获取,节省网络资源和本地资源,提高系统服务的质量和效率;“一种基于词汇的计算机索引和检索方法”,该方法对一段连续的文字信息,经过词汇分析处理后,通过添加隐形词汇的手段,实现对基于词汇索引和检索系统的检索质量提升,使用户获得更加准确的检索结果;“一种使用快照的方式实现对网上信息进行记录和分析的方法”,该方法是通过对互联网上一个特定信息,多次进行快照的方式,将信息当时的状态进行保留.并通过对一系列快照信息的分析,得到有效数据,方便地得到网上信息的变动情况.
(责任编辑:卓想空间http://www.zxgzs.com)