网站优化
│怎样优化网..
│网站关键字..
│如何优化网..
百度优化
│怎样做百度..
│百度关键词..
│如何优化百..
关于大鹰网
│大鹰网理念
│大鹰网团队
│大鹰网简介
SEO
│seo前途
│seo的外链
│关键词的选..
SEM
│网络销售外..
│网络营销外..
│企业博客如..
│网站获得高..
网站建设
│友情链接系..
│在线招聘系..
│留言反馈系..
│会员管理系..
网络营销
│搜索引擎营..
│病毒营销
│媒介购买策..
│社区口碑营..
免费咨询:400-820-4059
大鹰网首页关于大鹰网SEOSEM网站建设技术文章新闻中心 英文网站优化
大鹰网 >> Google优化 >> robots细节优化你知道多少

robots细节优化你知道多少

时间:2011-8-25 10:03:52,点击:0


robots是你网站中搜索引擎第一个爬取的文件,就像你公司的前台一样,一个好的网站,必须用robort文件来指引搜索引擎的爬取,他的网站地图是相似的 ,前者决定让不让抓取,后者引导你怎样抓取。那么robots具体的写法需要注意什么呢?
  第一、user-agent的数量

  一般网站的robots.txt文件中不要出现多个user-agent记录,一般都是一个为宜,但是如果一个都不出现,也是被允许的。

  第二、spider蜘蛛大小写

  搜索引擎蜘蛛在查看robots的时候会忽略大小写,但是为了保险,也有网站分别写了两个不同的百度蜘蛛,比如淘宝。

  第三、allow与disallow顺序

  顺序的问题会导致抓取的错误,如果把allow放置后边,有时候就会出现想要收录的内容不被收录,举例说明:

  想要搜索引擎唯一收录a文件夹下的b.html,那么则要这么写:

  Allow:/a/b.html

  Disallow:/a/

  如果顺序写反,第一个匹配成功之后,b.html就不会被收录。

  第四、记得反斜杠

  反斜杠代表的意思是根目录,所以Disallow:/代笔的意思就是禁止收录一切页面和文件夹的内容。这个反斜杠很重要,少了反斜杠就代表允许搜索引擎收录全部页面。

  第五、#表示注释

  在robots.txt中,#开头均被视为注释,这和unix中的惯例是一样的。不要一不小心把通配符写错了。

  第六、不要出现空格

  有些robots文件中前边会不注意加一个空格,这样的问题应该尽量避免,否则一些机器人就不理解意思。

     第七、区分什么要被爬取,什么不要被爬取。
Disallow的内容应该是对蜘蛛不友好的内容,如搜索页 注册页,这些页面对搜索引擎不友好,但却是用户体验的 必不可少的页面。这个才是robots存在的真实价值。

  最后,写robots文件我们不应该随波逐流,别人怎么写我们就怎么写。而是理解其中的含义,写出符合自己网站的robots文件。robots.txt虽然优化的主要方向,但是它确实必需重视的一个方向,如果写的有问题,对整个网站的收录都会造成影响。所以一定要反复斟酌。

网站优化中主关键字布局须知技巧   网站关键词排名在百度波动的原因   分析Seo链接研究  
专业网站优化SEO公司 行业领先品牌   联系我们  上海网站优化  成都网站优化 
400免费:400-820-4059 上海:021-64698358 苏州:0512-82190489 成都:028-68665665
友情链接: 深圳外贸网站建设 -乐清网站建设 -合肥网站建设 -重庆seo -关键词优化 - 百度优化 -西安网站建设 -广州网站优化 -厦门谷悦seo -天津网站建设 -湖南seo -网站推广 -百度优化 -SEO -网站优化 -百度优化
版权所有:大鹰网专业苏州网站优化-google优化公司 Copyright@2006-2010 ALL RIGHT RESEVED 沪ICP备06057178号
苏州网站优化:电话:0512-66180678   /  0512-66180679  /  0512-82190489 传真:0512 82190479 手 机:13404230721 地址:苏州市相城区相城大道168号新尚广场1217-1218室
上海网站优化:电话:021-34240909 手机:13651994188 在线QQ:1295612603 地址:上海市徐汇区宜山路520号中华门大厦503室
成都网站优化:电话:028-86093758 手机:13880327527 地址:成都高新区高棚大道11号高新技术园D座5楼