厦门智多星专注厦门seo,seo优化,seo外包,提供专业级seo顾问及网站建设服务!
打开客服菜单
智多星网站建设seo官网
厦门网站优化 > seo优化|网站优化 > 【厦门SEO】robots.txt的正确写法
【厦门SEO】robots.txt的正确写法
编辑 :

网站建设

时间 : 2019-01-03 16:40 浏览量 : 42


     有点网站建设基础的同学都知道每个“健康的网站”根目录下都有个robots文件,那么什么是robots.txt? 这是一个文本文件,是搜索引擎爬行网站要查看的第一个文件,你可以告诉搜索引擎哪些文件可以被查看,哪些是不允许查看的。当爬虫(也叫搜索引擎蜘蛛)访问一个站点时,它首先会检查根目录是否存在robots.txt,如果有就确定抓取范围,没有就按链接顺序抓取。

robots写法

     那么robots.txt到底有什么作用?为什么需要用robots.txt这个文件来告诉搜索爬虫不要爬行我们的部分网页,比如:后台管理文件、程序脚本、附件、数据库文件、编码文件、样式表文件、模板文件、导航图片和背景图片等等。说到底了,这些页面或文件被搜索引擎收录了,用户也看不了,多数需要口令才能进入或是数据文件。既然这样,又让爬虫爬行的话,就浪费了服务器资源,增加了服务器的压力,因此我们可以用robots.txt告诉机器人集中注意力去收录我们的文章页面,增强用户体验。 


    以下是robots.txt的一些写法和作用:

    1)用robots屏蔽网站重复页 

    很多网站一个内容提供多种浏览版本,虽然很大程度方便了用户却对蜘蛛造成了困难,因为它分不清主次,一旦让它认为你在恶意重复堆积内容,那么你就惨了,所以为了引起不必要的“危险”,我们可以使用下面robots语法来屏蔽重复页面:

    User-agent: * 

    Disallow: /xxx/ 《禁止蜘蛛抓取某个板块文本网页》


    2)用robots保护网站安全 

    很多人看到这就会纳闷了,robots文件怎么还可以保护网站安全?厦门智多星告诉你其实关系还很大,不少低级黑客就是通过搜索默认后台登陆,以达到入侵网站的目标 

    User-agent: * 

    Disallow: /admin/ 《禁止蜘蛛抓取admin目录下所有文件》 


    3)防止盗链 

    一般盗链也就几个人,可是一旦被搜索引擎“盗链”那家伙你100M宽带也吃不消,如果你做的不是图片网站,又不想被搜索引擎“盗链”你的网站图片 

    User-agent: * 

    Disallow: .jpg$ (同理禁止抓取png格式的也可以)


    4)提交网站地图 

    现在做SEO优化的都知道做网站地图了,可是却没几个会提交的,绝大多数人是干脆在网页上加个链接,其实robots是支持这个功能的)——术业有专攻

    Sitemap: http:-www-***-com/sitemaps/sitemaps.xml 


    5)禁止某二级域名的抓取 一些网站会对VIP会员提供一些特殊服务,却又不想这个服务被搜索引擎检索到,那么我们robots文件就可以加入这一行代码

    User-agent: * Disallow: / 


    当然robots写法还有很多种,我们要做的就是根据具体情况来写,以上厦门智多星分享的五招robots足以让你对搜索引擎蜘蛛掌控能力提升不少,就像百度BAIDU说的:我们和搜索引擎应该是朋友,增加一些沟通,才能消除一些隔膜。是的,任何人如果缺少沟通,那么就会产生障碍,更何况是我们跟机器人搜索引擎呢?(【厦门SEO】robots.txt的正确写法)

  • 超低建站费用

  • 具备营销能力

  • 强大SEO功能

  • 贴心售后技术支持

cache
Processed in 0.003592 Second.