robots协议是什么意思?
Robots其实指的是robots协议(又称爬虫协议、机器人协议),全称是“爬虫排除标准”。网站通过robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不可以抓取。
而承载这些协议的文件是robots.txt文件,那么robots.txt文件的作用是什么呢?如何编写robots协议以及注意事项将在今天的这篇文章中向您详细介绍。
一、robots.txt文件的含义,robots.txt的作用是什么?
如前所述,这个文本文件带有robots协议,它告诉所有搜索引擎这个网站的哪些页面可以被抓取,哪些页面禁止被抓取。这有两层意思:
1、保护隐私。
有些目录或页面不希望或不能被外界看到。搜索引擎可能不知道这些情况,但还是会照常抓取和显示这些页面。可以通过robots设置限制,搜索引擎蜘蛛就会放弃抓取,外界也不会通过搜索引擎知道这些机密信息。
2、调整抓取网页面的数量。
众所周知,各个网站蜘蛛抓取的配额是有限的。如果我们禁止一些不重要的页面被抓取,那么把配额留给那些重要的页面,就会有更多的机会被抓取。
二、robots.txt文件的编写
Robots协议还可以设置特定的搜索引擎进行许可或禁止。其实一般情况下,并不需要区分搜索引擎,而是统一设置抓取权限。
1、禁止所有搜索引擎访问网站。
User-agent: *
Disallow: /
2、允许所有搜索引擎访问网站
User-agent: *
Allow: /
3、所有的蜘蛛都被禁止访问网站的某个目录。
User-agent:*
Disallow: /test/
这是最基本的用法。robots协议有很多技巧。我建议你仔细阅读它的协议。
三、与robots.txt文件相关的注意事项
有站长说我的网站没有禁止抓取的页面,所以不需要设置robots文件。这在理论上行得通。不过我建议即使网站完全开放,也最好建立一个robots文件,比如我的网站的件:http://www.70zyw.cn/robots.txt,一般放在网站的根目录下。
推荐阅读
-
利用运营熊掌号将自己需要的关键词排名在百度首页!
熊掌号是个什么东西,对于自媒体而言,这是一个类似微信公众账号的平台,只是在百度APP下才能运行,对于网站站长来讲,这是一...
-
利用seo技术排名热点新闻词引流(日IP增加2万+)
一个很普通的热点,很容易被各大媒体平台炒到高流量,所以很多人希望能够通过新闻热点来蹭到一部分流量,但大多数的情况下,百度...
-
如何利用SEO赚钱(一个月入万元的简单网站)
有人说做SEO不赚钱,而实际上只要你选对了项目,就算你seo做的非常烂,那么一样是可以赚到钱的,小编试着做了一个这么简单...
-
百度搜索网页标题规范(这是百度给的建议)
对搜索用户来说,标题是一个网页最直观的认知渠道和展现方式,也是吸引用户点击搜索结果进入落地页的关键因素。 ...
-
网站排在百度第一名,只需要用这一个方法就够了!
很多企业成立时,都会想到要建立一个网站,同时也希望自己的网站能够让客户在百度上搜索到。但做过网站的朋友都知道,百度上无论...
-
十大暴利最赚钱行业,目前赚钱非常稳定的赚钱方法!
1、网络游戏有资料称,网络游戏产业的毛利率高达50%以上,最高甚至达75%,2019最新致富项目,挣八天超你...
-
快速实际的比较挣钱偏门行业,暴利5大偏门行业!
1.废品回收废品回收这个行业看起来似乎每天都在和一群破烂物品在打交道,在许多行业之中这一行看起来相当不起眼,...
-
网站内部优化细节详解(一个月到权重6的方案)
一个网站的排名好坏,并非单一的原因,因素非常之所,如果按照100分来计算,个人预估,站内优化占20分左右,所以站内优化有...
-
女人网上挣钱的方法,无需本金快速挣钱的10种靠谱方法!
1、调查赚钱网上有一些调查项目赚钱的,大家百度一下就可以了解到。我曾经做过调查的项目,可是却没有挣到过钱,也不太喜...
-
农村干什么能挣钱啊,用手机在家就能赚钱的十种方法!
如何在家赚钱?在家兼职赚钱有什么好的项目可以操作?如今赚钱的方式有很多种,并不一定要在外奔波才能赚钱,选择一个适合在家做...

