关于robots.txt设置方法

2024-07-23 05:13:00 221人阅读

通过网站访问日志我们可以看见很多蜘蛛爬行记录。搜索引擎都遵守互联网robots协议，是放置在网站根目录下robots.txt文本文件，在文件中可以设定搜索引擎蜘蛛爬行规则，以及设置搜索引擎蜘蛛Spider抓取内容规则。

通过robots.txt来进行限制，首先在网站跟目录下面建立一个robots.txt文件。下面先对robots.txt一些实例说明，然后根据网站情况进行规则设置。下面列出一些设置规则供大家参考。

I . 禁止所有搜索引擎访问网站的任何部分　

User-agent: *

Disallow: /

II. 允许所有的robot访问 (或者建一个空文件 “/robots.txt” )

User-agent: *

Allow:

III. 禁止某个搜索引擎的访问（比如禁止BaiDuSpider）

User-agent: BaiDuSpider

Disallow: /

IV. 允许某个搜索引擎的访问　

User-agent: Baiduspider

allow:/

V.禁止目录搜索引擎访问，比如禁止admin ,install目录

    User-agent: *

Disallow: /admin/

Disallow: /install/

VI.仅允许Baiduspider以及Googlebot访问

User-agent: Baiduspider
Allow: /
User-agent: Googlebot
Allow: /
User-agent: *
Disallow: /

VII.禁止百度搜索引擎抓取你网站上的所有图片

User-agent: Baiduspider
Disallow: /*.jpg$
Disallow: /*.jpeg$
Disallow: /*.gif$
Disallow: /*.png$
Disallow: /*.bmp$

本文出自 “中国名创+技术博客” 博客，请务必保留此出处http://nj63nscom.blog.51cto.com/1050383/1554611

关于robots.txt设置方法

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们