当前位置:首页 > 建站优化 > 正文内容

roobts.txt该怎么写?

zhuangbi888.com2021-05-07 04:30建站优化350

robots.txt文件时seo优化中非常重要的一个文件,也是(shì)我们seo培训的重点之一。槼(guī)范合适的抒写robots.txt文件,可以(yǐ)有效的提升蜘蛛(zhū)抓取(qǔ)的效率,避免造成(chéng)搜索引(yǐn)擎蜘蛛(zhū)封禁(jìn)的情况。下(xià)面郑州seo杨超就来解释一下(xià)robots协议怎么写。

什么是(shì)robots.txtRobots协议:網(wǎng)站(zhàn)通过Robots协议告诉搜索引(yǐn)擎哪些页面可以(yǐ)抓取(qǔ),哪些页面不(bù)能抓取(qǔ)。 协议写在robots.txt文件里面。

要不(bù)要使用robots.txt1、如果你的網(wǎng)站(zhàn)有部(bù)分内容不(bù)希望搜索引(yǐn)擎抓取(qǔ),那么请设置robots.txt

2、如果你的網(wǎng)站(zhàn)全部(bù)内容都需要被搜索引(yǐn)擎抓取(qǔ),可以(yǐ)不(bù)设置。

3、一般来说,一些后台文件(如css、js)、用户隱(yǐn)私(sī)的文件不(bù)用被搜索引(yǐn)擎抓取(qǔ)。

4、如果有些文件频繁被蜘蛛(zhū)抓取(qǔ),但是(shì)这些文件又是(shì)不(bù)重要的,那么可以(yǐ)用robots.txt进行屏蔽。

robots.txt的用法User-agent: * 这里的*代表的所有的搜索引(yǐn)擎種(zhǒng)类,*是(shì)一个通配符

Disallow: /文件夹名称/ 这里定義(yì)是(shì)禁(jìn)止爬取(qǔ)这个文件夹下(xià)面的目錄(lù)

Disallow: /cgi-bin/*.htm 禁(jìn)止访問(wèn)/cgi-bin/目錄(lù)下(xià)的所有以(yǐ)”.htm”为后缀的URL(包含(hán)子目錄(lù))。

Disallow: /*?* 禁(jìn)止访問(wèn)網(wǎng)站(zhàn)中所有包含(hán)問(wèn)號(hào) (?) 的網(wǎng)址

Disallow: /.jpg$ 禁(jìn)止抓取(qǔ)網(wǎng)页所有的.jpg格式(shì)的图片

Disallow:/ab/adc.html 禁(jìn)止爬取(qǔ)ab文件夹下(xià)面的adc.html文件。

Allow: /cgi-bin/  这里定義(yì)是(shì)允(yǔn)许爬寻cgi-bin目錄(lù)下(xià)面的目錄(lù)

Allow: /tmp 这里定義(yì)是(shì)允(yǔn)许爬寻tmp的整个目錄(lù)

Allow: .htm$ 僅(jǐn)允(yǔn)许访問(wèn)以(yǐ)”.htm”为后缀的URL。

Allow: .gif$ 允(yǔn)许抓取(qǔ)網(wǎng)页和gif格式(shì)图片

Sitemap: 網(wǎng)站(zhàn)地(dì)图的URL 告诉爬虫这个页面是(shì)網(wǎng)站(zhàn)地(dì)图

robots.txt示例# robots.txt for 阅读青春readu.net

User-agent: *

Allow: /

Disallow: /wp-admin/

Disallow: /wp-includes/

Disallow: /wp-content/plugins/

Disallow: /?r=*

roobts.txt该怎么写?

robots标签的用法(mate标签是(shì)写在網(wǎng)页head里面的代码)<meta name=”robots” content=”nofollow”> 所有搜索引(yǐn)擎都不(bù)允(yǔn)许爬行

<meta name=”baiduspider” content=”nofollow”> 百度搜索引(yǐn)擎不(bù)允(yǔn)许爬行

roobts.txt该怎么写?

<meta name=”robots” content=”noarchive”> 所有搜索引(yǐn)擎都不(bù)允(yǔn)许收錄(lù)

<meta name=”baiduspider” content=”noarchive”> 百度搜索引(yǐn)擎都不(bù)允(yǔn)许收錄(lù)

robots.txt具体用途1、一个页面对应多个URL时,应屏蔽多余的URL。

2、如果網(wǎng)站(zhàn)有页面是(shì)没有实质性内容的,应该屏蔽掉。

3、如果網(wǎng)站(zhàn)改版删除了大量(liàng)的页面(404),应该屏蔽掉。

4、如果是(shì)UGC網(wǎng)站(zhàn),用户产生了大量(liàng)的不(bù)良(liáng)内容,应该屏蔽掉。

5、不(bù)希望被搜索引(yǐn)擎索引(yǐn)的内容(后台界面、用户隱(yǐn)私(sī)),应该屏蔽掉。

相关文章

个门户网站(南江县政府门户网站)

个门户网站(南江县政府门户网站)

坦白讲,“四大门户网站”的说法已经有些过时了。 我对这方面的研究不是特别多,就简单说以下几点吧。 新浪似乎更贴近官方一些,搜狐更灵活一些,网易态度更明确一些,腾讯依托客户规模优势,近年发展势头应该不错...

注册域名注册商设置禁止转移什么意思?

注册域名注册商设置禁止转移什么意思?

域名的禁止转移状态是说: 要转注册商的话,需要解除这个禁止转移保护。 是域名注册商为了保护域名的安全相对设置的。 如果没有域名转移保护的话,别人知道这个操作账号的密码就能把这个域名转走 如果要转移的话...

中山seo网站优化公司(南召seo快速排名价格)

中山seo网站优化公司(南召seo快速排名价格)

如果您选择做SEO外包的话,市面上多数乙方SEO外包公司都是吹的多好多好,而且承诺没有效果可以退款等等,等做不出效果来,你想把钱退回来,简直是天方夜潭!凡接触过SEO的人都知道,SEO是个周期长、见...

上海如何建立个人网站的步骤(上海个人做网站)

上海如何建立个人网站的步骤(上海个人做网站)

电脑打开网页时出现 404 Not Found的具体步骤如下:我们需要准备的材料分别是:电脑。 1、首先我们点击打开开始菜单栏中的“控制面板”。 2、然后我们在弹出来的窗口中点击打开“Interne...

给网站添加百度地图(怎么把网站提交给百度)

给网站添加百度地图(怎么把网站提交给百度)

方法/步骤: 1、登录百度的网站,打开百度地图。 2、点击右上角登录百度帐号,登录之后点击上面的“商户免费标注” 3、进去之后是一个百度的本地商户中心,点击左边的“商户管理”下面的“我要标注认领”。...

注册网址在哪里注册(注册手机域名注册局)

注册网址在哪里注册(注册手机域名注册局)

感谢邀请。 我自己手下也有几个域名。如果想要买域名的话,建议选择比较大的IDC服务商,早些年中国最大的域名交易平是万网。而后来万网被阿里云收购到旗下。 所以现在域名最大的联系服务商是阿里云。 其次可以...

免费网站设计软件(有哪些网站设计制作)

免费网站设计软件(有哪些网站设计制作)

自助网站制作在近几年已经非常流行,个人可以自己制作网站来建立博客,吸引粉丝;企业可以建立网站来展示形象,增加订单。挑选自助建站平台的时候,可以参考以下几个维度: 1.建站方式 有的建站系统是开源的,可...

自媒体人是否有必要建立自己的内容网站平台?

自媒体人是否有必要建立自己的内容网站平台?

作为一(yī)个广告行(xíng)業(yè)3年的从業(yè)者,我来回答下这个问题。 建立平(píng)台这个事,因发展阶段而论。 如果你(nǐ)是(shì)自媒(méi)体创作初期,那就先好好琢磨...