robots.txt文件时seo优化中非常重要的一个文件,也是(shì)我们seo培训的重点之一。槼(guī)范合适的抒写robots.txt文件,可以(yǐ)有效的提升蜘蛛(zhū)抓取(qǔ)的效率,避免造成(chéng)搜索引(yǐn)擎蜘蛛(zhū)封禁(jìn)的情况。下(xià)面郑州seo杨超就来解释一下(xià)robots协议怎么写。
什么是(shì)robots.txtRobots协议:網(wǎng)站(zhàn)通过Robots协议告诉搜索引(yǐn)擎哪些页面可以(yǐ)抓取(qǔ),哪些页面不(bù)能抓取(qǔ)。 协议写在robots.txt文件里面。
要不(bù)要使用robots.txt1、如果你的網(wǎng)站(zhàn)有部(bù)分内容不(bù)希望搜索引(yǐn)擎抓取(qǔ),那么请设置robots.txt
2、如果你的網(wǎng)站(zhàn)全部(bù)内容都需要被搜索引(yǐn)擎抓取(qǔ),可以(yǐ)不(bù)设置。
3、一般来说,一些后台文件(如css、js)、用户隱(yǐn)私(sī)的文件不(bù)用被搜索引(yǐn)擎抓取(qǔ)。
4、如果有些文件频繁被蜘蛛(zhū)抓取(qǔ),但是(shì)这些文件又是(shì)不(bù)重要的,那么可以(yǐ)用robots.txt进行屏蔽。
robots.txt的用法User-agent: * 这里的*代表的所有的搜索引(yǐn)擎種(zhǒng)类,*是(shì)一个通配符
Disallow: /文件夹名称/ 这里定義(yì)是(shì)禁(jìn)止爬取(qǔ)这个文件夹下(xià)面的目錄(lù)
Disallow: /cgi-bin/*.htm 禁(jìn)止访問(wèn)/cgi-bin/目錄(lù)下(xià)的所有以(yǐ)”.htm”为后缀的URL(包含(hán)子目錄(lù))。
Disallow: /*?* 禁(jìn)止访問(wèn)網(wǎng)站(zhàn)中所有包含(hán)問(wèn)號(hào) (?) 的網(wǎng)址
Disallow: /.jpg$ 禁(jìn)止抓取(qǔ)網(wǎng)页所有的.jpg格式(shì)的图片
Disallow:/ab/adc.html 禁(jìn)止爬取(qǔ)ab文件夹下(xià)面的adc.html文件。
Allow: /cgi-bin/ 这里定義(yì)是(shì)允(yǔn)许爬寻cgi-bin目錄(lù)下(xià)面的目錄(lù)
Allow: /tmp 这里定義(yì)是(shì)允(yǔn)许爬寻tmp的整个目錄(lù)
Allow: .htm$ 僅(jǐn)允(yǔn)许访問(wèn)以(yǐ)”.htm”为后缀的URL。
Allow: .gif$ 允(yǔn)许抓取(qǔ)網(wǎng)页和gif格式(shì)图片
Sitemap: 網(wǎng)站(zhàn)地(dì)图的URL 告诉爬虫这个页面是(shì)網(wǎng)站(zhàn)地(dì)图
robots.txt示例# robots.txt for 阅读青春readu.net
User-agent: *
Allow: /
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-content/plugins/
Disallow: /?r=*
robots标签的用法(mate标签是(shì)写在網(wǎng)页head里面的代码)<meta name=”robots” content=”nofollow”> 所有搜索引(yǐn)擎都不(bù)允(yǔn)许爬行
<meta name=”baiduspider” content=”nofollow”> 百度搜索引(yǐn)擎不(bù)允(yǔn)许爬行
<meta name=”robots” content=”noarchive”> 所有搜索引(yǐn)擎都不(bù)允(yǔn)许收錄(lù)
<meta name=”baiduspider” content=”noarchive”> 百度搜索引(yǐn)擎都不(bù)允(yǔn)许收錄(lù)
robots.txt具体用途1、一个页面对应多个URL时,应屏蔽多余的URL。
2、如果網(wǎng)站(zhàn)有页面是(shì)没有实质性内容的,应该屏蔽掉。
3、如果網(wǎng)站(zhàn)改版删除了大量(liàng)的页面(404),应该屏蔽掉。
4、如果是(shì)UGC網(wǎng)站(zhàn),用户产生了大量(liàng)的不(bù)良(liáng)内容,应该屏蔽掉。
5、不(bù)希望被搜索引(yǐn)擎索引(yǐn)的内容(后台界面、用户隱(yǐn)私(sī)),应该屏蔽掉。
坦白讲,“四大门户网站”的说法已经有些过时了。 我对这方面的研究不是特别多,就简单说以下几点吧。 新浪似乎更贴近官方一些,搜狐更灵活一些,网易态度更明确一些,腾讯依托客户规模优势,近年发展势头应该不错...
域名的禁止转移状态是说: 要转注册商的话,需要解除这个禁止转移保护。 是域名注册商为了保护域名的安全相对设置的。 如果没有域名转移保护的话,别人知道这个操作账号的密码就能把这个域名转走 如果要转移的话...
如果您选择做SEO外包的话,市面上多数乙方SEO外包公司都是吹的多好多好,而且承诺没有效果可以退款等等,等做不出效果来,你想把钱退回来,简直是天方夜潭!凡接触过SEO的人都知道,SEO是个周期长、见...
电脑打开网页时出现 404 Not Found的具体步骤如下:我们需要准备的材料分别是:电脑。 1、首先我们点击打开开始菜单栏中的“控制面板”。 2、然后我们在弹出来的窗口中点击打开“Interne...
方法/步骤: 1、登录百度的网站,打开百度地图。 2、点击右上角登录百度帐号,登录之后点击上面的“商户免费标注” 3、进去之后是一个百度的本地商户中心,点击左边的“商户管理”下面的“我要标注认领”。...
感谢邀请。 我自己手下也有几个域名。如果想要买域名的话,建议选择比较大的IDC服务商,早些年中国最大的域名交易平是万网。而后来万网被阿里云收购到旗下。 所以现在域名最大的联系服务商是阿里云。 其次可以...
自助网站制作在近几年已经非常流行,个人可以自己制作网站来建立博客,吸引粉丝;企业可以建立网站来展示形象,增加订单。挑选自助建站平台的时候,可以参考以下几个维度: 1.建站方式 有的建站系统是开源的,可...
作为一(yī)个广告行(xíng)業(yè)3年的从業(yè)者,我来回答下这个问题。 建立平(píng)台这个事,因发展阶段而论。 如果你(nǐ)是(shì)自媒(méi)体创作初期,那就先好好琢磨...