robot.txt文件
大部分的网站收录问题都是因为被robot.txt文件拦截导致的。
robots.txt是一个纯文本文件,在这个文件中网站管理者可以声明该网站中不想被robots访问的部分,或者指定搜索引擎只收录指定的内容。
当一个搜索机器人(有的叫搜索蜘蛛)访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,那么搜索机器人就沿着链接抓取。
格式:
1.User-agent:
用于指定搜索引擎的名称,如谷歌为User-agent: Googlebot,*代表所有搜索引擎
2.Disallow:
表示禁止蜘蛛访问的文件
User-agent: *
Disallow:
表明:允许所有搜索引擎访问网站下的所有内容。
User-agent: *
Disallow: /
表明:禁止所有搜索引擎对网站下所有网页的访问。
User-agent: *
Disallow: /cgi-bin/
表明:禁止所有搜索引擎进入网站的cgi-bin目录及其下所有子目录。需要注意的是对每一个目录必须分开声明。
User-agent: Roverdog
Disallow: /
表明:禁止Roverdog访问网站上的任何文件。
User-agent: Googlebot
Disallow: cheese.htm
表明:禁止Google的Googlebot访问其网站下的cheese.htm文件。
3.注释
以”#”开头的行,均被视为注解内容,注释需要单独成一行
Disallow: bob #comment是错误的
4.Allow行
Allow行还未普遍使用,对于网站地图,直接写为Sitemap:
编辑模式:
在UNIX模式下编辑你的robots.txt文件并以ASCII码格式上传。显然并非所有的FTP客户端软件都能够天衣无缝地将文件格式转换为UNIX命令行终端,所以在编辑robots.txt文件时,一定要确保你的文本编辑器是在UNIX模式下。
或者使用工具如爱站工具生成robots,直接粘贴复制到网站后台。
检测robots是否生效:
在百度站长后台检测robots
二 robots和nofollow的区别是什么
robots只用于站内链接。禁止蜘蛛抓取进行收录;
nofollow的链接蜘蛛依然可以收录,但是不会传递权重,一般用于站外链接或者是公司电话,地址的页面有助于网址权重的集中。
三 网站误封robots后的处理
1.解封robots,然后到百度站长后台检测并更新Robots。
2.在百度站长后台抓取检测,此时显示抓取失败,通常更改完robots不会立即生效,需要等待几天,可以多点击抓取几次,触发蜘蛛抓取站点。
3.在百度站长后台抓取频次,申请抓取频次上调。
4.百度反馈中心,反馈是因为误操作导致了这种情况的发生。
5.百度站长后台链接提交处,设置数据主动推送(实时)。
6.更新sitemap网站地图,重新提交百度,每天手工提交一次。
四.新站robots的设置
对于已经上线但是还没有设置好的新站在robots中用
User-agent:*
Disallow:/
来禁止蜘蛛进行访问
meta标签
meta robots 标签是页面head部分meta标签的一种,用于指令搜索引擎禁止索引(收录)本页内容。
meta robots 标签的写法:
<meta name=”robots”content=”noindex,nofollow”>
标签的意义:禁止所有搜索引擎索引本页面,禁止跟踪本页面上的链接。
Noindex:搜索引擎不索引此网页(可以抓取,但不出现在搜索结果中)。
Nofollow: 搜索引擎不继续通过此网页的链接索引搜索其它的网页。
<meta name>=”robots”content=”noindex” >
标签的意义:禁止索引本页面,但允许蜘蛛跟踪页面上的链接,也可以传递权重。
使用了noindex meta robots标签的页面会被抓取,但不会被索引,也就是说页面URL不会出现在搜索结果中,这一点与robots文件不同。
meta robots 标签的作用:
1、不想让网站被收录使用meta robots 标签,禁止搜索引擎索引本页,同时禁止跟踪页面上的链接。
2、禁止索引本页面,但是允许蜘蛛跟踪页面链接,也可以传递权重。
meta robots标签很多搜索引擎是不支持的,只有少数搜索引擎能够识别并按给定的值抓取。因此还是推荐用robots.txt文件来限制抓取.
有违规记录的域名
有些站长会选择购买有一定注册年份的域名,但是需要注意这些域名是否曾经被搜索引擎惩罚过,如果这样,网站也是非常难收录的。
建议对于这种情况,站长可以查看一下网站日志,如果蜘蛛未爬取,只需要去站长后天提交即可。如果蜘蛛有爬取记录,但是没有收录,就可能是域名的问题。当然也不排除网站自身存在一定的问题。例如镜像网站等。
如何让网站收录
熊账号后台提交:熊账号对于原创文章的收录要求较高,但是通常首页的收录是非常快的,一般第二天就可以看到效果。而且熊掌号会显示不收录的原因,方便站长进行整改。
这个问题在当年门户网站兴盛时代,曾是一个非常热门的专业领域叫搜索引擎优化SEO。
1.关于收录和索引基本先简单说明一下:
收录:页面被百度蜘蛛发现、分析过,认为页面存在价值,所以进行收录处理。
索引:百度蜘蛛抓取页面后,经初步分析后,认为页面内容对用户有意义,所以做建库处理。
再打个比方:把百度建的数据库比作一个图书馆。
那么这座图书馆并不会收录所有书(页面),要根据书本身的质量和价值,来决定是否收录;并不是所有收录的页面,图书馆都会外借(索引)。
所以,网站要获得好的排名,第一步就是提升收录和索引。只有在这个图书馆里的书足够多,外借的可能性才会提高,才有可能得到百度的特别推荐(排名首页)。
2.如何提升百度网站收录和索引的水平:
首先,网站更新要频繁,网站内容更新的频次,很大程度会影响百度蜘蛛抓取网站页面的周期。更新内容频繁的网站,蜘蛛抓取的周期更短,页面收录提升。活网站肯定比僵尸网站好啦哈哈。
其次,内容原创度高(跟我们今日头条有限像哈),百度喜欢原创的东西,原创都越高,页面越容易被收录。
再次,要向百度站长平台提交链接,链接提交百度站长后台是提升网站收录和索引最简单粗暴的方式。所以,专业点的网站完成优化后,都会有SEO的人去主动提交站点地图给百度,让百度蜘蛛自己来抓。
最后,增加优质的加发外链接,外链能直接吸引百度蜘蛛过来,使蜘蛛访问网站的频率提高。优质的外链,不仅可以促进页面的收录、提升页面权重,而且对关键词的排名也有一定的影响。
虽然现在已经步入移动互联网时代,但网站优化仍旧是很重要的工作内容,祝大家2019年会做的更好更美!!
我也深受苦恼,根据我的经验,情况可能是这样的,希望对你有帮助: 1、任何微信账号,都有一个微信号,微信号是账号的唯一识别,不同微信号无法绑定; 2、微信可通过QQ号码注册,注册后生成一个微信号,...
随着时代的不断发展,用户对于互联网的要求也越来越高,现在一般的网站已经无法满足用户的需求了,用户更喜欢浏览一些突出个性化的网站,那么,如何建设一个风格迥异的网站呢?一起来了解一下吧! 如今,企业已经...
以下为标准网站/企业标准网站主页添加ICP备案号的操作流程: 1、进入网站管理后台,点击设计网页图标 2、点击网页设计面板左上方网站页面内的高级模板设计链接,进入模板设计 3、选择模板页面下方版权信息...
首先要看你后台支持自主上传,有没有这个功能!不行的话!试试下面的方法: 1、将要上传的图片或者是flash,上传到空间服务器。 2、修改主页代码,做调用。 3.首先,你要知道这个LOGO所在位置. 4...
这个问题太粗了,需要更多的信息才好做判断推荐。 首先要说明是什么行业什么产品的app,其次最好有类似已上线的app作为比较,这样才可以大致估算项目规模,从而根据不同的特征做出不同的选择。 其次,根据...
顶級(jí)、二級(jí)、三級(jí)域(yù)名(míng)的(de)区别 一個(gè)完整的(de)域(yù)名(míng)由二個(gè)或二個(gè)以上部(bù)分组成(chéng)...
国内高速流量,通常是指不限速的流量,可以在4G、3G、2G网络下使用。 国内低速流量,通常就是指限速后的流量,具体限速后的网速,要以各运营商具体规定为准。 各运营商推出一些不限速的流量套餐,当套餐内的...
南京是中国近代工业的摇篮,1865年金陵制造局的诞生标志着南京近代工业的开端。它有着一大批本地乃至全国都很知名的大企业,这也是吸引众多人才来南京就业及落地生根的重要原因之一。 下面,我就来列举一些在南...