404是HTTP一种标准的回应信息,通俗的说,当用户浏览网页时,服务器无法正常提供信息,例如用户输入了错误的链接;或是服务器无法回应,且不知道原因而返回的页面,相当于服务器在提醒用户“你打开的链接是空号,请查证后再拨”那么传统的404页面是如何产生的呢?传说在第三次科技革命之前,互联网其实是一个在404房间里面设置的大型数据库,那时所有的请求都是人工手动完成的,当请求者所需要的文件没有在数据库中找到,或者因为请求者写错文件编码而没有找到,用户就会得到一个返回信息:room 404:file not found,后来随着互联网不断的发展,人们也就习惯了用404作为服务器未找到文件的错误代码了。那么设置404页面的目的是什么呢?一方面是增加用户体验,告诉浏览者所请求的页面不存在或者错误,同时引导用户使用网站其他页面,而不是关闭窗口离开;另一方面就是告诉百度爬行蜘蛛这个URL是错误的,以避免错误和死链太多,给搜索引擎带来一种不信任感。没想到小小网页背后还有这么多小姿势吧。当然今天只是为大家科普了小白入门404的小知识,其实对于网站运营、SEO网站优化专员和程序员来说,404也有它独特的存在意义404页面是客户端在浏览网页时,服务器无法正常提供信息,或是服务器无法回应,且不知道原因所返回的页面。 不做的话其实也没什么多大影响,就是客户在搜索内容进入你网站的时候显示的事空白页面,如果给返回一个而友好的404页面,对用户体验会更好。
个人理解:404是防止百度蜘蛛抓取不到时防护措施网民搜索到的错误乱码删除等页面在搜索引擎眼里就是垃圾,搜索到会降权,站长们做404搜索引擎就会避开。网民也可以肯据里面的返回首页等重新进入该网站官方给出:.避免出现死链网站设置404页面后,如果网站出现死链接,搜索引擎蜘蛛爬行这类网址得到“404”状态回应时,即知道该URL已经失效,便不再索引该网页,并向数据中心反馈将该URL表示的网页从索引数据库中删除。避免因为死链接影响网站收录。2.提升用户体验404页面通常为用户访问了网站上不存在或已删除的页面,服务器返回404错误页面,告诉浏览者其所请求的页面不存在或链接错误,同时引导用户使用网站其他页面而不是关闭窗口离开,消除用户的挫败感。3.避免信任度下降搜索引擎通过HTTP状态码来识别网页的状态。当搜索引擎获得了一个错误链接时,网站应该返回404状态码,告诉搜索引擎放弃对该链接的索引。而如果返回200或302状态码,搜索引擎就会为该链接建立索引,这导致大量不同的链接指向了相同的网页内容。结果是,搜索引擎对该网站的信任度大幅降低。很多网站存在这个问题:404页面返回的是200或302状态码而不是404状态码。4.避免被惩罚有些网站由于应用了一些错误的服务器配置,导致返回的是200状态码或是302状态码,虽然这些状态码对访问网站的用户没有影响,但是却会误导搜索引擎,使搜索引擎认为该页面是有效页面,从而抓取下来。如果404页面过多,就造成了大量的重复页面,很有可能被搜索引擎认为是作弊而遭到惩罚在我们在访问某个网站的时候,或许都曾遇到过404错误这样的提示,而这个页面就是404页面。这个时候我们会发现,有的404页面在间隔几秒之后就会跳转到首页,有的404页面有链接到网站其它页面的入口,其实这些设置都是有一定道理的。那么网站做404页面到底是因为什么呢?我们先从什么是404页面来开始了解吧。一、什么情况下会出现404页面?1、由于用户的疏忽,请求了一个根本不存在的链接,也就是错误链接而导致的。2、原来可以正常访问的页面,后来因为网站改版路径发生了变化,或者是删除了原来可以访问的页面所导致的。二、什么是404页面?404页面是指用户访问了错误的链接或者是所请求的页面不存在,所返回的一个页面,在页面上最常见的提示就是404 not found。一般来说,每个网站都会有一个默认的404页面,如下图所示:但这种默认的404页面,比较简陋和呆板,用户无法从上面获取到更多有用的信息,这种情况下用户很有可能会关闭窗口离开你的网站。因此,我们一般都会自己设置一个404页面,在这个页面上有友好的提示,有首页和栏目页的入口,如此一来用户就有可能再次的进入到你的网站,从而减少了用户的流失,降低了网站的跳出率。三、为什么要做404页面?从用户的角度来看,是告诉用户这个页面不存在,并引导用户去点击网站的其它页面而不是直接关闭窗口离开。从搜索引擎蜘蛛的角度来看,404页面的作用是告诉蜘蛛,我这个页面不存在了,当蜘蛛抓取到这个页面的url的时候,返回的状态码是404,蜘蛛就知道这个url已经失效了,便不会再来索引该网页。四、404页面的错误设置将404页面放上去,然后点击能够跳转到404页面是不是就完事了呢?很多时候我们都忽略了这个问题,当仔细的去查看http状态码的时候才发现有可能返回的并不是404状态码,而是200。对于网站访客而言,http的状态码显示的404或是200,是没有什么区别的,一样是能够起到引导用户,提升用户体验的作用。但是对于搜索引擎而言,却是一个正常的页面,这往往是因为错误的服务器端配置而导致了返回200状态码。搜索引擎判断页面的url是否失效,是以是否返回404状态码作为依据的。若搜索引擎得到这个404页面的状态码却是200,那么就会认为此页面的url是有效的,就会去索引并将其收录。因为所有404页面都是一样的,搜索引擎就会认为大量不同的url对应了相同的内容页面,如此一来搜索引擎就会大大降低网站的评分,甚至出现降权的情况。总结:网站不要使用默认的404页面,应当自己设置一个能够引导用户、利于用户体验的404页面,设置好之后不要忘记去查询一下http状态码是否为404。