告訴你404錯誤如何影響您的網站的

作者:泉視界傳媒    時間:2011-08-23 10:33     點擊:

您坐在電腦前,關注著自己的工作,使用網站站長工具欣賞著自己的網站是多么的了不起。可是,等等!抓取錯誤頁面滿是404 找不到錯誤!出現這樣的情況時,是否災難就此來臨? 請不要擔心,年輕的朋友們。讓我們一起來了解一下404,看看它們是如何影響您的網站

您坐在電腦前,關注著自己的工作,使用網站站長工具欣賞著自己的網站是多么的了不起。可是,等等!抓取錯誤頁面滿是“404 找不到”錯誤!出現這樣的情況時,是否災難就此來臨?

 



請不要擔心,年輕的朋友們。讓我們一起來了解一下404,看看它們是如何影響您的網站的(或者不會造成影響):

問:網站站長工具中報告的404錯誤會影響我的網站排名嗎?

答:404是網絡中一個極其正常的組成部分;互聯網總是在不斷變化,新的內容誕生,舊的內容消失,而當舊內容消失的時候,它(在理想狀況下)會返回一個404 HTTP響應代碼。搜索引擎會察覺到這點;正如您在上圖中所看到的,我們在自己的網站上也有404錯誤,并且整個網絡上都存在。事實上,我們建議,當您在網站上去掉一個頁面的時候,您最好確保它返回一個適當的404或410響應代碼(而不是“軟 404”)。請記住,為了讓我們的網絡爬蟲能夠看到一個URL的HTTP響應代碼,它就必須能夠抓取那個URL——如果該URL被您的robots.txt文件所阻擋,那么我們將無法抓取并看到它的響應代碼。如果您網站上的某些URL不復存在 ,返回404,并不會影響您網站的其他URL(這些URL會返回200 (成功))在我們搜索結果中的表現。

問:這么說404一點都不會影響我的網站嗎?

答:如果您網站上的某些URL出現了404,這一現象本身并不會損害到您或對您在谷歌的搜索結果造成負面影響。然而,在某些情況下可能出現其他原因而讓您希望解決某些類型的404。例如,如果有些出現了404的頁面是您十分在意的,您就應該看看為什么我們在抓取它們的時候會看到404! 如果您發現了一個合法URL的拼寫錯誤(www.example.com/awsome而非www.example.com/awesome),那么很有可能是有人想要鏈接到您的頁面而僅是犯了個打字錯誤。這時可以不返回404,您可以將拼寫錯誤的URL 301重新指向至正確的URL,并捕捉來自該鏈接的有意通信。并且,當用戶確實登陸至您網站的一個404頁面時,您還可以確保您幫助用戶找到他們所要尋找的內容,而不是僅僅是顯示“404 找不到該頁面”。

問:請再介紹一些“軟 404”的有關內容。

答:軟404是指網絡服務器對于一個不存在的URL返回的除404(或410)之外的響應代碼。一個常見的例子就是當一位網站所有者希望為其用戶返回一個帶有有用信息的漂亮404頁面,并認為為了向用戶提供該內容他就必須返回一個200響應代碼。其實并非如此!您可以返回一個404響應代碼而同時向用戶提供您希望的任何內容。另一個例子就是網站將所有未知的URL重新指向至其首頁,而非返回404。這兩種情況都可能為我們對您網站的理解和索引造成負面影響,因此我們建議應確保您的服務器針對不存在的內容返回合適的響應代碼。請記住,僅僅因為頁面顯示“404 找不到該頁面”并不代表它確實返回了404 HTTP響應代碼——請使用網站站長工具中的像Googlebot一樣抓取功能再次確認。如果您不了解如何配置服務器從而返回正確的響應代碼,則請查看您的網絡主機幫助文件。

問:我如何知道一個URL應該返回404、301還是410?

答:當您從網站上移除一個頁面時,請考慮一下該內容是將被移動到其他地方,或者您不再打算在網站上再顯示該類內容。如果您要將此內容移動到一個新的URL,那么您應該將舊的URL301重新指向至新的URL——這樣當用戶連接至舊的URL尋找該內容時,他們就能被自動重新指向至與他們尋找的內容有關的頁面。如果您打算完全刪掉該類內容,并且不再在網站上提供能夠滿足相同用戶需求的內容,那么舊的URL應該返回一個404或410。目前,Google將410(已刪除)與404(找不到該頁面)同等對待,因此您返回404還是410對我們來說并不重要。

問:我的大部分404都是從未在我的網站上存在過的奇怪URL。這是怎么回事?它們是從哪里來的?

答:如果Google在網絡的某個地方找到一個指向您的域上的URL的鏈接,則它可能試圖抓取該鏈接,不論內容是否實際存在;而當這種情況發生時,如果找到不該內容,則您的服務器應該返回一個404。這些鏈接可能由以下原因造成,如某些人在鏈接至您網站時出現的打字錯誤、某些類型的錯誤配置(如果鏈接是自動生成的,例如由CMS自動生成),或由于Google在識別并抓取嵌入在JavaScript的鏈接或其他嵌入內容時造成;再或者,它們可能是我們了解您的服務器如何處理未知URL時所做的快速檢查的一部分,等等。如果您在網站站長工具看到針對您網站上不存在的URL報告的404,您可以放心地忽略它們。我們不知道哪些URL對您來說是重要的,而哪些應該返回404,因此我們會向您顯示所有在您網站上找到的404,并且如果需要的話,讓您來決定哪些應該引起您的注意。

問:有人抄襲了我的網站并且造成了很多404。它們都是附帶有其他代碼的“真正的”URL,例如http://www.example.com/images/kittens.jpg" width="100" height="300" alt="kittens"/>
這樣會損害我的網站嗎?

答:通常情況下,您不必擔心類似這樣的“斷開的鏈接”會損害您的網站。我們知道,網站所有者對抄襲他們網站或以奇怪方式鏈接至網站的人幾乎無能為力。如果您是regex的能手,那么您可以考慮根據此處的說明將這些URL重新指向,但是通常這一情況無需您擔心。請記住,當您認為有人正在從您的網站盜取原始內容時,您還可以提交從Google刪除內容的申請。

問:上周我修復了網站站長工具報告的所有404,但是它們仍然在我的賬戶里有所顯示。這是說我沒有正確的修復它們嗎?它們多長時間才能夠消失?

答:請查看抓取錯誤頁面的“上次檢測到此錯誤的時間”一欄——這是我們檢測到每個錯誤的最近的日期。如果該欄中的日期在您修復錯誤之前,這就意味著自該日期起我們還未遇到這些錯誤。如果這些日期距離較近,則說明我們在抓取時還在繼續遇到這些404。

實施修復之后,您可以通過使用像Googlebot一樣抓取檢查一下我們的網絡爬蟲是否能夠看到新的響應代碼。利用幾個URL進行測試,如果沒有問題,則這些錯誤應該不久就將開始從您的抓取錯誤列表中消失了。

問:我是否能夠使用Google的URL移除工具使404錯誤從我的賬戶中更快地消失?

答:不可以;URL移除工具是用來從Google的搜索結果而不是您的Webmaster Tools賬戶中移除URL的。該工具僅用于緊急的移除請求,并且如一個URL已經返回404則并沒有必要使用此工具,就其本身而言,URL將隨著時間的推移退出我們的搜索結果。請關注我們的博客文章的下半部分,了解URL移除工具能夠為您提供的功能的詳細信息。