Błąd 404

Błąd 404 (http error 404 not found) to odpowiedź serwera informujący użytkownika, że żądany zasób nie został odnaleziony.

Prostymi słowami: co oznacza błąd 404? Otrzymujemy go wtedy, gdy pod wpisanym adresem URL nic nie ma. Albo coś pod tym adresem było i zostało usunięte, albo w adresie jest błąd. W pierwszym wypadku musimy to odzyskać, w drugim zastanowić się, skąd wziął się ów błędny adres.

Sam błąd 404 nie jest problemem – jeśli dopiszemy do adresu naszej strony losowy ciąg znaków, np.: domena.pl/xyz123, błąd 404 powinien się pojawić i jest to pożądane działanie.

Problem pojawia się wtedy, kiedy nieistniejące adresy są zaindeksowane przez Google, prowadzą do nich jakieś linki, lub z innych powodów są często wywoływane przez użytkowników lub roboty Google.

W praktyce działań SEO, błąd 404 oznaczać może, że:

  • żądany adres URL nigdy nie istniał, a wywołany został np. przez błędne podlinkowanie w menu strony
  • żądany adres URL istniał, ale znajdujący się pod nim zasób został usunięty lub przeniesiony.
Schemat postępowania z błędami 404
Schemat postępowania z błędami 404 – kliknij, aby powiększyć

Problematyczność błędów 404

W praktyce działań SEO występowanie dużej ilości błędów 404, lub nawet niewielkiej ilości, ale pod istotnymi adresami URL stanowi poważny problem dla strony internetowej.

Jak naprawić 404 error

Co zrobić w pierwszej kolejności? Należy zastanowić się nad przyczyną wystąpienia takiego błędu. Jeśli jesteśmy pewni, że zasób ten nigdy nie istniał (czyli, że pod tym adresem nic wcześniej nie było), należy przeskanować stronę odpowiednimi narzędziami (np. crawlerem) w celu odnalezienia miejsca, w którym znalazł się link do takiego adresu. Taki błędny link mógł przez przypadek zostać umieszczony np. w menu strony, lub gdziekolwiek w internecie – również na innych stronach.

Jeśli pod adresem z błędem 404 wcześniej istniała jakaś strona, należy:

  • spróbować odzyskać zasób, jaki był tam wcześniej dostępny
  • lub przekierować URL na nowy adres pod jakim dany zasób będzie dostępny za pomocą przekierowania 301 (jeśli przekierowanie ma charakter permanentny) lub przekierowania 302 (jeśli spodziewamy się, że przekierowanie będzie miało jedynie charakter krótkoterminowy).

Jeśli błąd 404 występuje na stronie, która wcześniej nie istniała:

  • wszystko w porządku, taki błąd to poprawne zachowanie stron internetowych
  • jeśli otrzymujesz informację o błędach 404 not found nieznanych adresów np. w Search Consoli, należy sprawdzić, czy wszystkie linki na stronie skonstruowane są poprawnie

Co może generować błędy 404 adresów URL, które nigdy nie istniały?

Tego typu „fałszywe alarmy” mogą być generowane m.in. przez:

  • błędne podlinkowanie w menu strony, lub gdziekolwiek w treści
  • błędne linki z innych serwisów*
  • błędne adresy w mapie strony
  • istnienie w cache Google prehistorycznej wersji serwisu
* W przypadku pojedynczych błędnych linków do Twojej strony internetowej wystarczy je przekierować 301. Jeśli jednak strona ma takich linków bardzo dużo, możliwe że jesteś celem ataku spamerów – przejrzyj swój profil linków.

Narzędzia do identyfikowania błędów 404

Oprócz licznych narzędzi potrafiących odnajdywać na stronie niepożądane błędy 404, najpopularniejszym narzędziem pozostaje Google Search Console. Błędy 404 wskazywane są tam z opóźnieniem, ale za to stanowią odzwierciedlenie błędów na jakie realnie napotyka robot Google.

Oprócz tego, do sprawdzenia wewnętrznej struktury linków w poszukiwaniu błędów not found, warto użyć dowolnego crawlera, np. Screaming Frog lub Xenu.

Przyczyny pojawiania się błędów 404

Najczęstsze przyczyny pojawiania się błędów 404 w praktyce to:

  • przenoszenie elementów strony, np. produktów w sklepie z jednej kategorii do drugiej, co wiąże się ze zmianą adresu URL
  • błędne linkowanie wewnętrzne
  • zaindeksowanie produkcyjnych wersji witryny
  • nieprawidłowe wdrożenie certyfikatu SSL lub np. zmiana wersji strony z www. na bez www. lub odwrotnie

Postępowanie z błędami 404 nie wymagającymi ingerencji

Błędy 404 nie zawsze wymagają ingerencji. Dobrą praktyką SEO jest przekierowywanie np. usuniętych produktów na najbliższe pokrewne produkty, kategorię, lub w ostateczności stronę główną. Są jednak przypadki, kiedy warto pozostawić błąd 404 w celu w miarę szybkiego wyindeksowania niepożądanej strony.

Brak błędu 404

Paradoksalnie, problemem może być również brak strony błędu 404. Jeśli do adresu naszej strony dodamy losowy ciąg znaków, np. domena.pl/x/d/lorem_ipsum/12345, powinien się nam wyświetlić błąd 404.

Jego brak w takim przypadku powoduje, że robot Google nie jest jasno informowany, że pod podanym adresem nie ma treści. Zmarnuje więc swoje zasoby na indeksację takiego adresu, a w niektórych przypadkach doprowadzi to również do duplikacji treści na stronie.

Pozorny błąd 404

Co oznacza pozorny błąd 404? Jest to częsty komunikat wyświetlany w Search Console. Występuje wtedy, gdy robot Google trafia na stronę która nie istnieje, ale nie wysyła przeglądarce błędu 404. Zamiast tego serwuje kod 200, informujący o powodzeniu.

Jak naprawić tego typu błędy? Zdecyduj, czy są to adresy, które są przydatne – w większości przypadków okażą się być zupełnie zbędne. Jeśli tak uznasz, należy zacząć wyświetlać dla nich błędy 404 zamiast kodu powodzenia 200.

Jeśli jesteś pewny, że pod adresem, na którym występuje pozorny błąd, nie powstanie nigdy żadna treść, możesz też przekierować ten adres np. na stronę główną.

Jak ustawić stronę 404

Ustawienie strony 404 jest proste i wymaga jedynie minimum pracy.

Błąd 404 na stronie internetowej może być wdrożony na 2 główne sposoby: może to być pusta strona ze standardową informacją o błędzie, lub w pełni customisowana informacja o błędzie, z grafiką i wyglądem identycznym jak w pozostałej części stron naszego serwisu.

Wiele dużych serwisów decyduje się na humorystyczne informacje o błędzie 404, ważne jest też by zawrzeć tam nawigację i zaproponować użytkownikowi inne, działające adresy do odwiedzenia.

W przypadku systemów CMS obsługę błędów 404 mamy z reguły zapewnioną, np. w WordPressie strona zawierająca błąd 404 może być wizualnie dopieszczona za pomocą pliku 404.php w katalogu z motywem.

Na większości serwerów jako stronę błędu 404 możemy ustawić wskazany przez nas adres, dokonując wpisu w pliku .htaccess:

ErrorDocument 404 /adres_strony.html

 

Co lepsze: kod 404 czy kod 410?

Jeśli chcemy usunąć z indeksu wyszukiwarki zbędne adresy URL, możemy zamiast kodu 404 zaserwować kod 410. Jego działanie i znaczenie jest podobne, ma jednak bardziej definitywny wydźwięk (żądanego adresu nie ma i już nie będzie).

Według oficjalnego stanowiska Google, kod 410 może skutkować szybszym wyindeksowaniem adresu, jednak różnica jest tu nieznaczna i w gruncie rzeczy oba typy błędów pozostają w oczach Googlebota prawie jednoznaczne.

404 jako neologizm

Błąd 404 stał się żywym tworem językowym w języku internautów. „404” to często określenie czegoś, czego nie ma, czego nie znaleziono, co zaginęło.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *