Google behandelt Thin Content Pages als 404 Seiten
„Bitte was?“ habe ich mir gedacht, als ich den unglaublich guten Blogpost von DejanSEO gelesen habe. Die Essenz des Beitrags: Seit dem 24. Oktober behandelt Google URLs mit wenig Inhalt genauso wie 404 Seiten und gibt diese Seiten sogar als Soft-404 Fehler in den Webmastertools aus!
Mit unserem Newsletter bekommst Du automatisch die neuesten Seokratie-Beiträge direkt in Dein Postfach!
Jetzt abonnierenWas ist passiert?
Seit dem 24.10. werden in den Google Webmastertools neue Arten von Seiten unter „Crawling-Fehler“ –> „Soft-404“ angezeigt. Und zwar:
- Tag-Seiten (einige)
- Suchergebnisseiten ohne Inhalte (Suche nach „XY“ nicht gefunden)
- Leere Autorenseiten
- Userprofilseiten in Foren (!)
- Seiten mit sehr wenig Content ( Nur wenige Wörter / Sätze und leere HTML Seiten)
Interessant: Bei einer Domain sind als Userprofilseiten ausschließlich gesperrte (= vom Forum verbannte) Mitglieder als Soft-404 aufgetaucht. Und super-interessant: Eine Thin-Content Page, die wir überprüft hatten, lieferte als Antwortcodes keinen Soft-404, sondern 503 aus. Auch am 24.10. Die „richtigen“ Statuscodes sind allerdings immer 200.
Was sind Soft 404 Fehler?
Eine Webseite, die keinen Inhalt enthält (leere Artikelseiten, „Produkt nicht gefunden“-Seiten oder leere Kategorien), sollte normalerweise auch mit einem 404-Statuscode von Serverseite versehen werden (im Response Header). Leere oder „Nicht gefunden“ Seiten, die keinen 404-Statuscode zurückgeben, sind sogenannte „Soft-404“ Seiten. Der Content der Seite steht in keinem Zusammenhang zu dem vom Server gesendeten HTTP-Antwortcode.
Google sagt:
„Das Zurückgeben eines anderen Codes als 404 oder 410 für eine nicht vorhandene Seite (oder das Weiterleiten von Nutzern auf eine andere Seite wie beispielsweise die Startseite anstelle des Zurückgebens eines 404-Codes) ist problematisch. Zum einen weist er Suchmaschinen darauf hin, dass unter dieser URL eine richtige Seite vorhanden ist. Daher kann diese URL gecrawlt und der dazugehörige Content indexiert werden. Aufgrund der von Googlebot aufgewendeten Zeit für nicht vorhandene Seiten wird Ihre eindeutige URL möglicherweise nicht so schnell entdeckt oder nicht so häufig besucht. Zudem kann die Crawl-Abdeckung Ihrer Website beeinträchtigt sein. Sie möchten außerdem sicherlich nicht, dass Ihre Seite bei der Suchanfrage [Datei nicht gefunden] ganz weit oben rangiert.“ Quelle
Was bedeutet das?
Google ist viel besser darin geworden, „Thin Content“ Seiten zu entdecken. Sollten „normale“ Seiten von Euch als Soft-404-Seiten auftauchen, würde ich mir an Eurer Stelle ernsthafte Gedanken machen. Aber ein Gutes hat das Ganze: Ihr seht nun, was Google so überhaupt nicht schmeckt. Die Frage ist natürlich, wie Google damit umgeht? Ist die Entwicklung gut oder schlecht für normale Webmaster? Ich vermute fast, dass sie gut ist.
Denn wenn die Seiten vorher nicht als Soft 404er gewertet wurden, dann haben sie mit zur Rankingberechnung gezählt. Das war auch bisher mein Eindruck. Google schrieb ja damals zu Panda 1:
„One other specific piece of guidance we’ve offered is that low-quality content on some parts of a website can impact the whole site’s rankings, and thus removing low quality pages, merging or improving the content of individual shallow pages into more useful pages, or moving low quality pages to a different domain could eventually help the rankings of your higher-quality content.“
Es kann also sein, dass solche neuartigen Soft-404-Fehler keinen Panda-Filter mehr auslösen. Ich würde allerdings nicht darauf wetten und die Soft-404 Fehler schlichtweg beseitigen. Dann muss man nicht groß darüber nachdenken. Aber es ist eine tolle neue Möglichkeit, URLs zu finden, die Google nicht mag, besonders für Thin-Content Aggregatoren. 🙂
Ob das jetzt mit einem Panda Update einhergeht, wie Glenn Gabe behauptet, weiß ich nicht. Meiner Meinung nach geht es sowieso seit einer Woche ziemlich rund im (deutschen) Index. Der Martin hat schon darüber berichtet.
Was denkt Ihr?
google hat bereits vorher einige mit „wenig inhalt“ als soft 404 bezeichnet.
sogar dann, wenn diese auf NOINDEX standen.
ich habe aber keinen bock 404 zurückzugeben nur weil eine seite aus google-sicht zu dünnen inhalt aufweist. der status-code einer http-anfrage ist nicht zu 100 % für google da, sondern zu 99 % für programme wie browser, gateways, … die http anfragen abwickeln.
und jetzt 404 an einen browser zurückzugeben, obwohl die seite existiert, halte ich für äußerst bedenklich.
Ich werde garantiert nix an meinen Seiten basteln nur weil Google meint dieses oder jenes Problem zu haben.
Google will etwas, nämlich angeblich „beste Suchergebnisse“
Viele der bisherigen besten Suchergebnisse waren oftmals Tipps die mitunter eine kurze Erklärung und eine Zeile Code enthielten (wenig Text, viel Nutzen). Was soll man viel blabla um etwas machen wenn es auch kurz geht.
Hallo Julian,
Soft 404 war immer schon dazu da um Seiten die Aus Googlesicht Fehlerseiten sind, aber trotzdem 200 OK ausliefern zu verifizieren. Ein typisches Beispiel ist diese Seite http://www.handtuch-welt.de/Unsere-Marken/Villeroy-Boch/Villeroy-Boch-Handtuecher/Typ-Handtuecher/?force_sid=67970d77cda78ae60636ed4023002aa3/. Google hat ein Update des Algos durchgeführt und ist jetzt deutlich sensitiver, was die Einstufung als Fehlerseite angeht und somit werden jetzt auch vermehrt Seiten angezeigt die eben low User Quality haben, wie Tag Seiten etc. John Müller hat das mit seinem berühmenten Lächeln mehr oder weniger bestätigt.
Ich habe auch einige Soft-404 Meldungen …. und dabei sind viele Unterseiten dabei, die, wie schon im ersten Post beschrieben, mit „noindex“ ausgeschlossen wurden.
Sehr eigenartig!
Zum Thema „404-Seiten“, schaut euch mal folgende Seite von euch an: https://www.seokratie.de/rankingfaktoren-url/
Weiterhin schönes Wochenende 🙂
Hallo Vanderelbe,
Danke für die Info, wurde behoben.
Das ist seit langem der erste SEO Artikel, bei dem ich dumm aus Wäsche schau. Bisher wurde doch dieses Soft 404 angezeigt, wenn man 404 per 301 weitergeleitet hat. Hab vor 1,5 Jahren ewig mit meinem alten Shop herum experimentiert, um zu verstehen, was denn nun der Unterschied zwischen 404 und Soft 404 sein soll. Damals war es eben so, das Soft 404 nur angezeigt wurde, wenn man mit einer 301 Umleitung gearbeitet hat. Hat man 301 wieder heraus genommen, dann wurden die nicht vorhandenen Seite wieder als „normale“ 404 in den Webmaster Tools ausgegeben. Nun gut, damals war der Panda schon aktiv, aber auf die Idee mit dem dünnen Content wär ich niemals gekommen, zumindest war es nicht offensichtlich. Wenn das aber stimmt mit dem dünnen Content und dem Soft 404, dann ist das wieder so eine Sache, wo man sich fragen muss, ob Google einen für dumm verkaufen will. Muss es denn unbedingt Soft 404 heißen und zu diesem Fehler Code keine vernünftige Erklärung geben? Man könnte es ja anstatt Soft 404 auch einfach beim Namen nennen und daraus ein „Shit-Content 404“ machen, dann hätte man wenigstens zum damaligen Zeitpunkt einen Anhaltspunkt gehabt.
Das ausgeben von 503 ist aber auch wieder so einen Sache, das kann man bei einer kleinen Seite machen aber im Shop Bereich lässt man davon auch am besten wieder die Finger, denn wer sagt dass die URL ( Produkt ) nicht mal wieder online ( 200 ) ist. Ich sehe das ganze SEO Thema immer noch mit den Augen eines Shopbetreibers und naja, sag lieber nichts dazu. 🙂