Fachlich kompetent
Äußerst flexibel
Absolut zuverlässig
SEO

Google behandelt Thin Content Pages als 404 Seiten

Julian DzikiSEO-Experte

„Bitte was?“ habe ich mir gedacht, als ich den unglaublich guten Blogpost von DejanSEO gelesen habe. Die Essenz des Beitrags: Seit dem 24. Oktober behandelt Google URLs mit wenig Inhalt genauso wie 404 Seiten und gibt diese Seiten sogar als Soft-404 Fehler in den Webmastertools aus!

18.000 Abonnenten können sich nicht irren

Du willst keine unserer Beiträge mehr verpassen und auf dem Laufenden bleiben? Abonniere jetzt unseren Newsletter und erhalte jeden neuen Seokratie-Beitrag per E-Mail direkt in Dein Postfach!

Jetzt abonnieren
panda-gruppe

© Hung_Chung_Chih / Istockphoto

Was ist passiert?

Seit dem 24.10. werden in den Google Webmastertools neue Arten von Seiten unter „Crawling-Fehler“ –> „Soft-404“ angezeigt. Und zwar:

  • Tag-Seiten (einige)
  • Suchergebnisseiten ohne Inhalte (Suche nach „XY“ nicht gefunden)
  • Leere Autorenseiten
  • Userprofilseiten in Foren (!)
  • Seiten mit sehr wenig Content ( Nur wenige Wörter / Sätze und leere HTML Seiten)

Interessant: Bei einer Domain sind als Userprofilseiten ausschließlich gesperrte (= vom Forum verbannte) Mitglieder als Soft-404 aufgetaucht. Und super-interessant: Eine Thin-Content Page, die wir überprüft hatten, lieferte als Antwortcodes keinen Soft-404, sondern 503 aus. Auch am 24.10. Die „richtigen“ Statuscodes sind allerdings immer 200.

Was sind Soft 404 Fehler?

Eine Webseite, die keinen Inhalt enthält (leere Artikelseiten, „Produkt nicht gefunden“-Seiten oder leere Kategorien), sollte normalerweise auch mit einem 404-Statuscode von Serverseite versehen werden (im Response Header). Leere oder „Nicht gefunden“ Seiten, die keinen 404-Statuscode zurückgeben, sind sogenannte „Soft-404“ Seiten. Der Content der Seite steht in keinem Zusammenhang zu dem vom Server gesendeten HTTP-Antwortcode.

Google sagt:

„Das Zurückgeben eines anderen Codes als 404 oder 410 für eine nicht vorhandene Seite (oder das Weiterleiten von Nutzern auf eine andere Seite wie beispielsweise die Startseite anstelle des Zurückgebens eines 404-Codes) ist problematisch. Zum einen weist er Suchmaschinen darauf hin, dass unter dieser URL eine richtige Seite vorhanden ist. Daher kann diese URL gecrawlt und der dazugehörige Content indexiert werden. Aufgrund der von Googlebot aufgewendeten Zeit für nicht vorhandene Seiten wird Ihre eindeutige URL möglicherweise nicht so schnell entdeckt oder nicht so häufig besucht. Zudem kann die Crawl-Abdeckung Ihrer Website beeinträchtigt sein. Sie möchten außerdem sicherlich nicht, dass Ihre Seite bei der Suchanfrage [Datei nicht gefunden] ganz weit oben rangiert.“ Quelle

Was bedeutet das?

Google ist viel besser darin geworden, „Thin Content“ Seiten zu entdecken. Sollten „normale“ Seiten von Euch als Soft-404-Seiten auftauchen, würde ich mir an Eurer Stelle ernsthafte Gedanken machen. Aber ein Gutes hat das Ganze: Ihr seht nun, was Google so überhaupt nicht schmeckt. Die Frage ist natürlich, wie Google damit umgeht? Ist die Entwicklung gut oder schlecht für normale Webmaster? Ich vermute fast, dass sie gut ist.

Denn wenn die Seiten vorher nicht als Soft 404er gewertet wurden, dann haben sie mit zur Rankingberechnung gezählt. Das war auch bisher mein Eindruck. Google schrieb ja damals zu Panda 1:

 

„One other specific piece of guidance we’ve offered is that low-quality content on some parts of a website can impact the whole site’s rankings, and thus removing low quality pages, merging or improving the content of individual shallow pages into more useful pages, or moving low quality pages to a different domain could eventually help the rankings of your higher-quality content.“

 

Es kann also sein, dass solche neuartigen Soft-404-Fehler keinen Panda-Filter mehr auslösen. Ich würde allerdings nicht darauf wetten und die Soft-404 Fehler schlichtweg beseitigen. Dann muss man nicht groß darüber nachdenken. Aber es ist eine tolle neue Möglichkeit, URLs zu finden, die Google nicht mag, besonders für Thin-Content Aggregatoren. 🙂

Ob das jetzt mit einem Panda Update einhergeht, wie Glenn Gabe behauptet, weiß ich nicht. Meiner Meinung nach geht es sowieso seit einer Woche ziemlich rund im (deutschen) Index. Der Martin hat schon darüber berichtet.

Was denkt Ihr?

 

Wie können wir Dir weiterhelfen?

  • Lass uns miteinander sprechen

    kostenlos & unverbindlich

    Dein Ansprechpartner:
    Julian Dziki
  • Dieses Feld dient zur Validierung und sollte nicht verändert werden.

Werde fit in SEO!
Werde fit in SEO!
Unser kostenloser SEO-Kurs bringt Dir 5 Tage lang täglich SEO-Wissen in Dein E-Mail-Postfach und unseren Newsletter. Über 15.000 Abonnenten vertrauen uns bereits.
Abonnieren
Du kannst Dich jederzeit wieder abmelden.
close-link