Cum să analizezi log files de server pentru diagnosticare SEO avansată

Cum să analizezi log files de server pentru diagnosticare SEO avansată

Log files-urile de server conțin informații brute despre fiecare cerere HTTP primită de serverul tău, inclusiv fiecare acces al Googlebot. Analiza lor oferă o perspectivă unică, directă, neviciată de sampling sau estimări, despre comportamentul real al crawlerului Google pe site-ul tău.

Este una dintre tehnicile de SEO tehnic cel mai puțin utilizate, dar cu potențial ridicat de a descoperi probleme de indexare invizibile cu alte instrumente.

Cum să analizezi log files de server pentru diagnosticare SEO avansată

Un log file de server înregistrează pentru fiecare cerere: data și ora, IP-ul clientului, URL-ul accesat, codul de răspuns HTTP, dimensiunea răspunsului și user agent-ul. Googlebot se identifică prin user agent-ul „Googlebot” sau „Google-InspectionTool”.

Prin filtrarea log-urilor după user agent Googlebot, obții o imagine exactă a ce a accesat Google, când și cu ce rezultat.

Accesarea log files-urilor

Din cPanel

Log-urile de acces se găsesc în Raw Access sau Awstats. Descarcă log-urile din perioada dorită, de obicei comprimate în format .gz:

# Decompresimare fișier log
gunzip access_log.gz

# Filtrare cereri Googlebot
grep -i "googlebot" access_log > googlebot_log.txt

# Top 50 URL-uri accesate de Googlebot
grep -i "googlebot" access_log | awk '{print $7}'   | sort | uniq -c | sort -rn | head -50

Ce să cauți în log-urile Googlebot

Distribuția codurilor de răspuns

Analizează proporția codurilor de răspuns pentru cererile Googlebot:

  • 200: pagini accesate cu succes, ideal peste 90%
  • 301/302: redirecționări, consumă crawl budget suplimentar
  • 404: pagini lipsă, indicate de linkuri interne sau externe vechi
  • 500/503: erori de server, Googlebot poate reduce crawl rate-ul

Pagini importante ignorate de Googlebot

Dacă ai pagini importante care nu apar deloc în log-urile Googlebot pe o perioadă de 30 de zile, există o problemă de crawlabilitate: blocate în robots.txt, fără linkuri interne, sau cu noindex aplicat incorect.

Instrumente pentru analiza log files

Pentru volume mari de log-uri, procesarea manuală cu grep este limitată:

  • Screaming Frog Log File Analyser: instrument dedicat cu interfață grafică, ideal pentru site-uri medii
  • Botify și JetOctopus: platforme enterprise pentru site-uri cu milioane de pagini
  • ELK Stack: soluție open-source pentru volume foarte mari și echipe tehnice

Frecvența optimă de analiză

Pentru site-urile medii (1.000-50.000 pagini), o analiză lunară a log-urilor este suficientă. Pentru site-urile mari cu publicare frecventă de conținut, analiza săptămânală identifică problemele înainte ca ele să impacteze traficul.

Concluzie

Analiza log files-urilor de server este o tehnică de diagnostic SEO de nivel avansat care dezvăluie realitatea crawl-ului Google, dincolo de estimările din alte instrumente. Este esențială pentru site-urile mari cu probleme de indexare inexplicabile.

Explorează mai multe tehnici de SEO tehnic avansat pe blogul InfoSEO.

Comments (0)

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

Back To Top
Search