Sitemapa XML – kompletny przewodnik SEO
Sitemapa XML to plik zawierający listę kluczowych URL-i Twojej strony. Możesz myśleć o niej jak o mapie dla wyszukiwarek – kieruje ich crawlery w taki sposób, aby lepiej znajdowały i indeksowały Twoje strony. Sitemapa XML powstała z myślą o botach, nie o ludziach. Sitemapa HTML natomiast jest przeznaczona dla zwykłego użytkownika.
Twoja mapa strony może również zawierać przydatne metadane – na przykład datę ostatniej modyfikacji strony, inne wersje językowe czy szczegóły o obrazach i filmach.
Dlaczego sitemapa XML jest ważna dla SEO?
Dobra mapa strony to fundament technicznego SEO. Nie jest bezpośrednim czynnikiem rankingowym, ale poprawia sposób, w jaki wyszukiwarki indeksują Twoją witrynę.
Duże strony często mają tzw. „osierocone” strony – bez żadnych linków wewnętrznych prowadzących do nich. Sitemap zapewnia, że wyszukiwarki znajdą całą Twoją treść, pomagając im znacznie szybciej odkrywać nowe podstrony.
Mapa strony pomaga również zarządzać crawl budget wyszukiwarki. Powinieneś umieszczać w niej tylko wartościowe, indeksowalne strony. To wskazuje wyszukiwarkom, na czym skupić uwagę, i pomaga szybko zaindeksować najważniejsze treści.
Kiedy stosować sitemapy XML?
Większość stron może skorzystać z sitemapy, ale staje się niezbędna w określonych sytuacjach:
- Twoja strona jest duża.
Google zaleca używanie sitemap dla witryn z ponad 500 stronami. Na dużych stronach crawlery mogą przegapić niektóre podstrony – sitemapa temu zapobiega. - Twoja strona jest nowa.
Nowe witryny mają mało linków zewnętrznych. Boty wyszukiwarek znajdują strony, podążając za linkami. Sitemapa daje im bezpośrednią ścieżkę do nowej treści. - Twoja strona ma bogate multimedia.
Używasz wielu filmów i obrazów? Sitemapa pomaga Google prawidłowo znajdować i indeksować tę treść. Dotyczy to również serwisów informacyjnych.
Może nie potrzebujesz sitemapy, jeśli Twoja strona jest mała (poniżej 500 stron) i ma świetne linkowanie wewnętrzne. Ponadto wiele nowoczesnych systemów jak WordPress czy Wix tworzy ją automatycznie.
Anatomia sitemapy XML
Aby zarządzać mapą strony, musisz rozumieć jej kod. Sitemapa XML to plik tekstowy o określonej składni, którą wyszukiwarki muszą umieć odczytać.
Podstawowa struktura
Każda sitemapa zaczyna się od deklaracji XML definiującej typ pliku i kodowanie:
<?xml version="1.0" encoding="UTF-8"?>Code language: HTML, XML (xml)
Następnie pojawia się tag <urlset> – główny kontener dla wszystkich URL-i strony. Zawiera również przestrzeń nazw wskazującą na protokół sitemap:
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9″>
</urlset>
Kluczowe tagi: <url> i <loc>
Wewnątrz <urlset> każda strona otrzymuje własny tag <url> – kontener nadrzędny dla informacji o jednym URL.
W każdym tagu <url> wymagany jest tag <loc> zawierający lokalizację, czyli URL strony. Musi to być pełna, kanoniczna wersja, na przykład https://www.example.com/page-name. Nie używaj względnych URL-i jak /page-name/.
Prosty wpis wygląda tak:
<url>
<loc>https://www.example.com/foo.html</loc>
</url>Code language: HTML, XML (xml)
Tag <lastmod>
Tag <lastmod> jest opcjonalny, ale bardzo zalecany. Informuje wyszukiwarki, kiedy treść strony ostatnio się zmieniła. Data musi być w formacie YYYY-MM-DD:
<url>
<loc>https://www.example.com/foo.html</loc>
<lastmod>2022-06-04</lastmod>
</url>Code language: HTML, XML (xml)
Dokładność ma tutaj kluczowe znaczenie. Google używa tego tagu tylko wtedy, gdy jest konsekwentnie poprawny. Jeśli aktualizujesz datę codziennie bez zmiany treści, Google nauczy się go ignorować. Tag <lastmod> powinien odzwierciedlać rzeczywiste aktualizacje treści.
Spór o <priority> i <changefreq>
Dwa inne tagi, <priority> i <changefreq>, często wywołują zamieszanie:
<priority>sugeruje ważność strony w skali od 0.0 do 1.0<changefreq>sugeruje częstotliwość zmian strony (np. daily, weekly)
Jednak Google oficjalnie stwierdził, że ignoruje oba te tagi.
To pozostałości starszego protokołu. Nowoczesne crawlery są znacznie inteligentniejsze – używają setek innych sygnałów do oceny ważności strony. Wiele narzędzi nadal dołącza te tagi, przez co niektórzy myślą, że są ważne. Skupianie się na nich to strata czasu. Zamiast tego skup się na czystych URL-ach i dokładnych datach <lastmod>.
Rodzaje sitemap
Choć najczęstszą mapą strony jest lista podstron witryny, możesz tworzyć wyspecjalizowane sitemapy pomagające wyszukiwarkom odkrywać konkretne typy treści. Wszystkie bazują na standardowym formacie XML, ale zawierają dodatkowe tagi dla określonych typów zawartości.
Standardowa sitemapa XML
To najczęstszy typ mapy strony. Zawiera URL-e podstron witryny wraz z opcjonalnymi metadanymi:
<loc>: URL strony (wymagany)<lastmod>: Data ostatniej modyfikacji strony<changefreq>: Przewidywana częstotliwość zmian strony<priority>: Priorytet tego URL względem innych na stronie (skala 0.0-1.0)
Sitemapa wideo
Sitemapa wideo zawiera szczegóły o treści wideo na Twoich stronach. Pomaga wyszukiwarkom znajdować i rozumieć filmy, potencjalnie wyświetlając je w wynikach wyszukiwania wideo. Dodatkowe tagi to:
<video:thumbnail_loc>: URL miniatury filmu<video:title>: Tytuł filmu<video:description>: Opis filmu<video:duration>: Długość filmu w sekundach<video:publication_date>: Data publikacji filmu
Sitemapa Google News
Jeśli prowadzisz stronę informacyjną, sitemapa Google News może pomóc Google szybko odkrywać Twoje artykuły. To kluczowe dla treści wrażliwych na czas. Specjalne tagi to:
<news:publication>: Nazwa publikacji informacyjnej<news:publication_date>: Data publikacji artykułu<news:title>: Tytuł artykułu informacyjnego
Uwzględniaj tylko URL-e artykułów opublikowanych w ciągu ostatnich dwóch dni, a sitemapa może zawierać maksymalnie 1000 URL-i.
Sitemapa obrazów
Sitemapa obrazów pomaga wyszukiwarkom odkrywać obrazy na Twojej stronie, co może prowadzić do lepszej widoczności w wynikach wyszukiwania obrazów. Dla każdego URL strony możesz wymienić zawarte na niej obrazy. Ważne tagi to:
<image:loc>: URL obrazu<image:caption>: Podpis obrazu<image:geo_location>: Lokalizacja geograficzna obrazu<image:title>: Tytuł obrazu
Indeks sitemap
Indeks sitemap to plik zawierający listę wielu plików sitemap. Pomyśl o nim jak o mapie map ????
Użyjesz pliku indeksu sitemap w następujących sytuacjach:
Duże strony:
Pojedynczy plik sitemapy ma ograniczenia – nie może zawierać więcej niż 50 000 URL-i i musi być mniejszy niż 50MB w wersji nieskompresowanej. Jeśli Twoja strona przekracza te limity, musisz podzielić URL-e na wiele plików sitemap. Plik indeksu sitemap służy następnie do wylistowania wszystkich tych pojedynczych map.
Organizacja:
Możesz chcieć uporządkować swoje sitemapy według typu treści. Na przykład jedna mapa dla postów na blogu, druga dla stron produktów, trzecia dla filmów. Indeks sitemap pozwala przesłać jeden plik do wyszukiwarek, który następnie kieruje je do wszystkich uporządkowanych plików sitemap.
Plik indeksu sitemap używa podobnego formatu XML co standardowa sitemapa, ale z innymi tagami:
<sitemapindex>: Tag nadrzędny pliku<sitemap>: Tag nadrzędny dla każdej sitemapy wymienionej w indeksie<loc>: Lokalizacja (URL) pojedynczego pliku sitemapy<lastmod>: Data ostatniej modyfikacji pojedynczego pliku sitemapy
Jak utworzyć sitemapy XML
Istnieje kilka sposobów tworzenia sitemap. Wybierz metodę odpowiadającą Twojej stronie i poziomowi umiejętności.
Najlepsza opcja to automatyczny system, który aktualizuje sitemapę(y) na bieżąco.
Przesyłanie sitemapy
Po pierwsze, prześlij go do Google Search Console (GSC):
- Zaloguj się do konta GSC
- Przejdź do raportu „Sitemapy” w sekcji „Indeksowanie”
- Wpisz URL Twojej sitemapy (np. sitemap.xml)
- Kliknij „Prześlij”
Po drugie, dodaj ją do pliku robots.txt. Ten plik znajduje się w katalogu głównym domeny. Dodaj tę linię, używając pełnego URL Twojej sitemapy:
Sitemap: https://www.example.com/sitemap.xmlCode language: JavaScript (javascript)
To drogowskaz dla wszystkich wyszukiwarek, nie tylko Google.
Po przesłaniu sprawdź raport Sitemapy w GSC. Pokaże, czy Google pomyślnie pobrał plik i czy wystąpiły błędy.
Typowe błędy sitemap do unikania
- Uwzględnianie niewłaściwych URL-i.
To największy błąd. Twoja sitemapa powinna być czystą listą najlepszych stron. Nigdy nie umieszczaj URL-i niekanonicznych, przekierowań (3xx) czy stron błędów (4xx). Wykluczaj również strony z tagiem „noindex” lub zablokowane przez robots.txt. - Błędy rozmiaru i formatu.
Sitemapa musi być mniejsza niż 50MB i zawierać mniej niż 50 000 URL-i. Dla większych stron użyj pliku indeksu sitemap, żeby podzielić ją na mniejsze części. - Błędy pobierania.
Jeśli GSC zgłasza „Nie można pobrać” Twojej sitemapy, sprawdź plik robots.txt. Upewnij się, że nie blokujesz dostępu do samego pliku sitemapy. - Błędy składni.
Proste błędy kodowania mogą zepsuć cały plik. Użyj narzędzia do walidacji sitemapy XML, żeby sprawdzić kod przed przesłaniem.
Naprawianie błędów sitemap jest ważne – często wskazują na głębsze problemy techniczne witryny. Używaj raportu GSC jako narzędzia do znajdowania i naprawiania tych większych problemów.
Kluczowe wnioski
Przestrzegaj tych najlepszych praktyk dla swojej sitemapy:
