Technické SEO · Slovníček pojmů

Sitemap.xml: co to je
a jak ji vytvořit?

Sitemap je soubor, který říká vyhledávačům, jaké stránky na vašem webu existují a kdy byly naposledy změněny. Na této stránce najdete vysvětlení formátů, checklist správné sitemapy a návod jak ji odeslat do Google Search Console i Seznamu.

50 000
max. URL v jednom souboru
50 MB
limit velikosti souboru
3
formáty sitemapy
2005
rok vzniku protokolu

Základy

Co je sitemap.xml a k čemu slouží

Sitemap.xml je soubor, který obsahuje seznam URL adres vašeho webu a říká vyhledávačům, které stránky existují, kdy byly naposledy změněny a jak jsou vzájemně provázány. Bez sitemapy musí Google procházet web výhradně pomocí odkazů — u větších nebo nově spuštěných webů to znamená, že část obsahu může zůstat neobjevena týdny i déle.

Sitemap je doplněk ke crawlování, ne jeho náhrada. Google najde stránky i bez ní — přes interní odkazy, zpětné odkazy nebo přímým zadáním URL do Search Console. Sitemap ale celý proces zrychluje a dává Googlu přehled o tom, co považujete za důležité.

XML sitemap pro vyhledávače

Soubor ve strojově čitelném formátu XML. Obsahuje seznam URL adres s volitelnými informacemi o datu poslední změny. Tento typ sitemapy používají Google, Seznam i Bing. Je to standard, který byste měli mít na každém webu s více než desítkami stránek.

Standardní umístění je https://vasedomena.cz/sitemap.xml — většina nástrojů a crawlerů ho prochází automaticky.

HTML mapa webu pro návštěvníky

Klasická HTML stránka s přehledem odkazů na důležité sekce webu. Sloužila hlavně lidem, dnes ji vytlačila kvalitní navigace a interní prolinkování. Pro moderní weby s dobře postaveným menu nemá HTML sitemap velký přínos ani pro uživatele, ani pro SEO. Na XML sitemapě se ale nic nemění.

Jak sitemap funguje

Když Googlebot navštíví váš web, prochází ho po odkazech a ukládá obsah stránek do indexu. Sitemap mu dává zkratku: místo procházení celého webu si přečte seznam URL najednou a porovná ho s tím, co už zná z minulých návštěv. K novému nebo aktualizovanému obsahu se tak dostane výrazně rychleji.

Důležité je ale pochopit, že sitemap je doporučení, ne příkaz. Google URL z sitemapy nezaindexuje automaticky jen proto, že tam jsou. Rozhoduje sám na základě kvality obsahu, interních odkazů a crawl budgetu. Pokud stránka nemá dostatečnou hodnotu, nebude zaindexována bez ohledu na to, jak precizně je sitemap sestavena. Více o tomto tématu najdete v sekci Sitemap nestačí níže.

Formáty

Formáty sitemapy: XML, TXT a RSS

Pro sitemapu existují tři formáty, které Google akceptuje. Pro drtivou většinu webů platí jedno doporučení: použijte XML. Ostatní formáty mají smysl jen ve specifických situacích.

Formát Podpora vyhledávačů Vhodné pro Limit
XML Google, Seznam, Bing Všechny typy webů — standard 50 000 URL / 50 MB
TXT Google Jednoduché statické weby bez CMS 50 000 URL
RSS / Atom Google Blogy a zpravodajské weby s RSS feedem Posledních ~50 příspěvků

XML sitemap

Standardní volba. Podporují ji všechny hlavní vyhledávače. Umožňuje předat datum poslední změny (lastmod), volitelně frekvenci aktualizací a prioritu. Generují ji automaticky WordPress pluginy i většina CMS systémů.

TXT sitemap

Prostý textový soubor — jeden URL na řádek. Žádné tagy, žádná metadata. Výhodou je jednoduchost, nevýhodou absence informací o datu změny. Google ho podporuje, ale nedostanete z něj tolik informací v Search Console.

RSS / Atom feed

Google umí použít existující RSS feed jako sitemapu. Problémem je, že RSS obsahuje jen posledních 10 až 50 příspěvků — starší obsah v něm není. Pro blogy kde na čerstvosti záleží je to použitelné, jinak je XML lepší volbou.

Technický detail

Struktura souboru sitemap.xml — elementy a příklad

XML sitemap má pevně danou strukturu podle specifikace sitemaps.org. Povinné jsou jen tři elementy — zbytek je volitelný a některé z nich Google podle vlastního vyjádření zcela ignoruje.

Povinné elementy: urlset, url, loc

Každý soubor sitemap.xml musí obsahovat tyto tři části. Bez nich soubor není platnou sitemapou a vyhledávač ho může odmítnout zpracovat.

<urlset>

Kořenový element celého souboru. Musí obsahovat atribut xmlns odkazující na specifikaci. Vše ostatní je zanořeno uvnitř.

<url> a <loc>

Každá stránka je obalena tagem <url>. Uvnitř je povinný tag <loc> s absolutní URL adresou včetně protokolu (https://). Relativní adresy jako /o-nas nefungují — crawler je ignoruje.

Nepovinné elementy: lastmod, changefreq, priority

<lastmod>

Datum poslední změny stránky ve formátu YYYY-MM-DD. Google tento údaj skutečně používá — ale jen pokud zjistí, že mu vaše data pravidelně odpovídají realitě. Pokud generujete dnešní datum pro všechny stránky automaticky, Google si toho všimne a přestane ho brát v úvahu.

<changefreq>

Frekvence aktualizací stránky (daily, weekly, monthly…). Google tento element od roku 2023 oficiálně ignoruje. Přidávat ho nemá smysl — jen zbytečně zvyšuje velikost souboru. Stejné platí i pro Seznam.

<priority>

Relativní priorita stránky na škále 0.0 až 1.0. Google ho také ignoruje. Pokud nastavíte všem stránkám prioritu 1.0, nic to nezmění. Jde o historický element ze specifikace z roku 2005, který v praxi nikdy nefungoval tak, jak byl navržen.

Praktické doporučení: Do sitemap.xml stačí <urlset>, <url>, <loc> a <lastmod> s pravdivým datem změny. changefreq a priority vynechejte — nepřinášejí žádnou hodnotu a Google je ignoruje.

Příklad souboru sitemap.xml s komentáři

Takto vypadá minimální platný soubor sitemap.xml pro web se dvěma stránkami:

<?xml version="1.0" encoding="UTF-8"?>
<!-- Definice XML a kódování — vždy UTF-8 -->

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<!-- Kořenový element s odkazem na specifikaci sitemaps.org -->

  <url>
    <loc>https://vasedomena.cz/</loc>
    <!-- Povinná absolutní URL včetně https:// -->
    <lastmod>2026-03-15</lastmod>
    <!-- Datum poslední reálné změny obsahu stránky -->
  </url>

  <url>
    <loc>https://vasedomena.cz/sluzby/</loc>
    <lastmod>2026-01-20</lastmod>
  </url>

  <url>
    <loc>https://vasedomena.cz/kontakt/</loc>
    <lastmod>2025-11-05</lastmod>
  </url>

</urlset>
Proč absolutní URL? Vyhledávač může narazit na kopii vašeho webu v testovacím prostředí nebo na jiné doméně. Pokud sitemap obsahuje relativní adresy, robot by procházel i tato testovací prostředí. Absolutní URL jako https://vasedomena.cz/sluzby/ jednoznačně identifikuje zdroj a zabraňuje zbytečnému crawlování.

Kdy sitemapu použít

Jaké weby sitemapu potřebují — a jaké se bez ní obejdou

Sitemap není povinná. Pro weby s dobrým interním prolinkováním a desítkami stránek ji Googlebot najde sám přes odkazy. Existují ale situace, kdy sitemap výrazně pomáhá — a naopak situace, kdy její přínos je minimální.

Weby, kde sitemap výrazně pomáhá

01
Nové weby bez zpětných odkazů
Pokud na váš web nevede žádný nebo téměř žádný zpětný odkaz, Googlebot ho může ignorovat týdny. Sitemap spolu s ručním přidáním URL do Google Search Console je nejrychlejší cesta jak dát Googlu vědět, že web existuje.
02
Velké weby a e-shopy
Weby s více než 500 indexovatelnými stránkami mají vyšší riziko, že Googlebot opakovaně prochází stejné sekce a nový obsah hledá pomalu. Sitemap mu dá přehled o celé struktuře najednou. Pro e-shopy s tisíci produkty je sitemap index prakticky nutností.
03
Weby se slabým interním prolinkováním
Existují stránky, na které nevede žádný interní odkaz. Těmto stránkám SEO konzultanti říkají sirotčí stránky. Bez sitemapy je Googlebot nemůže najít vůbec — protože k nim nevede žádná cesta z ostatních stránek webu.
Sirotčí stránky = neviditelné bez sitemapy
04
Zpravodajské weby a weby s čerstvým obsahem
Pokud publikujete obsah, který je relevantní jen první hodiny nebo dny po vydání, sitemap v kombinaci s Google News sitemapou je klíčová. Bez ní se Googlebot může dostat k článku, až je zastaralý. Sitemap pro Google News navíc umožňuje zobrazení v agregátoru zpráv.

Weby, kde sitemap příliš nepomůže

Malý firemní web s pěti až dvaceti stránkami, dobrým interním prolinkováním a aktivním získáváním zpětných odkazů si Googlebot najde sám. Sitemap mu nezaškodí, ale přínos bude minimální. Energie vynaložená na správnou konfiguraci sitemapy se na takových webech lépe investuje do obsahu nebo linkbuildingu.

Praktické pravidlo: Pokud má váš web méně než 50 stránek, dobré menu a alespoň několik zpětných odkazů, sitemap je příjemným bonusem. Pokud má více než 200 stránek, sitemap je nutnost.

Obsah sitemapy

Co do sitemapy patří a co ne

Do sitemapy patří pouze stránky, které fungují, jsou veřejně přístupné a chcete aby je Google zaindexoval. Každá URL která tuto podmínku nesplňuje, je v sitemapě na obtíž — zbytečně spotřebovává crawl budget a může Googlu vyslat zavádějící signály o struktuře webu.

Stránky které do sitemapy patří

  • Hlavní stránky webu — domovská stránka, O nás, Služby, Kontakt
  • Obsahové stránky — blogové články, případové studie, průvodce, newsroom
  • Produktové stránky e-shopu — každý produkt s unikátním obsahem
  • Kategorie s hodnotným obsahem — pokud mají vlastní popis a nejsou jen filtrem
  • Landing pages a kampaňové stránky — pokud jsou veřejně indexovatelné
  • Stránky s kódem 200 — stránka musí existovat a vracet úspěšnou odpověď

Stránky které do sitemapy nepatří

  • Přesměrované URL (301, 302) — Google přesměrování v sitemapě ignoruje, ale zbytečně plýtvá crawl budgetem
  • Stránky označené noindex — protimluv: říkáte Googlu ať stránku indexuje a zároveň ať ji neindexuje
  • Kanonické duplicity — stránky s canonical tagem odkazujícím na jinou URL
  • Stránky s chybou 404 nebo 5xx — nefunkční stránky nemají v sitemapě co dělat
  • Stránky za přihlášením — Google se na ně stejně nedostane
  • Prázdné nebo generované stránky bez obsahu — stránky vyhledávání, filtry bez textu

Sitemap a crawl budget — co se stane když to uděláte špatně

Crawl budget je ochota Googlebota váš web procházet. Každý web ho má přidělený v určité míře — velké weby s vysokou autoritou mají budget větší, malé weby menší. Pokud sitemap obsahuje stovky nefunkčních nebo přesměrovaných URL, Googlebot část svého budgetu spotřebuje na tyto zbytečné adresy a na váš hodnotný obsah mu zbyde méně.

Typický problém na e-shopech: filtrování produktů generuje URL jako /boty/?barva=cervena&velikost=42&razeni=cena. Takových kombinací mohou být tisíce. Pokud se všechny dostanou do sitemapy — ať už chybnou konfigurací pluginu nebo ručně — Googlebot prochází tisíce stránek s prakticky identickým obsahem místo toho, aby indexoval produkty samotné.

Příklad z praxe

E-shop s 800 produkty a špatně nakonfigurovaným filtrovacím systémem může mít v sitemapě 15 000 URL. Google Search Console pak ukazuje: odesláno 15 000 URL, zaindexováno 320. Problém není v obsahu produktů — problém je v tom, že Googlebot vyčerpá crawl budget na filtry a k samotným produktům se dostane méně často. Oprava: vyloučit parametrické URL z sitemapy a zablokovat je v robots.txt.

Tvorba sitemapy

Jak sitemapu vytvořit

Způsob tvorby sitemapy závisí na tom, na jakém systému web běží. Moderní CMS platformy sitemapu generují automaticky přes plugin nebo zabudovanou funkci. Vlastní řešení nebo statické weby vyžadují buď skript, nebo online generátor.

WordPress — Yoast SEO nebo Rank Math

WordPress je nejrozšířenější CMS a oba hlavní SEO pluginy sitemapu generují automaticky po instalaci. Výsledný soubor je dostupný na adrese https://vasedomena.cz/sitemap.xml nebo https://vasedomena.cz/sitemap_index.xml v závislosti na pluginu.

Yoast SEO

Yoast SEO

Generuje sitemap index rozdělený podle typů obsahu: stránky, příspěvky, kategorie, autoři. V nastavení lze jednoduše vyloučit konkrétní typy obsahu nebo jednotlivé stránky ze sitemapy. Propojení s Google Search Console je ruční — URL sitemapy zkopírujete a vložíte do GSC.

Vhodné pro weby se složitější obsahovou strukturou
Rank Math

Rank Math

Modernější alternativa s přímou integrací do Google Search Console — sitemapu odešlete přímo z administrace WordPressu bez nutnosti přihlašovat se do GSC zvlášť. Nabízí podrobnější nastavení co do sitemapy zahrnout včetně obrázků a videí. Ve výchozím nastavení generuje sitemapu hned po aktivaci.

Vhodné pro weby kde chcete vše řídit z jednoho místa
Pozor: WordPress od verze 5.5 generuje základní sitemapu nativně bez pluginu. Pokud ale používáte Yoast nebo Rank Math, jejich sitemap nativní přepíše. Zkontrolujte v prohlížeči adresu /sitemap.xml a ujistěte se, že vidíte sitemap ze správného zdroje.

Jiné redakční systémy

Většina moderních CMS platforem sitemapu buď generuje automaticky, nebo má k dispozici rozšíření:

  • Shoptet — sitemap generuje automaticky pro produkty, kategorie a stránky. URL bývá /sitemap.xml. Zkontrolujte v administraci sekci SEO nastavení.
  • Drupal — modul Simple XML Sitemap nebo XML Sitemap, oba dostupné zdarma na drupal.org
  • Joomla — plugin Xmap nebo OSMap, generují sitemap na základě struktury menu
  • Wix, Squarespace, Webflow — sitemap generují automaticky, URL bývá /sitemap.xml

Statický web nebo vlastní vývoj

Pokud web nemá CMS nebo běží na vlastním řešení, máte dvě možnosti:

Screaming Frog

Desktopový crawler pro Windows a macOS. Ve verzi zdarma projde až 500 URL. Spustíte crawl webu, vyfiltrujete HTML stránky s kódem 200 a exportujete seznam URL. Z tohoto exportu pak sitemapu sestavíte nebo ji přímo vygenerujete přes funkci Sitemaps v menu. Pro menší weby stačí bezplatná verze.

Online generátory

Nástroje jako xml-sitemaps.com nebo sitemap.xml generátor projdou web automaticky a soubor ke stažení připraví bez instalace software. Vhodné pro malé weby do 500 stránek. Nevýhodou je, že na stránky za přihlášením nebo v testovacím prostředí se nedostanou.

Jak ověřit sitemapu před odesláním

Před přidáním sitemapy do Google Search Console zkontrolujte její platnost. Nejjednodušší způsob je otevřít soubor v prohlížeči — moderní prohlížeče XML soubor zobrazí přehledně a případnou chybu ve struktuře odhalí hned. Pro důkladnější ověření použijte online XML validátor na adrese xml-sitemaps.com/validate-xml-sitemap.html.

  • Soubor se otevře bez chyby v prohlížeči — struktura XML je platná
  • Všechny URL začínají https:// — žádné relativní adresy
  • Doména ve všech URL odpovídá vaší produkční doméně — žádné testovací nebo stagingové URL
  • Soubor je dostupný na adrese /sitemap.xml bez přihlášení
  • Počet URL v souboru odpovídá očekávání — žádné přebytečné filtry nebo duplicity

Odeslání sitemapy

Jak sitemapu odeslat do Google, Seznamu a Bingu

Vyhledávač může sitemapu najít sám na standardní adrese /sitemap.xml, ale ruční odeslání přes webmaster nástroje proces výrazně urychlí a navíc vám dá přístup k statistikám o tom kolik URL bylo nalezeno a zaindexováno.

Google Search Console — postup krok za krokem

01
Přihlaste se do GSC
Otevřete search.google.com/search-console a vyberte svou doménu
02
Sekce Soubory Sitemap
V levém menu klikněte na položku Soubory Sitemap v sekci Indexování
03
Zadejte URL sitemapy
Do pole vložte relativní cestu — typicky sitemap.xml nebo sitemap_index.xml a klikněte Odeslat
04
Zkontrolujte výsledky
Po zpracování uvidíte počet odeslaných a zjištěných URL. Rozdíl signalizuje potenciální problém s kanonizací nebo noindex
Sitemapu jednou přidanou neodstraňujte ani znovu nepřidávejte. Google změny v souboru zjistí sám při příští návštěvě crawlera. Opětovné přidání stejné sitemapy nic neurychlí.

Seznam Webmaster Tools — postup

Pro český trh je SEO na Seznamu stále relevantní zejména v segmentech jako realitní trh, zpravodajství nebo lokální podnikání. Sitemapu do Seznamu odesíláte přes nástroj Seznam Webmaster Tools na adrese search.seznam.cz.

  • Přihlaste se účtem seznam.cz nebo přes propojené Google konto
  • Přidejte svou doménu a ověřte vlastnictví (meta tag, DNS záznam nebo soubor)
  • V sekci Sitemaps zadejte absolutní URL sitemapy včetně https://
  • Po zpracování uvidíte statistiky podobné jako v Google Search Console

Přidání do souboru robots.txt

Odkaz na sitemapu lze uvést přímo v souboru robots.txt. Tím zajistíte, že ji vyhledávač najde automaticky bez ručního zadání.

Do souboru robots.txt lze uvést více sitemap najednou — každou na samostatném řádku s direktivou Sitemap:. Využijete to například při oddělené sitemapě pro obrázky nebo videa.

Bing Webmaster Tools

Bing má v České republice marginální podíl, ale pokud cílíte na mezinárodní trh nebo podnikáte v segmentech kde Bing hraje roli (například B2B nebo anglický trh), sitemapu odesílejte i sem přes bing.com/webmasters. Postup je totožný s Google Search Console.

Pokročilá konfigurace

Sitemap index — kdy a jak rozdělit sitemapu na více souborů

Jeden soubor sitemap.xml smí obsahovat maximálně 50 000 URL a nesmí přesáhnout 50 MB v nekomprimované podobě. Pokud váš web tyto limity překračuje, je nutné sitemapu rozdělit a vytvořit sitemap index — zastřešující soubor, který na jednotlivé sitemapy odkazuje.

Jak sitemap index vypadá

Sitemap index je samostatný XML soubor s jiným kořenovým elementem než běžná sitemap. Místo <urlset> obsahuje <sitemapindex> a uvnitř odkazuje na jednotlivé soubory sitemap:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

  <sitemap>
    <loc>https://vasedomena.cz/sitemap-produkty.xml</loc>
    <lastmod>2026-04-01</lastmod>
  </sitemap>

  <sitemap>
    <loc>https://vasedomena.cz/sitemap-kategorie.xml</loc>
    <lastmod>2026-03-15</lastmod>
  </sitemap>

  <sitemap>
    <loc>https://vasedomena.cz/sitemap-blog.xml</loc>
    <lastmod>2026-04-10</lastmod>
  </sitemap>

</sitemapindex>

Best practices pro rozdělování sitemap

Rozdělujte podle jazykových mutací

Osvědčený přístup je mít samostatnou sitemapu pro každý každou jazykovou mutaci. Vyhledávač tak lépe chápe jaký jazyk odpovídá kterým URL adresám.

Nepřekračujte 10 000 URL na soubor

Technický limit je 50 000 URL, ale v praxi se osvědčuje limit 10 000 URL na jeden soubor. Menší soubory se rychleji generují, rychleji je crawler stáhne a v GSC se statistiky aktualizují přesněji.

Komprimujte velké sitemapy

Soubory sitemap.xml lze komprimovat algoritmem gzip (přípona .xml.gz). Komprimovaný soubor může být i 10× menší než originál — výhodné u sitemap s desítkami tisíc URL. Většina serverů gzip komprimaci zvládne automaticky.

Generujte jako statický soubor

Pokud váš CMS sitemapu generuje dynamicky při každém požadavku, zbytečně zatěžuje server a zpomaluje odpověď crawlera. Lepší přístup je sitemapu přegenerovat jako statický soubor pokaždé, když se obsah webu změní.

WordPress a pluginy: Yoast SEO i Rank Math automaticky vytvářejí sitemap index rozdělený podle typů obsahu. Adresa bývá /sitemap_index.xml u Yoastu nebo /sitemap.xml u Rank Math. Zkontrolujte v prohlížeči, který soubor váš web skutečně servíruje.

Rozšíření

Speciální typy sitemap — obrázky, videa a Google News

Kromě standardní XML sitemapy pro stránky existují specializované rozšíření pro obrázky, videa a zpravodajský obsah. Každé z nich umožňuje předat Googlu dodatečné informace o konkrétním typu obsahu, které by z HTML stránky sám nezískal nebo by jejich získání trvalo déle.

Obrázky

Sitemap pro obrázky

Umožňuje Googlu rychleji objevit obrázky na stránce a zahrnout je do Google Images. Obzvlášť užitečná pro fotografické weby, e-shopy s produktovými fotografiemi nebo weby kde obrázky tvoří hlavní obsah. Do elementu <url> přidáváte element <image:image> s adresou obrázku.

Více informací v dokumentaci Google pro image sitemaps.

Videa

Sitemap pro videa

Předává Googlu metadata o videích na stránce — název, popis, délku, URL náhledového obrázku. Pomáhá s indexací videí v Google Search a v záložce Video. Vyžaduje poměrně rozsáhlou strukturu elementů. Pro weby s YouTube videi vloženými přes iframe obvykle nestačí — Google vyžaduje přímý přístup k video souboru nebo sitemap s odpovídajícími metadaty.

Detaily v dokumentaci Google pro video sitemaps.

Zpravodajství

Sitemap pro Google News

Speciální formát pro zpravodajské weby registrované v Google News. Jedna sitemapa může obsahovat až 1 000 článků, ale musí jít o obsah ne starší dvou dnů. Starší články je nutné ze sitemapy průběžně odstraňovat. Vyžaduje element <news:news> s názvem média, jazykem a datem publikace. Bez registrace v Google News program nemá tato sitemap smysl.

Detaily v dokumentaci Google News sitemap.

Hreflang v sitemapě: Pro vícejazyčné weby lze propojení jazykových verzí řešit přes sitemapu místo HTML tagů. Přidáváte element <xhtml:link rel="alternate" hreflang="..."> ke každé URL. V praxi ale většina SEO specialistů preferuje implementaci hreflang přímo v HTML <head> — je snáze kontrolovatelná a méně náchylná k chybám.

Nejčastější omyl

Sitemap nestačí — rozdíl mezi tím, že Google stránku zná, a tím, že ji zaindexoval

Odeslaná sitemap nezaručuje indexaci. Je to jeden z nejčastějších omylů v SEO — weboví správci odešlou sitemapu do Google Search Console a čekají, že Google všechny stránky zaindexuje. Google ale stránku může znát měsíce a přesto ji nezařadit do indexu.

Co sitemap dělá

  • Říká Googlu, která URL na vašem webu existují
  • Naznačuje, kdy byl obsah naposledy změněn
  • Pomáhá crawlerovi efektivněji procházet velké weby
  • Urychluje objevení nových stránek

Co sitemap nedělá

  • Nezaručuje že Google stránku zaindexuje
  • Neovlivňuje pozici stránky ve výsledcích vyhledávání
  • Nenutí Google stránku pravidelně procházet
  • Nenahrazuje interní prolinkování ani kvalitu obsahu

Google se rozhoduje o indexaci na základě tří hlavních faktorů. Prvním je kvalita a unikátnost obsahu — stránky s tenkým, duplicitním nebo generickým obsahem Google záměrně do indexu nezařazuje i přesto, že v sitemapě jsou. Druhým faktorem je autorita stránky měřená počtem a kvalitou interních i zpětných odkazů. Stránka bez jediného odkazu má výrazně nižší šanci na indexaci. Třetím faktorem je crawl budget — zejména u menších webů má Google přidělený čas na procházení omezený a nemusí stihnout všechny URL ze sitemapy při každé návštěvě.

Jak zjistit proč Google stránku neindexuje

V Google Search Console otevřete sekci Indexování stránek. Klikněte na konkrétní URL přes nástroj Kontrola URL. Google vám sdělí aktuální stav stránky: zda ji zná, zda ji zaindexoval nebo proč ji nezařadil do indexu. Nejčastější důvody jsou:

  • Zjištěno — momentálně není zaindexováno — Google stránku vidí, ale nepovažuje ji za hodnotnou pro zařazení do indexu. Řešení: zlepšení obsahu, doplnění interních odkazů.
  • Duplicitní stránka bez kanonické verze — Google považuje stránku za duplicitu jiné. Řešení: canonical tag nebo sloučení obsahu.
  • Nenalezeno (404) — URL v sitemapě neexistuje nebo vrací chybu. Řešení: opravit URL nebo ze sitemapy odebrat.
  • Vyloučeno meta tagem robots — stránka má noindex. Řešení: zkontrolovat zda noindex nebyl přidán omylem.

Časté otázky

Časté otázky o sitemapě

Sitemap je soubor obsahující seznam URL adres vašeho webu. Říká vyhledávačům jako Google nebo Seznam, které stránky existují a kdy byly naposledy změněny. Usnadňuje a urychluje crawlování webu — robot nemusí procházet celý web přes interní odkazy, ale dostane přehled najednou. Nejpoužívanější formát je XML, standardně umístěný na adrese /sitemap.xml.
Pro malý web s desítkami stránek, dobrým interním prolinkováním a alespoň několika zpětnými odkazy sitemap není nutností — Google stránky najde sám. Sitemap ale nikomu neuškodí a její přidání trvá jen pár minut pokud používáte WordPress s Yoastem nebo Rank Mathem. Pokud web teprve spouštíte nebo nemá žádné zpětné odkazy, sitemap výrazně pomůže s počátečním indexováním.
Přihlaste se do Google Search Console na search.google.com/search-console. V levém menu klikněte na Soubory Sitemap v sekci Indexování. Do pole zadejte relativní cestu k souboru — typicky sitemap.xml nebo sitemap_index.xml — a klikněte Odeslat. Po zpracování uvidíte počet odeslaných a zjištěných URL. Sitemapu přidávejte jen jednou, opakované přidání nic neurychlí.
Google přesměrované URL ze sitemapy nezaindexuje — stránka s kódem 301 nebo 302 se do indexu dostane vždy jen v cílové podobě po přesměrování. Přesměrování v sitemapě ale zbytečně spotřebovává crawl budget: Googlebot přijde na URL, zjistí přesměrování, sleduje ho na cílovou adresu a celý proces mu zabere čas a kapacitu. V Google Search Console uvidíte tato URL ve stavu „Přesměrováno“. Odeberte je ze sitemapy a nahraďte finálními URL.
Otevřete Google Search Console a přejděte do sekce Soubory Sitemap. Zde uvidíte stav zpracování sitemapy a počet zjištěných URL. Poté zkontrolujte sekci Indexování stránek — pokud je rozdíl mezi odeslanými a zaindexovanými URL velký, klikněte na jednotlivé kategorie problémů a zjistěte proč stránky nebyly zaindexovány. Nejčastější příčiny jsou duplicitní obsah, noindex meta tag nebo příliš tenký obsah.
Yoast SEO i Rank Math aktualizují sitemapu automaticky pokaždé, když publikujete nebo upravíte stránku či příspěvek. Nemusíte nic dělat ručně. Sitemap je generována dynamicky nebo jako statický soubor v závislosti na konfiguraci pluginu. Pokud chcete mít jistotu, otevřete adresu /sitemap.xml nebo /sitemap_index.xml ve svém prohlížeči a zkontrolujte datum lastmod u posledního publikovaného obsahu.
Sitemap přímo pozice neovlivňuje. Není to rankingový faktor. Pomáhá ale s indexací — a stránka která není zaindexována, se ve výsledcích vůbec nezobrazí. Správně nakonfigurovaná sitemap tedy nepřímo přispívá k viditelnosti tím, že zajistí aby všechen hodnotný obsah byl v indexu. Samotné pozice pak závisí na kvalitě obsahu, zpětných odkazech a dalších faktorech.
Sitemap index je zastřešující soubor, který odkazuje na více dílčích souborů sitemap. Potřebujete ho ve dvou případech: pokud váš web překračuje limit 50 000 URL nebo 50 MB v jednom souboru, nebo pokud chcete sitemapu rozdělit podle typů obsahu (produkty, kategorie, blog) a sledovat statistiky indexace zvlášť pro každý typ. WordPress pluginy sitemap index vytvářejí automaticky — adresa bývá /sitemap_index.xml.

Řešíte problémy
s indexací nebo technickým SEO?

Sitemap je jen jeden díl technického SEO auditu. Pokud Google neindexuje vaše stránky nebo nevíte kde hledat příčinu, projdeme to společně.

Nezávazná konzultace
Samuel Krištof — CEO PŘESAH.agency

Autor článku

Samuel Krištof

CEO & CMO · PŘESAH.agency

SEO Online marketing Správa PPC Sociální sítě Emailing

Marketingu se věnuji od roku 2017. Začínal jsem ve Fajn skupině, kde jsem budoval komunity na Facebooku a záhy přešel k placeným kampaním — pod vedením Janči Skalkové jsem nasbíral základy, které používám dodnes. Postupně jsem se dostal k SEO, automatizacím a celkové správě marketingu. Dnes působím jako CEO agentury PŘESAH a zároveň jako externí CMO ve společnosti Bohemian Estates.

Obsah článku je ověřen vůči oficiální dokumentaci Google Search Central a specifikaci sitemaps.org.

Odkud čerpáme

Zdroje

Obsah stránky vychází z těchto oficiálních a odborných zdrojů:

Přejít nahoru