Technické SEO · Slovník pojmů
Duplicitní obsah:
co to je a jak ho opravit
Duplicitní obsah je situace, kdy se stejný nebo velmi podobný text vyskytuje na více URL adresách zároveň. Google si pak sám vybírá, kterou verzi zobrazí ve výsledcích — a nemusí to být ta, kterou chcete vy.
Definice
Co je duplicitní obsah
Duplicitní obsah vzniká tehdy, když se totožný nebo velmi podobný text vyskytuje na více různých URL adresách současně. Může jít o stránky v rámci jednoho webu, nebo o obsah zkopírovaný mezi různými doménami. Vyvarovat se duplicitnímu obsahu je základní součástí kvalitního on-page SEO
Rozlišujeme dva základní typy:
Interní duplicita
Duplicitní stránky existují v rámci jednoho webu. Nejčastější případ — například produktová stránka e-shopu dostupná zároveň přes eshop.cz/produkt i eshop.cz/kategorie/produkt. Interní duplicita je řešitelná technicky, obvykle canonical tagem nebo přesměrováním.
Externí duplicita
Stejný obsah existuje na více různých doménách. Může jít o záměrné sdílení obsahu (syndikace), nebo o neoprávněné zkopírování. Google se pokusí identifikovat originál a zobrazit ho přednostně, ale nemusí se mu to vždy podařit.
Příčiny
Jak duplicitní obsah vzniká
Naprostá většina duplicit vzniká neúmyslně — jako vedlejší efekt technického nastavení webu nebo CMS. Níže jsou příčiny seřazené podle dopadu na SEO od nejvyššího po nejnižší.
Technické příčiny s nejvyšším dopadem
| Příčina | Co konkrétně vzniká | Dopad |
|---|---|---|
| HTTP vs. HTTPS bez přesměrování | Web dostupný na obou protokolech jako dvě různé entity | Rozmělnění zpětných odkazů, nesprávná kanonická URL v indexu |
| www vs. non-www bez přesměrování | www.eshop.cz a eshop.cz jako dvě samostatné domény |
Stejný jako HTTP/HTTPS — Google vidí dva weby |
| Parametry URL (UTM, filtry, řazení) | Stovky až tisíce URL s totožným obsahem, lišící se pouze parametrem | Masivní plýtvání crawl budgetem, zejména u e-shopů |
| Session ID v URL | Každý uživatel dostane unikátní URL pro tutéž stránku | Extrémní fragmentace indexu, obtížně detekovatelné |
Koncové lomítko (/produkt vs. /produkt/) |
Dvě adresy pro totéž | Nižší dopad, ale zbytečně dělí zpětné odkazy |
Příčiny v CMS a e-shopech
E-shopy jsou na duplicitní obsah nejnáchylnější. Každá kombinace filtrů (barva + velikost + řazení) vytvoří novou URL se stejným nebo velmi podobným obsahem. Web s 500 produkty a třemi filtrovacími parametry může teoreticky vygenerovat desetitisíce duplicitních stránek.
Dalšími typickými příčinami v CMS jsou automaticky generované stránky pro každý tag nebo kategorii, samostatné stránky pro každý nahraný obrázek (WordPress přílohy), stránkování komentářů a tiskové verze článků.
Příčiny při správě obsahu
Do této kategorie patří weby dostupné na více doménách (například po rebrandingu bez správného přesměrování), tiskové verze stránek na samostatných URL a v mezinárodním prostředí chybně nastavený hreflang — kdy jsou jazykové varianty stránky s totožným textem indexovány jako duplicity místo jako alternativy.
Mechanismus
Jak Google nakládá s duplicitním obsahem
Když Google narazí na více stránek se stejným nebo velmi podobným obsahem, spustí proces zvaný kanonizace — ze skupiny duplicitních URL vybere jednu, kterou označí jako hlavní (kanonickou) a bude ji zobrazovat ve výsledcích vyhledávání.
Podle čeho Google vybírá kanonickou URL
Google při výběru kanonické URL sleduje několik signálů, které mu web poskytuje. Podle Google Search Central dokumentace (aktualizace prosinec 2025) jde o tyto faktory v pořadí od nejsilnějšího:
Proč Google ignoruje váš canonical tag
Canonical tag není příkaz — je to doporučení. Google ho může ignorovat, pokud ostatní signály na webu odporují tomu, co canonical říká. Nejčastější situace, kdy se to stává:
Nekonzistentní interní odkazy
Canonical ukazuje na verzi A, ale 90 % interních odkazů vede na verzi B. Google preferuje verzi B, protože ji web konzistentně odkazuje.
Canonical na stránce s noindex
Kombinace canonical a noindex na téže stránce je protichůdná. Google takový canonical ignoruje — preferovanou URL nelze zároveň vyjmout z indexu.
Více canonical tagů na jedné stránce
Pokud stránka obsahuje dva canonical tagy (například jeden v šabloně a druhý přidaný pluginem), Google ignoruje oba.
Canonical na obsahově odlišnou stránku
Canonical musí odkazovat na stránku s velmi podobným obsahem. Pokud canonical míří na stránku s jiným textem, Google ho odmítne.
Dopady
Dopad duplicitního obsahu na SEO
Google za běžné duplicity nepenalizuje — ale to neznamená, že jsou bezproblémové. Duplicitní obsah způsobuje tři konkrétní SEO problémy, které se projeví na výkonu webu i bez jakékoliv penalizace.
Rozmělnění hodnoty zpětných odkazů
Pokud na různé URL verze téže stránky vedou zpětné odkazy z jiných webů, jejich hodnota se rozděluje mezi tyto adresy místo aby se soustředila na jednu. Jednoduchý příklad: máte 10 zpětných odkazů, z nichž 6 míří na eshop.cz/produkt a 4 na www.eshop.cz/produkt. Sjednocením těchto URL pomocí přesměrování získáte efekt 10 odkazů na jednom místě — bez jediného nového odkazu zvenčí.
Crawl budget — kdy je to skutečný problém
Pojem crawl budget označuje počet stránek, které Googlebot na vašem webu prochází za určité časové období. Pro malé weby do tisíce stránek crawl budget většinou není problém. U e-shopů s desítkami tisíc produktů a aktivními filtry může duplicitní obsah spotřebovat 30–50 % crawl budgetu na stránky, které nikdy nebudou v indexu.
Praktický dopad: nové produkty nebo kategorie se indexují se zpožděním dni až týdny, protože Googlebot tráví čas procházením stovek duplicitních filtrovaných stránek.
Zmatení Googlu při výběru kanonické URL v SERP
Pokud Google nedostane jasné instrukce, vybere kanonickou URL sám — a nemusí to být ta, kterou chcete. Ve výsledcích vyhledávání se pak může zobrazovat URL s UTM parametry (?utm_source=newsletter), URL s číslem stránky (/produkty?page=2) nebo jiná „ošklivá“ varianta, na kterou uživatelé klikají méně.
Mýtus vs. realita
Existuje penalizace za duplicitní obsah?
Za běžný, technicky vzniklý duplicitní obsah Google nepenalizuje. Google to opakovaně potvrdil a je to zakotveno i v jeho oficiální dokumentaci: duplicita sama o sobě není porušením pravidel pro spam.
To ale neznamená, že jsou duplicity neškodné. Rozdíl je v tom, co způsobují — ne penalizaci, ale neefektivitu: rozmělnění odkazového profilu, plýtvání crawl budgetem a zobrazení nežádoucí URL ve výsledcích vyhledávání.
Kdy penalizace skutečně hrozí
Google zasáhne ve chvíli, kdy duplicitní obsah vzniká záměrně za účelem manipulace s výsledky vyhledávání. Konkrétní příklady ze Spam Update z září 2025:
Doorway pages
Stovky stránek cílící na různá klíčová slova s minimálně upraveným textem — typicky lokální stránky se šablonou „SEO Praha“, „SEO Brno“, „SEO Ostrava“ bez unikátního obsahu.
Masivní scraping
Hromadné přebírání obsahu z jiných webů bez přidané hodnoty — zejména v affiliate marketingu, kdy web publikuje produktové popisy výrobce bez jakékoliv vlastní úpravy.
Detekce
Jak najít duplicitní obsah na svém webu
Nejrychlejší vstupní bod je Google Search Console. Pro hloubkový audit pak poslouží crawlovací nástroje, které prochází celý web a exportují data o duplicitách v přehledné tabulce.
Google Search Console — krok za krokem
V Google Search Console přejděte do sekce Indexování > Stránky. Tato zpráva zobrazuje všechny URL vašeho webu rozdělené do čtyř stavových skupin. Pro detekci duplicit hledejte ve skupině Nevybraná kanonická stránka tyto konkrétní statusy:
| Status v GSC | Co znamená | Co dělat |
|---|---|---|
| Duplikát bez canonical tagu určeného uživatelem | Google našel duplicitní stránky, ale žádná z nich nemá canonical tag. Google si vybral kanonickou verzi sám. | Zkontrolujte, kterou URL Google zvolil. Pokud je správná, přidejte canonical tag, aby byl výběr konzistentní. Pokud není správná, přidejte canonical na preferovanou URL. |
| Duplikát: Google zvolil jinou než uživatelem určenou kanonickou stránku | Máte canonical tag, ale Google ho ignoroval a zvolil jinou URL. Stránka může být stále indexována. | Zkontrolujte konzistenci interních odkazů a sitemapů. Oba by měly konzistentně odkazovat na verzi, kterou chcete jako kanonickou. |
| Alternativní stránka se správnou kanonickou značkou | Stránka je duplikát, ale canonical tag ukazuje správně. Google situaci rozumí. | Zpravidla není nutný zásah — vše funguje správně. |
SEO crawlovací nástroje
Pro e-shopy nebo weby nad 1 000 stránek je ruční kontrola v GSC nedostatečná. Nástroje jako Screaming Frog, Ahrefs Site Audit nebo Semrush Site Audit projdou celý web a identifikují:
Duplicitní title tagy a meta popisky
Rychlý indikátor duplicitního obsahu — pokud mají dvě stránky totožný title, text bývá velmi podobný nebo identický.
Nesprávné nebo chybějící canonical tagy
Nástroj zobrazí, které stránky canonical tag nemají, které ho mají na nesprávnou URL a kde jsou canonical tagy v konfliktu.
Parametrizované URL
Export všech URL s parametry odhalí, kolik duplicitních variant generují filtry, řazení nebo UTM parametry ponechané v interních odkazech.
Rychlá manuální kontrola
Zadejte do Google vyhledávání unikátní větu z vašeho článku nebo produktového popisu v uvozovkách — například "Přesné znění věty z vaší stránky". Pokud se zobrazí více výsledků se stejným textem, máte externí duplicitu nebo obsah byl zkopírován na jiný web.
Řešení
Jak opravit duplicitní obsah
Správné řešení závisí na příčině duplicity. Použití canonical tagu tam, kde je potřeba přesměrování, nebo naopak — to jsou nejčastější chyby, které situaci nezlepší. Tabulka níže ukazuje, kdy použít které řešení.
| Situace | Doporučené řešení | Kdy nepoužívat |
|---|---|---|
| Dvě URL s totožným obsahem, jedna má přestat existovat | Přesměrování 301 ze staré URL na novou | Pokud obě URL musí zůstat dostupné pro uživatele (např. filtrovaná stránka e-shopu) |
| Filtrované nebo řazené stránky e-shopu s totožným obsahem | Canonical tag na hlavní kategorii nebo produkt; filtry přes URL parametry bez indexace | Pokud filtrovaná stránka cílí na unikátní KW (pak ji optimalizujte jako samostatnou stránku) |
| HTTP vs. HTTPS nebo www vs. non-www | Přesměrování 301 na preferovanou verzi + canonical tag jako záloha | Nikdy nepoužívejte jen canonical bez přesměrování — přesměrování je silnější signál |
| Stránka dostupná, ale nechcete ji v indexu (tiskové verze, děkovací stránky) | Noindex tag | Pokud chcete, aby stránka přenášela odkazový profil — noindex nepřenáší link equity na kanonickou verzi |
| Obsah syndikovaný na jiné weby (legálně) | Požádejte publishery o canonical tag ukazující zpět na váš originál | Pokud publisher odmítá, zvažte, zda syndikace nepřináší více škody než užitku |
| Zkopírovaný obsah bez vašeho souhlasu | Zdvořilá výzva k odstranění nebo přidání odkazu; při neúspěchu DMCA stížnost | Právní kroky zpravidla nejsou první krok — ve většině případů majitel webu o krádeži ani nevěděl |
Canonical tag — jak ho správně použít
Canonical tag se vkládá do sekce <head> duplicitní stránky a odkazuje na preferovanou URL. Klíčová pravidla podle Google Search Central dokumentace:
Správně
- Vždy používejte absolutní URL (s protokolem a doménou)
- Jeden canonical tag na stránku — více tagů způsobí, že Google ignoruje všechny
- Canonical musí ukazovat na stránku s velmi podobným nebo totožným obsahem
- Konzistentně odkazujte interními odkazy na kanonickou verzi
Chybně
- ✗ Canonical na stránce s noindex — protichůdné instrukce, Google ignoruje canonical
- ✗ Canonical na obsahově odlišnou stránku — Google ho odmítne
- ✗ Canonical ukazující na stránku vrácenou s chybou 404 nebo na přesměrování
- ✗ Canonical z kategorie na featured produkt (kategorie pak zmizí z indexu)
Časté otázky
Nejčastější otázky o duplicitním obsahu
Technické SEO
Nevíte, kolik duplicit
skrývá váš web?
V rámci technického SEO auditu projdeme celý web, identifikujeme duplicitní stránky a navrhneme konkrétní řešení.
Zdroje
Zdroje a reference
Článek byl naposledy aktualizován . Obsah vychází z následujících zdrojů:
- Google Search Central — What is URL Canonicalization · developers.google.com · přístup 14. 4. 2026
- Google Search Central — Consolidate duplicate URLs · developers.google.com · přístup 14. 4. 2026
- Google Search Central Blog — 5 common mistakes with rel=canonical · developers.google.com · přístup 14. 4. 2026
- Ahrefs Blog — Duplicate Content: What It Is & How to Fix It · ahrefs.com · přístup 14. 4. 2026
- Semrush Blog — Canonical URL: A Guide for SEOs · semrush.com · přístup 14. 4. 2026