Technické SEO · Slovník pojmů

Duplicitní obsah:
co to je a jak ho opravit

Duplicitní obsah je situace, kdy se stejný nebo velmi podobný text vyskytuje na více URL adresách zároveň. Google si pak sám vybírá, kterou verzi zobrazí ve výsledcích — a nemusí to být ta, kterou chcete vy.

Chci prověřit svůj web Číst článek ↓

25–30 %

obsahu na internetu je v nějaké formě duplicitní (Ahrefs, 2024)

40 %+

crawl budgetu může spotřebovat duplicitní obsah na středně velkém e-shopu

hlavní metody nápravy: canonical tag, přesměrování 301 a noindex

Obsah článku

Co je duplicitní obsah
Jak duplicitní obsah vzniká
Jak Google nakládá s duplicitami
Dopad duplicitního obsahu na SEO

Existuje penalizace za duplicitní obsah?
Jak najít duplicitní obsah na webu
Jak opravit duplicitní obsah
Časté otázky

Definice

Co je duplicitní obsah

Duplicitní obsah vzniká tehdy, když se totožný nebo velmi podobný text vyskytuje na více různých URL adresách současně. Může jít o stránky v rámci jednoho webu, nebo o obsah zkopírovaný mezi různými doménami. Vyvarovat se duplicitnímu obsahu je základní součástí kvalitního on-page SEO

Rozlišujeme dva základní typy:

Interní duplicita

Duplicitní stránky existují v rámci jednoho webu. Nejčastější případ — například produktová stránka e-shopu dostupná zároveň přes eshop.cz/produkt i eshop.cz/kategorie/produkt. Interní duplicita je řešitelná technicky, obvykle canonical tagem nebo přesměrováním.

Externí duplicita

Stejný obsah existuje na více různých doménách. Může jít o záměrné sdílení obsahu (syndikace), nebo o neoprávněné zkopírování. Google se pokusí identifikovat originál a zobrazit ho přednostně, ale nemusí se mu to vždy podařit.

Poznámka: Duplicita se neposuzuje jen podle identického textu. Google hodnotí, zda je primární obsah stránky stejný. Stránky s odlišnými záhlavími, patičkami nebo navigací, ale totožným tělem textu, jsou pro Google duplicitní.

Příčiny

Jak duplicitní obsah vzniká

Naprostá většina duplicit vzniká neúmyslně — jako vedlejší efekt technického nastavení webu nebo CMS. Níže jsou příčiny seřazené podle dopadu na SEO od nejvyššího po nejnižší.

Technické příčiny s nejvyšším dopadem

Příčina	Co konkrétně vzniká	Dopad
HTTP vs. HTTPS bez přesměrování	Web dostupný na obou protokolech jako dvě různé entity	Rozmělnění zpětných odkazů, nesprávná kanonická URL v indexu
www vs. non-www bez přesměrování	`www.eshop.cz` a `eshop.cz` jako dvě samostatné domény	Stejný jako HTTP/HTTPS — Google vidí dva weby
Parametry URL (UTM, filtry, řazení)	Stovky až tisíce URL s totožným obsahem, lišící se pouze parametrem	Masivní plýtvání crawl budgetem, zejména u e-shopů
Session ID v URL	Každý uživatel dostane unikátní URL pro tutéž stránku	Extrémní fragmentace indexu, obtížně detekovatelné
Koncové lomítko (`/produkt` vs. `/produkt/`)	Dvě adresy pro totéž	Nižší dopad, ale zbytečně dělí zpětné odkazy

Příčiny v CMS a e-shopech

E-shopy jsou na duplicitní obsah nejnáchylnější. Každá kombinace filtrů (barva + velikost + řazení) vytvoří novou URL se stejným nebo velmi podobným obsahem. Web s 500 produkty a třemi filtrovacími parametry může teoreticky vygenerovat desetitisíce duplicitních stránek.

Dalšími typickými příčinami v CMS jsou automaticky generované stránky pro každý tag nebo kategorii, samostatné stránky pro každý nahraný obrázek (WordPress přílohy), stránkování komentářů a tiskové verze článků.

Příklad z praxe: Při auditu jednoho klienta prodávajícího produkty zdravého životního stylu jsme zjistili, že jeho WordPress automaticky vytvářel samostatnou stránku pro každý obrázek produktu. Výsledek: přes 40 % crawl budgetu spotřebovávaly stránky, které nikdo nikdy nepotřeboval indexovat.

Příčiny při správě obsahu

Do této kategorie patří weby dostupné na více doménách (například po rebrandingu bez správného přesměrování), tiskové verze stránek na samostatných URL a v mezinárodním prostředí chybně nastavený hreflang — kdy jsou jazykové varianty stránky s totožným textem indexovány jako duplicity místo jako alternativy.

Mechanismus

Jak Google nakládá s duplicitním obsahem

Když Google narazí na více stránek se stejným nebo velmi podobným obsahem, spustí proces zvaný kanonizace — ze skupiny duplicitních URL vybere jednu, kterou označí jako hlavní (kanonickou) a bude ji zobrazovat ve výsledcích vyhledávání.

Podle čeho Google vybírá kanonickou URL

Google při výběru kanonické URL sleduje několik signálů, které mu web poskytuje. Podle Google Search Central dokumentace (aktualizace prosinec 2025) jde o tyto faktory v pořadí od nejsilnějšího:

Přesměrování 301

Nejsilnější signál. Cílová URL přesměrování se stane kanonickou.

Canonical tag

Silný signál, ale pouze doporučení — Google ho nemusí respektovat.

Sitemap

Slabý signál. URL v sitemapě preferuje Google jako kanonické.

Interní prolinkování

Konzistentní interní odkaz na jednu verzi URL posiluje její autoritu.

Proč Google ignoruje váš canonical tag

Canonical tag není příkaz — je to doporučení. Google ho může ignorovat, pokud ostatní signály na webu odporují tomu, co canonical říká. Nejčastější situace, kdy se to stává:

Nekonzistentní interní odkazy

Canonical ukazuje na verzi A, ale 90 % interních odkazů vede na verzi B. Google preferuje verzi B, protože ji web konzistentně odkazuje.

Canonical na stránce s noindex

Kombinace canonical a noindex na téže stránce je protichůdná. Google takový canonical ignoruje — preferovanou URL nelze zároveň vyjmout z indexu.

Více canonical tagů na jedné stránce

Pokud stránka obsahuje dva canonical tagy (například jeden v šabloně a druhý přidaný pluginem), Google ignoruje oba.

Canonical na obsahově odlišnou stránku

Canonical musí odkazovat na stránku s velmi podobným obsahem. Pokud canonical míří na stránku s jiným textem, Google ho odmítne.

Klíčové: Google v Google Search Console hlásí stav „Duplikát: Google zvolil jinou než uživatelem určenou kanonickou stránku.“ Tento stav sám o sobě neznamená problém — stránka může být indexována. Problém nastává, pokud Google zvolí jako kanonickou verzi URL s nežádoucími parametry nebo „ošklivou“ adresou, která pak figuruje ve výsledcích vyhledávání.

Dopady

Dopad duplicitního obsahu na SEO

Google za běžné duplicity nepenalizuje — ale to neznamená, že jsou bezproblémové. Duplicitní obsah způsobuje tři konkrétní SEO problémy, které se projeví na výkonu webu i bez jakékoliv penalizace.

Rozmělnění hodnoty zpětných odkazů

Pokud na různé URL verze téže stránky vedou zpětné odkazy z jiných webů, jejich hodnota se rozděluje mezi tyto adresy místo aby se soustředila na jednu. Jednoduchý příklad: máte 10 zpětných odkazů, z nichž 6 míří na eshop.cz/produkt a 4 na www.eshop.cz/produkt. Sjednocením těchto URL pomocí přesměrování získáte efekt 10 odkazů na jednom místě — bez jediného nového odkazu zvenčí.

Crawl budget — kdy je to skutečný problém

Pojem crawl budget označuje počet stránek, které Googlebot na vašem webu prochází za určité časové období. Pro malé weby do tisíce stránek crawl budget většinou není problém. U e-shopů s desítkami tisíc produktů a aktivními filtry může duplicitní obsah spotřebovat 30–50 % crawl budgetu na stránky, které nikdy nebudou v indexu.

Praktický dopad: nové produkty nebo kategorie se indexují se zpožděním dni až týdny, protože Googlebot tráví čas procházením stovek duplicitních filtrovaných stránek.

Zmatení Googlu při výběru kanonické URL v SERP

Pokud Google nedostane jasné instrukce, vybere kanonickou URL sám — a nemusí to být ta, kterou chcete. Ve výsledcích vyhledávání se pak může zobrazovat URL s UTM parametry (?utm_source=newsletter), URL s číslem stránky (/produkty?page=2) nebo jiná „ošklivá“ varianta, na kterou uživatelé klikají méně.

Mýtus vs. realita

Existuje penalizace za duplicitní obsah?

Za běžný, technicky vzniklý duplicitní obsah Google nepenalizuje. Google to opakovaně potvrdil a je to zakotveno i v jeho oficiální dokumentaci: duplicita sama o sobě není porušením pravidel pro spam.

To ale neznamená, že jsou duplicity neškodné. Rozdíl je v tom, co způsobují — ne penalizaci, ale neefektivitu: rozmělnění odkazového profilu, plýtvání crawl budgetem a zobrazení nežádoucí URL ve výsledcích vyhledávání.

Kdy penalizace skutečně hrozí

Google zasáhne ve chvíli, kdy duplicitní obsah vzniká záměrně za účelem manipulace s výsledky vyhledávání. Konkrétní příklady ze Spam Update z září 2025:

Doorway pages

Stovky stránek cílící na různá klíčová slova s minimálně upraveným textem — typicky lokální stránky se šablonou „SEO Praha“, „SEO Brno“, „SEO Ostrava“ bez unikátního obsahu.

Masivní scraping

Hromadné přebírání obsahu z jiných webů bez přidané hodnoty — zejména v affiliate marketingu, kdy web publikuje produktové popisy výrobce bez jakékoliv vlastní úpravy.

Shrnutí: Pokud vznikají duplicity jako vedlejší efekt CMS nebo technického nastavení, Google vás netlačí dolů. Pokud duplicity záměrně vytváříte proto, abyste obsadili více pozic ve výsledcích, Google to označí jako spam a stránky mohou zcela zmizet z indexu.

Detekce

Jak najít duplicitní obsah na svém webu

Nejrychlejší vstupní bod je Google Search Console. Pro hloubkový audit pak poslouží crawlovací nástroje, které prochází celý web a exportují data o duplicitách v přehledné tabulce.

Google Search Console — krok za krokem

V Google Search Console přejděte do sekce Indexování > Stránky. Tato zpráva zobrazuje všechny URL vašeho webu rozdělené do čtyř stavových skupin. Pro detekci duplicit hledejte ve skupině Nevybraná kanonická stránka tyto konkrétní statusy:

Status v GSC	Co znamená	Co dělat
Duplikát bez canonical tagu určeného uživatelem	Google našel duplicitní stránky, ale žádná z nich nemá canonical tag. Google si vybral kanonickou verzi sám.	Zkontrolujte, kterou URL Google zvolil. Pokud je správná, přidejte canonical tag, aby byl výběr konzistentní. Pokud není správná, přidejte canonical na preferovanou URL.
Duplikát: Google zvolil jinou než uživatelem určenou kanonickou stránku	Máte canonical tag, ale Google ho ignoroval a zvolil jinou URL. Stránka může být stále indexována.	Zkontrolujte konzistenci interních odkazů a sitemapů. Oba by měly konzistentně odkazovat na verzi, kterou chcete jako kanonickou.
Alternativní stránka se správnou kanonickou značkou	Stránka je duplikát, ale canonical tag ukazuje správně. Google situaci rozumí.	Zpravidla není nutný zásah — vše funguje správně.

SEO crawlovací nástroje

Pro e-shopy nebo weby nad 1 000 stránek je ruční kontrola v GSC nedostatečná. Nástroje jako Screaming Frog, Ahrefs Site Audit nebo Semrush Site Audit projdou celý web a identifikují:

Duplicitní title tagy a meta popisky

Rychlý indikátor duplicitního obsahu — pokud mají dvě stránky totožný title, text bývá velmi podobný nebo identický.

Nesprávné nebo chybějící canonical tagy

Nástroj zobrazí, které stránky canonical tag nemají, které ho mají na nesprávnou URL a kde jsou canonical tagy v konfliktu.

Parametrizované URL

Export všech URL s parametry odhalí, kolik duplicitních variant generují filtry, řazení nebo UTM parametry ponechané v interních odkazech.

Rychlá manuální kontrola

Zadejte do Google vyhledávání unikátní větu z vašeho článku nebo produktového popisu v uvozovkách — například "Přesné znění věty z vaší stránky". Pokud se zobrazí více výsledků se stejným textem, máte externí duplicitu nebo obsah byl zkopírován na jiný web.

Řešení

Jak opravit duplicitní obsah

Správné řešení závisí na příčině duplicity. Použití canonical tagu tam, kde je potřeba přesměrování, nebo naopak — to jsou nejčastější chyby, které situaci nezlepší. Tabulka níže ukazuje, kdy použít které řešení.

Situace	Doporučené řešení	Kdy nepoužívat
Dvě URL s totožným obsahem, jedna má přestat existovat	Přesměrování 301 ze staré URL na novou	Pokud obě URL musí zůstat dostupné pro uživatele (např. filtrovaná stránka e-shopu)
Filtrované nebo řazené stránky e-shopu s totožným obsahem	Canonical tag na hlavní kategorii nebo produkt; filtry přes URL parametry bez indexace	Pokud filtrovaná stránka cílí na unikátní KW (pak ji optimalizujte jako samostatnou stránku)
HTTP vs. HTTPS nebo www vs. non-www	Přesměrování 301 na preferovanou verzi + canonical tag jako záloha	Nikdy nepoužívejte jen canonical bez přesměrování — přesměrování je silnější signál
Stránka dostupná, ale nechcete ji v indexu (tiskové verze, děkovací stránky)	Noindex tag	Pokud chcete, aby stránka přenášela odkazový profil — noindex nepřenáší link equity na kanonickou verzi
Obsah syndikovaný na jiné weby (legálně)	Požádejte publishery o canonical tag ukazující zpět na váš originál	Pokud publisher odmítá, zvažte, zda syndikace nepřináší více škody než užitku
Zkopírovaný obsah bez vašeho souhlasu	Zdvořilá výzva k odstranění nebo přidání odkazu; při neúspěchu DMCA stížnost	Právní kroky zpravidla nejsou první krok — ve většině případů majitel webu o krádeži ani nevěděl

Canonical tag — jak ho správně použít

Canonical tag se vkládá do sekce <head> duplicitní stránky a odkazuje na preferovanou URL. Klíčová pravidla podle Google Search Central dokumentace:

Správně

Vždy používejte absolutní URL (s protokolem a doménou)
Jeden canonical tag na stránku — více tagů způsobí, že Google ignoruje všechny
Canonical musí ukazovat na stránku s velmi podobným nebo totožným obsahem
Konzistentně odkazujte interními odkazy na kanonickou verzi

Chybně

✗ Canonical na stránce s noindex — protichůdné instrukce, Google ignoruje canonical
✗ Canonical na obsahově odlišnou stránku — Google ho odmítne
✗ Canonical ukazující na stránku vrácenou s chybou 404 nebo na přesměrování
✗ Canonical z kategorie na featured produkt (kategorie pak zmizí z indexu)

Časté otázky

Nejčastější otázky o duplicitním obsahu

Za běžný, technicky vzniklý duplicitní obsah Google nepenalizuje. Penalizace hrozí pouze tehdy, když duplicity vznikají záměrně za účelem manipulace s výsledky vyhledávání — například stovky šablonových stránek s minimálně upraveným textem nebo masivní scraping obsahu jiných webů. Běžné technické duplicity (www vs. non-www, parametry URL, filtry e-shopu) jsou standardní situací a Google je řeší kanonizací bez postižení webu.

Canonical tag je HTML element vložený do sekce <head> stránky, který Googlu říká, která URL je preferovaná verze obsahu. Použijte ho tehdy, když potřebujete zachovat více URL dostupných pro uživatele, ale chcete, aby Google jako hlavní bral jen jednu — typicky u filtrovaných stránek e-shopu, tiskových verzí nebo stránek dostupných přes více URL variant. Pokud stará URL může přestat existovat úplně, silnějším signálem je přesměrování 301.

Nejrychlejší způsob je zkontrolovat v Google Search Console sekci Indexování > Stránky a filtrovat skupinu „Nevybraná kanonická stránka“. Statusy „Duplikát bez canonical tagu“ a „Duplikát: Google zvolil jinou kanonickou než uživatel“ přímo ukazují na duplicity. Pro hloubkovou analýzu použijte crawlovací nástroj jako Screaming Frog nebo Ahrefs Site Audit, které odhalí duplicitní title tagy, chybějící canonical tagy a parametrizované URL napříč celým webem.

Ano, syndikovaný obsah je z pohledu Googlu duplicitní — stejný text existuje na více doménách. Google se pokusí identifikovat originál a zobrazit ho přednostně, ale nemusí se to vždy podařit, zejména pokud je syndikující web autoritativnější. Standardním řešením je požádat publishery o vložení canonical tagu ukazujícího zpět na váš originál. Pokud to není možné, zvažte, zda hodnota syndikace (dosah, brand awareness) převyšuje riziko, že Google upřednostní cizí verzi.

Ano, a je to jeden z nejvýznamnějších praktických dopadů duplicit. Googlebot má omezený crawl budget — pokud ho spotřebují duplicitní stránky (filtry, stránky příloh, parametrizované URL), na nové a aktualizované stránky zbyde méně kapacity. U e-shopů s tisíci produkty to může znamenat, že nové produkty se v indexu objeví se zpožděním dnů až týdnů. Řešení: noindex na stránky bez obsahu (přílohy, tiskové verze) a canonical tag na filtrované stránky.

Prvním krokem je zdvořilá výzva majiteli webu — v mnoha případech ani neví, že publikuje ukradený obsah (zaplatil „copywriterovi“, který ho zkopíroval). Uveďte jasný termín reakce. Pokud výzva neúspěšná, podejte DMCA stížnost přes Google Search Console (Odebrat URL není správný postup — použijte formulář pro nahlášení porušení autorských práv). Pro dokumentaci původu obsahu využijte screenshoty z Google Analytics nebo Internet Archive Wayback Machine, které prokáží starší datum publikace.

Technické SEO

Nevíte, kolik duplicit
skrývá váš web?

V rámci technického SEO auditu projdeme celý web, identifikujeme duplicitní stránky a navrhneme konkrétní řešení.

Nezávazná poptávka

Autor článku

Samuel Krištof

CEO & CMO · PŘESAH.agency

SEO Online marketing Správa PPC Sociální sítě Emailing

Marketingu se věnuji od roku 2017. Začínal jsem ve Fajn skupině, kde jsem budoval komunity na Facebooku a záhy přešel k placeným kampaním — pod vedením Janči Skalkové jsem nasbíral základy, které používám dodnes. Postupně jsem se dostal k SEO, automatizacím a celkové správě marketingu. Dnes působím jako CEO agentury PŘESAH a zároveň jako externí CMO ve společnosti Bohemian Estates.

Obsah článku je ověřen vůči oficiálním zdrojům Google Search Central a Ahrefs.

Zdroje

Zdroje a reference

Článek byl naposledy aktualizován 14. dubna 2026. Obsah vychází z následujících zdrojů:

Google Search Central — What is URL Canonicalization · developers.google.com · přístup 14. 4. 2026
Google Search Central — Consolidate duplicate URLs · developers.google.com · přístup 14. 4. 2026
Google Search Central Blog — 5 common mistakes with rel=canonical · developers.google.com · přístup 14. 4. 2026
Ahrefs Blog — Duplicate Content: What It Is & How to Fix It · ahrefs.com · přístup 14. 4. 2026
Semrush Blog — Canonical URL: A Guide for SEOs · semrush.com · přístup 14. 4. 2026

Duplicitní obsah:co to je a jak ho opravit