Magazín ze světa digitálního marketingu
Pozadí vlevo Pozadí vpravo

Sitemap.xml – kompletní návod, jak na mapu stránek

Potýkáte se s problémem, že vaše stránky ve výsledcích vyhledávání nejsou aktuální, nebo tam nejsou vůbec? Lámete si nad tím hlavu a přemýšlíte, proč se to děje? S největší pravděpodobností mají roboti vyhledávačů problém vaše stránky nalézt a projít. Řešení se může skrývat právě v souboru Sitemap.xml.

Sitemap. Jak na to?

Kromě kvalitně vytvořeného interního prolinkování webu můžete vyhledávačům napomoct s nalezením a procházením vašich stránek i jiným způsobem, a to pomocí souboru sitemap.xml neboli mapou stránek.

Soubor sitemap.xml umožňuje informovat vyhledávače o URL adresách webu, které jsou k dispozici pro procházení a indexaci. Tyto soubory jsou vytvořeny ve formátu XML, ve kterém jsou uvedeny URL adresy podstránek webu s dalšími atributy. Tyto atributy umožňují předávat vyhledávačům další informace, jako například, kdy byla podstránka naposledy aktualizována <lastmod>, jak často se mění <changefreq>, a jakou má důležitost vůči ostatnímu stránkám na webu <priority>. To vše umožňuje vyhledávačům procházet web inteligentnějším způsobem a soustředit se na obsah, který je skutečně podstatný. Kód souboru sitemap.xml může vypadat následovně. Zde je ukázka nejjednoduššího souboru sitemap.xml, kterou tvoří jeden odkaz:

<?xml version="1.0" encoding="UTF-8"?>
 <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" >
   <url>
      <loc>http://www.example.com/ </loc>
      <lastmod>2017-10-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>1.0</priority>
   </url>
 </urlset>

V souboru sitemap.xml se mohou vyskytovat následující tagy:

  • <urlset> – Povinný tag, který obaluje celý kód a odkazuje se na referenční standard pro soubor sitemap.xml.
  • <url> – Povinný tag, který obaluje kód pro každou URL webu.
  • <loc> – Povinný tag. Ve značkách <loc> se nachází URL adresy webu, které požadujete po robotovi projít a indexovat.
  • <lastmod> – Nepovinný tag, ve kterém vyhledávači říkáte, kdy byla stránka naposledy změněna. Udává se ve formátu YYYY-MM-DD.
  • <changefreq> – Nepovinný tag, který udává, jak často se stránka v průměru mění. Může nabývat několika předdefinovaných hodnot: always, hourly, daily, weekly, monthly, yearly, never.
  • <priority> – Nepovinný tag. Určuje prioritu dané podstránky webu. Může nabývat hodnot od nuly do jedné, kdy 0.0 symbolizuje nejnižší prioritu a 1.0 nejvyšší.

Soubory sitemap mohou být vygenerovány jednorázově různými aplikacemi, jako je například Xenu Linksleuth, Screaming Frog SEO Spider nebo různé sitemap generátory. Doporučuje se však, aby byly generovány dynamicky přímo na serveru. Praktické je to hlavně v tom, že v momentě, kdy vytvoříte novou podstránku webu, je tato podstránka automaticky do souboru sitemap.xml zahrnuta.

Komprese a rozdělení souboru sitemap.xml

Rozdělení dálnice

Nezkomprimovaná velikost souboru sitamep.xml by podle doporučení Google i Seznamu neměla přesáhnout 50 MB nebo 50 tisíc URL. V případě, že je velikost větší, doporučují se obecně následující řešení:

  1. Soubor sitemap.xml rozdělit na více menších a z URL sitemap.xml na ně odkazovat (viz sitemap index).
  2. Zkomprimovat soubor sitemap.xml do formátu gzip.

Obě metody se dají kombinovat. Z jednoho sitemap indexu tak může vést odkaz na více souborů sitemap zkomprimovaných metodou gzip.

Sitemap.xml pro obrázky, videa a zprávy

Vedle standardních souborů sitemap.xml pro podstránky vašeho webu můžete využít také soubory sitemap.xml pro následující typy dat:

  1. Sitemap.xml pro zprávy
  2. Sitemap.xml pro obrázky
  3. Sitemap.xml pro videa

Tyto soubory obsahují oproti standardním souborům sitemap.xml jiné tagy (u obrázku je to například jeho URL adresa, popisek nebo titulek). Jejich přínos spočívá zejména v tom, že vyhledávači Google lépe popíšete, jaké typy obsahu se na webu nachází, a zároveň zvýšíte šance na zobrazení tohoto obsahu ve specifických výsledcích vyhledávání, jako je například Google Image Search.

Soubor sitemap.xml pro zprávy

Novinky a megafon

Mapa stránek pro zprávy navíc používá tagy, které jsou specifické pro zprávy. Zápis zprávy v souboru sitemap.xml vypadá třeba takto:

<?xml version="1.0" encoding="UTF-8"?>
 <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
         xmlns=http://www.google.com/schemas/sitemap-news/0.9" >
   <url>
      <loc>http://www.example.com/marketing/zprava1 </loc>
      <lastmod>2017-09-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.7</priority>
   <news:news>
      <news:publication>
        <news:name>Zpráva z marketingu 1</news:name>
        <news:language>cs</news:language>
      </news:publication>
      <news:genres>Novinka, Blog, Zpráva, Marketing</news:genres>
      <news:publication_date>2017-10-01</news:publication_date>
      <news:title>Titulek zprávy z marketingu 1</news:title>
      <news:keywords>Marketing, SEO, PPC</news:keywords>
    </news:news>
   </url>
 </urlset>

Soubor sitemap.xml pro obrázky

Vír obrázků

O obrázcích, které jsou na webu, můžete vyhledávač informovat také prostřednictvím souboru sitemap.xml. Nejen, že můžete přidat přímou cestu (URL) k obrázku, ale také můžete vyhledávačům říct o obrázcích doplňkové informace. Příklad zápisu obrázku v souboru sitemap.xml najdete i v následujícím kódu:


<?xml version="1.0" encoding="UTF-8"?>
 <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
         xmlns:image="http://www.google.com/schemas/sitemap-image/1.1" >
   <url>
      <loc>http://www.example.com/category1 </loc>
      <lastmod>2017-10-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.8</priority>
    <image:image>
      <image:loc>http://www.example.com/image1.jpg </image:loc>
      <image:caption>Toto je popisek obrázku 1</image:caption>
      <image:geo_location>Praha, Česká republika</image:geo_location>
      <image:title>Toto je název obrázku 1</image:title>
      <image:license>URL adresa licence na obrázek</image:license>
    </image:image>
    <image:image>
      <image:loc>http://www.example.com/image2.jpg </image:loc>
       ……………
   </image:image>
   </url>
 </urlset>

Soubor sitemap.xml pro video

Klapka a filmový kotouč

Soubor sitemap.xml může sloužit také jako skvělý informační kanál pro vyhledávač o veškerém videoobsahu na vašich stránkách. Navíc tak vyhledávači Google odešlete veškeré informace o videích, čímž Google umožní jejich dohledatelnost ve službě Videa Google. Zápis videa v souboru sitemap.xml může vypadat například takhle:

<?xml version="1.0" encoding="UTF-8"?>
 <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
        xmlns:video="http://www.google.com/schemas/sitemap-video/1.1" >
  <url>
      <loc>http://www.example.com/category1 </loc>
      <lastmod>2017-09-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.8</priority>
   <video:video>
    <video:thumbnail_loc>
      http://www.example.com/obrazek-nahled-video.jpg </video:thumbnail_loc>
    <video:title>Název videa</video:title>
    <video:description>Popisek videa </video:description>
    <video:content_loc>http://www.example.com/video1.mp4 </video:content_ loc>
    <video:duration>180</video:duration>
    <video:expiration_date>2019-12-05T19:20:30+08:00</video:expiration_date>
    <video:rating>4.5</video:rating>
    <video:view_count>1000000</video:view_count>
    <video:publication_date>2007-11-05T19:20:30+08:00</video:publication_date>
    <video:family_friendly>yes</video:family_friendly>
    <video:restriction relationship="allow">IE GB CA</video:restriction>
    <video:gallery_loc title="Marketing">
      http://marketing.example.com </video:gallery_loc>
    <video:price currency="CZK">10</video:price>
    <video:requires_subscription>no</video:requires_subscription>
    <video:uploader info="http://www.example.com/uzivatel/honza" >Honza
    </video:uploader>
    <video:platform relationship=“allow“>WEB MOBILE</video:platform>
    <video:live>no</video:live>
   </video:video>
  </url>
 </urlset>

Vysvětlivky a povinnost/volitelnost jednotlivých tagů naleznete přímo v návodě o sitemap.xml pro videa od Google.

Nastavení vícejazyčných stránek a webů s různým geografickým cílením v souboru sitemap.xml

Vícejazyčnost

Pokud máte stránky ve více jazycích nebo ve stejném jazyce, ovšem cílící na odlišné země (trhy), je nutné o jednotlivých verzích webu říci vyhledávačům. Pokud nechcete definovat hreflang v záhlaví protokolu HTTP ani přímým vložením do hlavičky HTML kódu stránky, můžete tak učinit přímo v souboru Sitemap.xml. Zápis hreflang-u by pak měl vypadat následovně:

V souboru http://www.example.com/sitemap.xml přiřadíte k URL adrese alternativu:


<url>
  <loc>http://www.example.com/category1 </loc>
   <xhtml:link rel="alternate" hreflang="en-US" href="http://www.example.com/category1" />
   <xhtml:link rel="alternate" hreflang="en-GB" href="http://www.example.co.uk/category1" />
</url>

V souboru http://www.example.co.uk/sitemap.xml pak také přiřadíte ke stejné URL adrese alternativu:


<url>
  <loc>http://www.example.co.uk/category1 </loc>
   <xhtml:link rel="alternate" hreflang="en-GB" href="http://www.example.co.uk/category1" />
   <xhtml:link rel="alternate" hreflang="en-US" href="http://www.example.com/category1" />
</url>

Kompletní seznam kódů pro určení jazykové verze najde ve formátu ISO 639-1, a seznam kódů pro země najde ve formátu ISO 3166-1 Alpha 2.

Jak se o mých souborech sitemap.xml dozví vyhledávač?

Pokud je soubor sitemap.xml (s tímto přesným názvem) umístěn v kořenovém adresáři webu, je dost pravděpodobné, že na něj robot vyhledávače narazí sám, protože je to standard. Podpořit přístup robotů k souboru ale můžete i dalšími způsoby:

  • Umístit odkaz na mapu stránek do souboru robots.txt. Adresa stránky by měla být v absolutním tvaru, tedy:
Sitemap: http://www.example.com/sitemap.xml

nikoliv pak

Sitemap: /sitemap.xml

Závěr

Pokud máte problém s indexací stránek vašeho webu, resp. pokud jsou stránky neaktuální, pravděpodobně mají vyhledávače problém s jejich nalezením. Ověřeným způsobem, kterým zajistíte kvalitnější procházení webu je rozhodně soubor Sitemap.xml. Kromě toho v něm můžete vyhledávači poskytnout doplňkové informace, které mu pomůžou lépe pochopit obsah vašich stránek, čímž si rozhodně můžete polepšit při hodnocení webu vyhledávači. Je to snadné, teď to zvládnete levou zadní.


Tento článek byl zveřejněn 11. 10. 2017 na Sunitce. Taste Sun je dnes součástí skupiny Taste.

Sdílejte článek