Odstranit HTML značky
Nešvar některých e‑shopů je, že do XML pro Heureku, Zboží.cz či jiné vyhledávače zboží vkládají HTML značky. Poznáte je podle toho, že jsou uzavřeny do špičatých závorek, například <p>, </span> atp. Tyto značky některé vyhledávače zboží zlobí, a tak jsem připravil pravidlo, které je automaticky odstraní.
Ilustrace fungování Mergadova pravidla Odstranit HTML značky.
Vybrat kategorii
Některé e‑shopy umožní zařadit jednu položku zboží do více kategorií. A následně generují do XML pro Heureku vícekrát značku CATEGORYTEXT. Tento element je pro Heureku velice důležitý. Heureka ovšem umí zpracovat pouze první výskyt elementu CATEGORYTEXT a ostatní ignoruje. Pokud má e‑shop v XML nejprve CATEGORYTEXT „Výprodej“ a až následně „Rybářské potřeby | Stany a přístřešky | Rybářské přístřešky“, zpracuje Heureka pouze „Výprodej“. Tato kategorie není kvalitní a zboží nebude spárováné. Mergadovo nové pravidlo toto řeší tak, že vyskytne-li se element CATEGORYTEXT vícekrát, ponechá pouze ten nejlepší a ostatní skryje.
Ilustrace fungování Mergadova pravidla Vyber kategorii.
Jak zapnout tato nová pravidla
Jednoduše v exportu na stránce Pravidla klikněte na odkaz Vytvořit pravidlo a jako Typ pravidla vyberte Odstranit HTML značky nebo Vybrat kategorii. Uložte stiskem tlačítka vespod stránky. Změna se projeví po pravidelném přegenerování dat Mergadem.
Vyzkoušejte si nová pravidla přímo v Mergadu!