Je daleko snazší ji vyrobit, než se jí zbavit – co to je? Penalizace! Očistit svůj web od banu ve fulltextových vyhledávačích za pokřivený odkazový profil, to je krev, slzy a dřina. Na dané téma již byla v posledním roce sepsána řada podrobných návodů a postupů. Na začátku je ale vždy snaha zbavit se špatných zpětných odkazů mířících na váš web, první v pořadí těch zcela vadných, penalizovaných nebo podezřelých.
Klasické nástroje pro analýzu zpětných odkazů, jako je MajesticSEO nebo Ahrefs, se pro prvotní oddělení zrn od plev moc nehodí, mají příliš zastaralé údaje. Na řadu tak přicházejí třeba pokročilejší možnosti vyhledávání, jako jsou operátory site: a link:. V následujícím článku shrnujeme jednu z technik při odstraňování penalizace, která nám v Medio Interactive pomáhá odfiltrovat největší odkazové bahno snadno a rychle.
Na co se tedy nejdříve díváme u každé domény odkazující na náš web?
- Operátor site: slouží k zobrazení zaindexovaných stránek pro zadanou doménu včetně subdomén. Nízký nebo dokonce nulový počet zaindexovaných stránek může signalizovat problematický či zabannovaný web, který chceme ze svého odkazového profilu dostat co nejdříve.
- Operátor link: umožňuje zjistit, jaké důležité stránky na konkrétní doménu odkazují. Opět čím nižší počet zobrazených zpětných odkazů, tím větší pozornost bychom měli danému odkazujícímu webu věnovat.
Chtělo by to nějak elegantně a automatizovaně (domén mohou být tisíce) dostat data do přehledné tabulky, třeba takovéto:
Jak jsem ji vytvořila?
Na začátek jsem si z nástroje pro analýzu zpětných odkazů vytáhla všechny odkazující domény. V tomto konkrétním případě mne zajímaly domény končící na .com, .info a .org. Seznam bez duplicit jsem zkopírovala do tabulky v Google Drive.
Do dalších sloupců v řádku jsem vložila následující hustokrutopřísný vzorec:
=VALUE(SUBSTITUTE(REGEXEXTRACT(IMPORTXML(CONCATENATE("https://www.google.cz/search?q=site%3A",A2),"//*[contains(@id, 'resultStats')]"),"\d+\s*\d*")," ",""))
=VALUE(SUBSTITUTE(REGEXEXTRACT(IMPORTXML(CONCATENATE("https://www.google.cz/search?q=link%3A",A2),"//*[contains(@id, 'resultStats')]"),"\d+\s*\d*")," ",""))
Co to přesně dělá? Přes příkaz CONCATENATE jsem vytvořila URL výsledků vyhledávání a vybraným operátorem. Z výsledkové stránky jsem přes funkci IMPORTXML vytáhla samotnou statistiku o přibližném počtu výsledků – vzorec v ní umí pomocí XPath vystřihnout z HTML libovolný element a dále pracovat s jeho hodnotami a atributy. V tomto případě nás zajímá řádek se statistikou, který je označen id=resultStats. Pomocí REGEXEXTRACT jsem vytáhla pomocí regulárního výrazu podřetězec s hodnotou statistiky. Kombinace vzorců VALUE a SUBSTITUTE slouží k přetavení textového řetězce představující číslo skutečně v číslo. Protože, když už mám číselný údaj, tak podle něj chci filtrovat a řadit.
S vytvořením tabulky práce nekončí. Stále je třeba domény s nejhoršími výsledky (počet zaindexovaných stránek je menší než 10 nebo bez hodnoty) ručně projít a jednu po druhé vyhodnotit. Mravenčí práce nezbytná pro následující odpenalizační aktivity, největší část dřiny nám ale již zautomatizovala naše tabulka výše.
Jaké používáte techniky, nástroje a ulehčující postupy při zbavování se penalizace vy?
Související odkazy
- Negative Domain Research Part 2 – Filtering Majestic’s Referring Domain Data
- 27 Types of Unnatural Links & Link Building Strategie
- How A Single Guest Post May Have Gotten An Entire Site Penalized By Google
- 7 Things I Learned Analyzing Penalized Sites’ Backlinks
- Řešení manuální penalizace webu – případová studie
- SEO a affiliate – tipy, triky, možné problémy a penalizace
- Reportážně pojaté shrnutí toho, jak Portent.com doslali penalizaci a kterak se z ní dostávali ven
- Záznam z webinář zdarma na téma odstranění penalizace