Analytik z Google Webmaster Trends se také dotkl témat jako jsou možnosti indexování API, jestli existuje nějaká interní over-linking penalizace a jak vlastně shromažďování duplicitních stránek funguje.
Analytik Google Webmaster Trends GAry Illyes, který pracoval pro společnost Google celých osm let, exkluzivně na tématech relativních k vyhledávání, participoval v AMA (Ask me anything – zeptej se mě na cokoliv) na Redditu tento víkend. Za celou dobu, kdy toto velice dlouhé vlákno trvalo, pokryl snad všechna témata, od robots.txt až k RankBrain, signálům chování pro vyhledávání obrázků a videí. Ušetříme vám všechny ty trable procházení stránek a stránek textu tím, že se s vámi podělíme o co možná nejdůležitější informace, které tam najdete.
Gary illyes učinil již v minulosti spoustu AMA, hlavně na konferenci SMX, ale tohle byl jeho první Reddit AMA.
Google respektuje robots.txt. Ať už se stane cokoliv, Googlebot bude respektovat pravidla, které mu dáte v souboru robots.txt. Pokud dáte Google nějaké protiřečící pravidla nebo podáte nějakou nepravou informaci ve vašem robots.txt, tak poté Googlebot může dělat, co se mu zlíbí. Ale jinak, pokud použijete soubor robots.txt správně, Google bude poslouchat.
Gary napsal: „Robots.txt je respektován pro to, co by měl dělat. Tečka. Není tu nic takového, co by mělo být „někdy ignorováno“.
ccTLD, gTLD, Search COnsole nastavení a jeho dopad na hodnocení. Gary sdělil, že tyto nastavení mají jakýsi nepřímý dopad na hodnocení. Když dojde na požadavky s místním úmyslem, pokud si Google myslí, že je místní obsah více relevantní pro uživatele, Google může hodnotit obsah v dané zemi daleko lépe než ostatní obsah. Tyto státní signály, ccTLD a/nebo nastavení specifické pro danou zemi v Search Console dává Google informaci, který mu následně pomůže určit, která doména je více relevantní lidem v dané zemi.
„Způsob, jakým to ovlivňuje hodnocení, je nepřímý, myslím. Máte spoustu gTLD, které jsou cílené na Spojené státy ve svém nastavení, kde se vaše doména pokusí zobrazit – tyto výsledky jsou relevantní, a k tomu všemu navíc získají menší bonus pro to, že jsou místní (tedy cílené skrze Search Console),“ Napsal Gary. „Protože nemůžete získat výhodu na základě ničeho jiného než to, že máte doménu, která se používá na Srí Lance, tak začínáte na pozici zvané „penalta“ (ve smyslu sportovním).
Vysvětlení RankBrain. RankBrain je systém interpretace požadavků založený na umělé inteligenci, který pomáhá Google pochopit lépe daný požadavek a tedy hodnotit daleko více relevantní stránky k danému požadavku na vyhledávání. Už v minulosti v jednom z článků jsme téma RankBrainu pokryli dostatečně, avšak tady nám to znovu vysvětlil Gary v jeho AMA:
„RankBrain je komponent pro sexy PR hodnocení na základě strojového učení, který používá historická data vyhledávání k předpovězení toho, na co by chtěl uživatel nejraději kliknout, když zadává úplně nový požadavek,“ řekl. „je to velice pěkný kousek inženýrství, který nám zachránil kůži již mnohokrát, když tradiční algoritmy byly trošku zmateny, něco jako: „oh, podívejme, slovíčko NE ve vlákně požadavku! Pojďme to pořádně ignorovat“L, ale nyní je to jenom o tom, že se spoléháme na měsíce stará historická data o tom, co se stalo na stránce výsledků vyhledávání samotné, ne na cílové stránce.
Takže to zní, že je RankBrain užitečný pro Google v jednom ohledu, avšak v druhém to není zas taková krása, protože zpracovává měsíce stará data.
UX a signály chování. Jedno z více kontroverzních témat okolo faktorů hodnocení Google je to, jak moč internetové vyhledávače využívají a používají UX (uživatelskou zkušenost) a signály chování pro hodnocení webových stránek. Google celou věčnost popíral, že něco takového používá jako přímé signály hodnocení. V AMA, Gary opět sdělil, že Google je nepoužívá a také si trochu kopnul do jedné osobnosti v průmyslu, která tvrdila pravý opak už několikrát za minulé roky.
„Čas na stránce, CTR, cokoliv, co je obsaženo v nové teorii od Fishkina, je více méně pro nás naprosto irelevantní. Vyhledávání je daleko více jednodušší, než si někteří lidé myslí,“ Sdělil Gary.
Hodnotící a živé testy. Gary se poté pustil do toho, jak vlastně Google využívá data kliknutí a také další uživatelská data – ne jako přímé signály hodnocení, avšak využívá je pro vyhodnocování výsledků vyhledávání. Mluvil o kvalitě výsledků vyhledávání z pohledu hodnotících tyto výsledky a také o tom, jak vlastně hodnotí výsledky vyhledávání Google, také mluvil o živých experimentech – když Google testuje, jak rozdílné scénáře ovlivňují chování hledajícího. Avšak ty niterní hodnocení nejsou tímto vůbec přímo ovlivněny.
„Když chceme spustit nový algoritmus nebo aktualizaci pro nějaký algoritmus, potřebujeme to otestovat,“ sdělil. „To samé platí i pro UX funkce, jako je změna barvy zelených odkazů. Pro to první máme hned dva způsoby, jak to otestovat: 1) s hodnotícími, tedy proces, který je až bolestně detailně upraven v příručce hodnotících, 2) s živými experimenty.“
„1) již byla dávno vypotřebována a dnes již není relevantní,“ přidal Garry. „2 je super tehdy, když vezmeme nějakou skupinu uživatelů a doslova na ně hodíme ten experiemnt, hodnocení nebo UX. Řekněme, že jedno procento uživatelů dostane právě kandidáta na aktualizaci nebo nové spuštění, ten zbytek bude vyhledávat na tom starém, právě nyní spuštěném, algoritmu. Tento experiment trvá nějaký ten čas, někdy jsou to týdny, a poté porovnáme některé metriky mezi experimentem a základem. Jedna z metrik je to, jak se liší kliknutí na výsledky mezi těma dvěma.“
Vytváření obsahu za použití strojového učení. Typicky Google není nijak nadšen, když stroje a počítače vytváří obsah. Dokonce jejich příručky sdělují správcům webu, aby blokovali internetové vyhledávače od indexace automaticky generovaného obsahu. Avšak se strojovým učením a umělou inteligence se může stát to, že váš obsah bude daleko lepší, než ten, který by jinak napsal člověk. A pokud je to tak, byl by s tím Google za dobře?
Gary implikoval, že by odpověď MOHLA být ano, když napsal: „Pokud můžete generovat obsah, který je naprosto neodlišitelný od toho, co dělá člověk, tak dobrá. Vlastně sám plánuju napsat něco, co by poradilo, jak vlastně používat strojové učení a NLP pro SEO (tedy až budu mít nějaký ten čas).“
Vyhledávání obrázků a videí. Google také mění tok zdrojů do vyhledávání obrázků a videí. Gary napsal, že si myslí, že je zde spousta příležitostí pro SEO a také pro marketéry (na této vertikální úrovni). Vůbec nic nevyzradil, avšak sdělil jedno: „jednoduše víme, že vyhledávání medií je způsobem, který je příliš ignorován, byť to, čeho je takové vyhledávání schopno, má velký potencionál pro vydavatele, takže „převádíme“ spoustu inženýrů, stejně jako se snažíme rozšířit dosah tohoto vyhledávání.“
To všechno zopakoval znova i v AMA, když sdělil: „Nemůžu vůbec předpovídat ani nic vyzrazovat, ale ano, vyhledávání médií, obecně, je něco, do čeho chceme vrazit daleko více zdrojů. Google vyhledávání obrázků a videí je často přehlíženo, ale má to opravdu neskutečný potenciál.“
Hreflang jako bonus k hodnocení. Google sdělil znova a znova, že použití hreflang markupu pro vaši webovou stránku se nijak nepočítá jako bonus pro hodnocení. Jenom to poskytuje Google daleko detailnější informace o původu a jazyku dané stránky.
Gary dal také velice dobrý příklad, když řekl, že: „je to velice zajímavá otázka a myslím si, že všechen ten zmatek okolo je spíše o tom, co je interní vs externí pojetí bonusu hodnocení. Můžu stoprocentně s jistotou říci, že NEDOSTANETE žádný bonus k hodnocení per se, tedy alespoň ne v tom interním smyslu. Co dostanete, je daleko více cílenější provoz na stránku. Dám vám příklad:
Požadavek: „AmPath“ (abychom nepoužívali nějaké reálné jméno společnosti)
Země uživatele a lokace: es-ES
Váš web má stránku A v angličtině pro tento termín a stránku B ve španělštině, s hreflang odkazem mezi nimi.“
„V tomto případě,“ pokračoval,“ tedy alespoň, když (re)implementujeme hreflang, to, co by se stalo, je to, že když vidíme daný požadavek, dostali bychom stránku A, protože, řekněme, jsou tam daleko silnější signály, avšak náhle spatříme, že je tam také příbuzná stránka B ve španělštině, který by třeba právě pro našeho uživatele byla daleko lepší, takže to prohodíme a prezentujeme uživateli stránku B, namísto stránky A, v umístění (hodnocení) A.“
Skupiny duplicitního obsahu. Participant v AMA se zeptal Garyho velice zajímavou otázku ohledně konsolidace signálů stránky, když Google seskupí (do clusterů) několik stránek, protože jsou duplicitní nebo protože jsou sdružené. SEO konzultant se zeptal, jestli Google přepošle signály z těchto ostatních stránek právě té stránce z clusteru, která se hodnotí v Google vyhledávání. Gary sdělil, že byť nemůže dát příliš detailní odpověď, neboť by to mohli zneužít spammeři, sdělil, že: „obecně stránka v clusteru, která se ukazuje ve výsledcích, bude dostávat více bonusů k hodnocení.“
Tady je celá odpověď a otázka, pokud chcete více nebo přesnější kontext odpovědi:
Otázka: „Pokud si půjčím obsah a ta druhá stránka má kanonické pozadí nebo je s ní zacházeno jako s tou samou stránku (jako s originálem), protože je duplikát, počítají se signály jako jsou externí/interní odkazy na obsah pro tu stránku mojí, což by pravděpodobně byl tento případ, nebo je s touto situací z pozice Google zacházeno jako se speciálním případem, kdy si Google řekne, že tohle vypadá nějak podezřele, určitě je to placené, chlapci, ignorujte to?“
Odpověď Garyho: „Nemůžu vám vůbec dát přesnou a konkrétní odpověď, protože spammeři by si s tím užili svoje, můžu vám však odpovědět obecně a to tak, že stránka, která je v tomto cliusteru a zobrazuje se ve výsledcích vyhledávání, dostane daleko lepší bonusy.“
Signály úrovně složky. Má Google nějaké signály úrovně složky okolo obsahu? Gary Illyes vysvětlil, že tyto faktory jsou pravděpodobně daleko více užitečné, když přijde na procházení samotného obsahu na stránce.
„Jsou to spíše takové vzorce procházení ve většině případů, avšak mohou se stát odpadem na své vlastní stránce,“ sdělil. „Jako, pokud máte nějakou hostující platformu, která má URL struktury example.com/username/blog, tak poté bychom eventuálně rozřízli tuhle stránku do spousty mini-stránek, které žijí pod example.com.
Bod žádného návratu. Gary se také zeptal, jestli jméno domény může být poškozeno tak moc, že již není opravitelné, že již nikdy nebude moci dobře být hodnoceno ve výsledcích vyhledávání. Gary sdělil, že ne, že tu nic takového není. Avšak Google v minulosti prohlásil, že některé domény jsou tak poškozené, že je daleko jednodušší začít úplně od začátku s novým jménem či názvem domény.
Penalizace interních odkazů. Gary také sdělil, že tu není nic takového jako penalizace pro přílišnou optimalizaci interních odkazů. Napsal, že: „můžete zneužívat vaše interní odkazy jak jen chcete AFAIK.“
Zaměřte se na základy. Gary opravdu zdůraznil fakt, že by se SEOs a správci webů měli přestat zabývat zbytečnými detaily a měli by se opravdu zaměřit na základy, zatímco pojmenovával nejrůznější kontroly hodnocení a „hloupé aktualizace“ zbytečnou ztrátou času.
„Opravdu si přeji, aby se SEO konzultanti a praktici vrátili k základům (tedy aby stránka šla SAKRA DOBŘE PROCHÁZET),“ sdělil, „namísto toho zaměřování se na nějaké hloupé aktualizace a vymyšlené termíny sledovači hodnocení, a že by také měli daleko více komunikovat s vývojáři stránek, jakmile jsou hotovi s první části této věty (procházení stránky).“
Faktory hodnocení seznamu. Byl dotázán, aby vyjmenoval další faktory hodnotící, kromě relevance, čerstvosti, popularity. Gary vyjmenoval: „Stát či země, ve které je umístěna stránka, RankBrain, PageRank/odkazy, jazyk, pornostránkovost, apod.“
Indexace API. Google a jeho indexace API nedávno upoutala více než hodně pozornosti, neboť Bing oznámil jejich nové API pro podávání obsahu a Yoast implikoval, že nebudou jenom suše spolupracovat s Bingem na jejich API, ale zároveň budou také pracovat s Google API nějakým způsobem. Gary potvrdil, že dělají nějaké testy, avšak také sdělil, že věří, že Yoast něco oznámil dříve. Avšak vysvětlil, že Wix má jistý přístup k některým částem API pro podávání obsahu. „Co já vím, tak ano, jsou jediní, kteří nyní testují,“ napsal. „I když ohledně toho mají taky spoustu hloupých stanovisek…“
V kontextu Wix také napsal: „právě nyní testujeme naše vlastní limitace s indexací API, stejně tak i užitečnost tohoto podaného obsahu vs. klasický způsob. Ještě nemáme nic, co bychom mohli oznámit… a co se týče společnosti Yoast, nechci nikomu šlapat na kuří oko (tedy nechci šlapat na kuří oka našeho PM indexace API), ale může to být případ, kdy společnost příliš brzo něco oznámila.“
Stránky s příbuznými odkazy společně. Pokud máte několik stránek nebo příspěvků na blogu, které se týkají stejného tématu, pomáhá, pokud propojíte odkazem tyto stránky? GAry napsal, že: „Je to dobrá praktika, avšak nemyslím si, že byste měli vidět nějaké přínosy z PageRank.“ Google obecně napovídá vydavatelům, aby udělali jednu skvělou stránku oproti tomu, aby udělali několik „nemastných, neslaných“ stránek.