Tijdens een Google SEO-sessie tijdens kantooruren beantwoordde Duy Nguyen van Google van het Search Quality-team een vraag over links naar sites met spam en hoe dit verband houdt met vertrouwen.
Het was interessant hoe de Googler zei dat ze het ankertekstsignaal beschermden. Het is niet iets dat vaak wordt besproken.
Vertrouwen opbouwen met Google is een belangrijke overweging voor veel uitgevers en SEO’s.
Er is het idee dat “vertrouwen” een site zal helpen om correct geïndexeerd en gerangschikt te worden.
Het is ook bekend dat er geen “vertrouwen”-metriek is, wat sommigen in de zoekgemeenschap soms in de war brengt.
Hoe kun je het algoritme vertrouwen als het niets meet?
Googlers beantwoorden die vraag niet echt, maar er zijn patenten en onderzoeksdocumenten die een idee geven.
Google vertrouwt geen links van sites met spam
Degene die een vraag stelde aan SEO Spreekuur vroeg:
“Als een domein wordt bestraft, heeft dat dan invloed op de links die er vandaan komen?”
Googler Duy Nguyen antwoordde:
“Ik neem aan dat je met ‘bestraft’ bedoelt dat het domein is verslechterd door onze spam-algoritmen of handmatige acties.
Over het algemeen vertrouwen we geen links van sites waarvan we weten dat ze spam zijn.
Dit helpt ons de kwaliteit van onze ankersignalen te behouden.”
Vertrouwen en links
Googlers praten over vertrouwen, en het is duidelijk dat ze het hebben over hun algoritmen die iets vertrouwen of iets niet vertrouwen.
In dit geval gaat het er niet om dat links op sites met spam niet worden meegeteld, in het bijzonder gaat het erom dat het ankertekstsignaal niet wordt meegeteld.
De SEO-gemeenschap heeft het over ‘vertrouwen opbouwen’, maar in dit geval gaat het er echt om niet te spammen.
Hoe stelt Google vast dat een site spam is?
Niet alle sites worden bestraft of krijgen een handmatige actie. Sommige sites worden niet eens geïndexeerd en dat is de taak van Google’s Spam Brain, een AI-platform dat webpagina’s op verschillende punten analyseert, te beginnen op het moment van crawlen.
Het Spam Brain-platform werkt als volgt:
Indexerende poortwachter
Spam Brain blokkeert sites tijdens het crawlen, inclusief inhoud die is ontdekt via de zoekconsole en sitemaps.
Zoek naar geïndexeerde spam
Spam Brain vangt ook spam op die is geïndexeerd op het moment dat sites in aanmerking komen voor rangschikking.
De manier waarop het Spam Brain-platform werkt, is dat het een AI traint op de kennis van Google over spam.
Google gaf commentaar op hoe het spambrein werkt:
“Door onze grondige kennis van spam te combineren met AI, waren we vorig jaar in staat om onze eigen anti-spam AI te creëren die ongelooflijk effectief is in het opvangen van zowel bekende als nieuwe spamtrends.”
We weten niet waar Google het over “spamkennis” heeft, maar er zijn verschillende patenten en onderzoeksdocumenten over.
Degenen die dieper op dit onderwerp willen ingaan, kunnen overwegen een artikel te lezen dat ik schreef over het concept van algoritmen voor het rangschikken van links, een methode voor het rangschikken van links.
Ik heb ook een volledig artikel gepost over verschillende onderzoeksdocumenten waarin algoritmen worden beschreven die verband houden met links die kunnen beschrijven wat het Penguin-algoritme is.
Hoewel veel van de patenten en onderzoeksdocumenten van de afgelopen tien jaar zijn, is er sindsdien niets meer gepubliceerd door zoekmachines en universitaire onderzoekers.
Het belang van deze patenten en onderzoekswerken is dat het mogelijk is dat ze op een andere manier in het algoritme van Google kunnen worden verwerkt, bijvoorbeeld voor training en AI zoals Spam Brain.
Het patent dat wordt besproken in het artikel over het rangschikken van links, beschrijft hoe de methode rankingscores voor pagina’s toekent op basis van de afstanden tussen een reeks vertrouwde “seed-sites” en de pagina’s waarnaar ze linken. De seed-sites zijn als het ware de uitgangspunten om te berekenen welke sites normaal zijn en welke niet (dwz spam).
De intuïtie is dat hoe verder een site verwijderd is van een seed-site, hoe groter de kans dat de site als spam wordt beschouwd. Dit deel, over het bepalen van spam via linkafstand, wordt besproken in de onderzoeksdocumenten die worden aangehaald in het Penguin-artikel waarnaar ik hierboven heb verwezen.
Het patent, (Het produceren van een rangschikking voor pagina’s met behulp van afstanden in een weblinkgrafiek), legt uit:
“Het systeem wijst vervolgens lengtes toe aan de links op basis van de eigenschappen van de links en de eigenschappen van de pagina’s die aan de links zijn gekoppeld.
Het systeem berekent vervolgens de kortste afstanden van de startpaginaset naar elke pagina in de paginaset op basis van de lengte van de koppelingen tussen de pagina’s.
Het systeem bepaalt vervolgens een rankingscore voor elke pagina in de reeks pagina’s op basis van de berekende kortste afstanden.
Verminderde links grafiek
Hetzelfde patent vermeldt ook wat bekend staat als een gereduceerde linkgrafiek.
Maar het is niet alleen een patent dat spreekt over gereduceerde linkgrafieken. Gereduceerde linkgrafieken werden ook buiten Google onderzocht.
Een linkgrafiek is als een kaart van internet die is gemaakt door koppelingen in kaart te brengen.
In een verkleinde linkgrafiek worden links van lage kwaliteit en bijbehorende sites verwijderd.
Wat overblijft is wat een gereduceerde linkgrafiek wordt genoemd.
Hier is een citaat uit het hierboven aangehaalde Google-patent:
“Een gereduceerde linkgrafiek
Merk op dat links die deelnemen aan de k kortste paden van seed naar pagina’s een subgrafiek vormen die alle links omvat die zijn geclassificeerd als “stroom” van seed.
Hoewel deze subgrafiek veel minder links bevat dan de originele linkgrafiek, hebben de k kortste paden van de zaden naar elke pagina in deze subgrafiek dezelfde lengte als de paden in de originele grafiek.
… Ook kan de rangschikking op elke pagina worden teruggevoerd naar de dichtstbijzijnde k zaden via de paden van deze subgrafiek.
Google vertrouwt geen links van bestrafte sites
Het is duidelijk dat Google links van bestrafte websites niet vertrouwt.
Maar soms weet men niet of een site door Spam Brain is bestraft of als spam is gemarkeerd.
Onderzoek doen om te zien of een site niet te vertrouwen is, is een goed idee voordat u de moeite neemt om een link van een site te krijgen.
Naar mijn mening mogen statistieken van derden niet worden gebruikt om zakelijke beslissingen als deze te nemen, omdat de berekeningen die worden gebruikt om een score te produceren, verborgen zijn.
Als een site al linkt naar mogelijk spam-sites die zelf inkomende links hebben van potentiële betaalde links zoals PBN’s (Private Blog Networks), is het waarschijnlijk een spam-site.
Uitgelichte afbeelding door Shutterstock/Krakenimages.com
Zie openingstijden SEO:

Hey, ik ben Brent, en ik speel al een lange tijd mee in de SEO scene. Ik ben vooral heel actief in de Amerikaanse markt, en hou dan ook wel van een uitdaging. Ik ben sinds kort aan het uitbreiden binnenin de Benelux, en besluit hier dan ook te oversharen!
Wil je meer leren, klik dan op lees meer!