fbpx

Google PageRank uitgelegd voor SEO-beginners

Google PageRank uitgelegd voor SEO-beginners

Share This Post


PageRank was ooit de kern van het zoeken, en dat heeft Google gemaakt tot het imperium dat het nu is.

Zelfs als je denkt dat de zoekfunctie verder is gegaan dan PageRank, valt niet te ontkennen dat het al een tijdje een alomtegenwoordig concept is in de branche.

Alle SEO-professionals zouden een goed begrip moeten hebben van wat PageRank was en wat het nog steeds is.

In dit artikel behandelen we:

Wat is PageRank? Het verhaal van hoe PageRank evolueerde. Hoe PageRank een revolutie teweegbracht in zoeken. PageRank-werkbalk vs. Paginabeoordeling Hoe PageRank werkt. Hoe PageRank tussen pagina’s stroomt. Wordt PageRank nog gebruikt?

Laten we erin duiken.

Wat is PageRank?

PageRank is gemaakt door Google-oprichters Larry Page en Sergey Brin en is een algoritme dat is gebaseerd op de gecombineerde relatieve sterkte van alle hyperlinks op internet.

De meeste mensen beweren dat de naam was gebaseerd op de achternaam van Larry Page, terwijl anderen suggereren dat “Page” verwijst naar een webpagina. Beide posities zijn waarschijnlijk waar en de overlapping was waarschijnlijk opzettelijk.

Toen Page en Brin aan de Stanford University zaten, schreven ze een paper met de titel: The PageRank Citation Ranking: Bringing Order to the Web.

Het artikel, gepubliceerd in januari 1999, demonstreert een relatief eenvoudig algoritme voor het evalueren van de sterkte van webpagina’s.

pagerank patent: startpagina'sAfbeelding van patents.google.com, april 2023

Het papier werd een octrooi in de VS (maar niet in Europa, waar wiskundige formules niet octrooieerbaar zijn).

van begin tot eind van het pagerank procesAfbeelding van patents.google.com, april 2023

Stanford University is eigenaar van het patent en heeft het overgedragen aan Google. Het patent loopt momenteel af in 2027.

wachtend proces van pagerankAfbeelding van patents.google.com, april 2023

Het verhaal van hoe PageRank evolueerde

Tijdens hun tijd op Stanford eind jaren negentig waren zowel Brin als Page op zoek naar methoden voor het ophalen van informatie.

In die tijd was het gebruik van links om het “belang” van elke pagina ten opzichte van een andere te achterhalen een revolutionaire manier om pagina’s te sorteren. Het was rekenkundig moeilijk, maar zeker niet onmogelijk.

Het idee werd al snel Google, dat in die tijd een klein idee was in de zoekwereld.

Er was bij sommige kringen zo veel institutioneel geloof in de aanpak van Google dat het bedrijf aanvankelijk zijn zoekmachine lanceerde zonder de mogelijkheid om inkomsten te genereren.

En terwijl Google (destijds bekend als “BackRub”) de zoekmachine was, was PageRank het algoritme dat werd gebruikt om pagina’s te rangschikken op pagina’s met zoekresultaten van zoekmachines (SERP’s).

De Google-dans

Een van de uitdagingen van PageRank was dat de wiskunde, hoewel eenvoudig, iteratief moest worden verwerkt. De berekening wordt meerdere keren uitgevoerd, op elke pagina en elke internetlink. Aan het begin van het millennium duurde het enkele dagen om deze wiskunde te verwerken.

De SERP’s van Google zijn in deze periode op en neer gegaan. Deze veranderingen waren vaak grillig, omdat voor elke pagina nieuwe PageRanks werden berekend.

Dit stond bekend als de “Google Dance” en het was notoir dat het de SEO’s van de dag stopte elke keer dat Google zijn maandelijkse update startte.

(De Google Dance werd later de naam van een jaarlijks feest dat Google organiseerde voor SEO-experts op het hoofdkantoor in Mountain View.)

Zaden van vertrouwen

Een latere iteratie van PageRank introduceerde het idee van een set “seed of trust” om het algoritme te starten in plaats van elke pagina op internet dezelfde initiële waarde te geven.

Redelijke surfer

Een andere iteratie van het model introduceerde het idee van een “redelijke surfer”.

Dit model suggereert dat de PageRank van een pagina mogelijk niet gelijk wordt gedeeld met de pagina’s waarnaar deze linkt, maar de relatieve waarde van elke link kan wegen op basis van hoe waarschijnlijk het is dat een gebruiker erop klikt.

De intrekking van PageRank

Aanvankelijk werd aangenomen dat het algoritme van Google intern “niet in staat was tot spammen”, aangezien het belang van een pagina niet alleen werd bepaald door de inhoud, maar ook door een soort “stemsysteem” dat werd gegenereerd door links naar de pagina

Het vertrouwen van Google duurde echter niet lang.

PageRank werd problematisch naarmate de backlink-industrie groeide. Dus Google haalde het uit de publieke opinie, maar bleef erop vertrouwen voor zijn ranking-algoritmen.

De PageRank-werkbalk werd in 2016 buiten gebruik gesteld en uiteindelijk werd alle openbare toegang tot PageRank verminderd. Maar tegen die tijd was met name Majestic (een SEO-tool) in staat om hun eigen berekeningen vrij goed te correleren met PageRank.

Google heeft tot januari 2017 vele jaren besteed aan het aanmoedigen van SEO’s om het manipuleren van links te vermijden via de “Google Guidelines” -documentatie en via advies van het Spam-team, geleid door Matt Cutts.

Gedurende deze tijd veranderden ook de algoritmen van Google.

Het bedrijf vertrouwde minder op PageRank en na de aankoop van MetaWeb en zijn eigen Knowledge Graph (in 2014 “Freebase” genoemd) begon Google de informatie van de wereld op verschillende manieren te indexeren.

PageRank-werkbalk vs. Paginabeoordeling

Aanvankelijk was Google zo trots op zijn algoritme dat het het resultaat van de berekening graag publiekelijk deelde met iedereen die het wilde zien.

De meest opvallende weergave was een werkbalkextensie voor browsers zoals Firefox, die voor elke webpagina een score tussen 0 en 10 weergaf.

PageRank heeft eigenlijk een veel breder scala aan scores, maar 0-10 gaf SEO-professionals en consumenten een directe manier om het belang van elke pagina op internet te beoordelen.

De PageRank-werkbalk maakte het algoritme erg zichtbaar, wat ook complicaties met zich meebracht. Het betekende met name dat het duidelijk was dat links de gemakkelijkste manier waren om Google te ‘spelen’.

Hoe meer links (of beter gezegd, hoe beter de link), hoe beter een pagina kan scoren in de SERP’s van Google voor elk gericht zoekwoord.

Dit betekende dat er een secundaire markt werd gevormd, het kopen en verkopen van links gewaardeerd op de PageRank van de URL waar de link werd verkocht.

Dit probleem werd nog verergerd toen Yahoo een gratis tool uitbracht genaamd Yahoo Search Explorer, waarmee iedereen links naar een bepaalde pagina kon vinden.

Later bouwden twee tools, Moz en Majestic, voort op de gratis optie door hun eigen internetindexen te bouwen en links afzonderlijk te evalueren.

Hoe PageRank een revolutie teweegbracht in zoeken

Andere zoekmachines waren sterk afhankelijk van het analyseren van de inhoud van elke pagina afzonderlijk. Deze methoden deden weinig om het verschil te zien tussen een invloedrijke pagina en een eenvoudig geschreven met willekeurige (of manipulatieve) tekst.

Dit betekende dat de zoekmethoden van andere zoekmachines voor SEO-professionals buitengewoon gemakkelijk te manipuleren waren.

Het PageRank-algoritme van Google was toen revolutionair.

Gecombineerd met een relatief eenvoudig concept van “nGrams” om de relevantie vast te stellen, vond Google een winnende formule.

Het presteerde al snel beter dan de grote gevestigde exploitanten van die tijd, zoals AltaVista en Inktomi (die onder andere MSN aanstuurden).

Door op paginaniveau te opereren, vond Google ook een veel schaalbaardere oplossing dan de op “directory” gebaseerde aanpak van Yahoo en later DMOZ, hoewel DMOZ (ook wel het Open Directory Project genoemd) Google in eerste instantie een open source eigen map

Hoe PageRank werkt

De formule voor PageRank komt in vele vormen voor, maar kan in een paar zinnen worden uitgelegd.

Aanvankelijk heeft elke pagina op internet een geschatte PageRank-score. Dit kan elk nummer zijn. Historisch gezien werd PageRank aan het publiek gepresenteerd als een score tussen 0 en 10, maar in de praktijk hoeven schattingen niet in dit bereik te beginnen.

De PageRank van die pagina wordt dan gedeeld door het aantal links op de pagina, wat resulteert in een kleinere fractie.

De PageRank wordt vervolgens verdeeld over de gelinkte pagina’s en hetzelfde wordt gedaan voor alle andere pagina’s op internet.

Vervolgens, voor de volgende iteratie van het algoritme, is de nieuwe PageRank-schatting voor elke pagina de som van alle fracties van pagina’s die naar elke bepaalde pagina linken.

De formule bevat ook een “dempingsfactor”, die werd beschreven als de kans dat een persoon die op internet surft, helemaal stopt met browsen.

Voordat elke volgende iteratie van het algoritme begint, wordt de voorgestelde nieuwe PageRank verminderd met de dempingsfactor.

Deze methodologie wordt herhaald totdat de PageRank-scores een bepaald evenwicht bereiken. De resulterende getallen werden vervolgens voor het gemak over het algemeen omgezet in een meer herkenbaar bereik van 0 tot 10.

Een manier om dit wiskundig weer te geven is:

PageRank formuleAfbeelding door de auteur, april 2023

Waar:

PR = PageRank in de volgende iteratie van het algoritme. d = dempingsfactor. j = het paginanummer op internet (als elke pagina een uniek nummer had). n=totaal aantal pagina’s op internet. i = de iteratie van het algoritme (aanvankelijk ingesteld op 0).

De formule kan ook in matrixvorm worden uitgedrukt.

Problemen en iteraties van de formule

De formule kent enkele uitdagingen.

Als een pagina niet naar een andere pagina linkt, is de formule niet in evenwicht.

In dit geval wordt de PageRank dus verdeeld over alle pagina’s op internet. Op deze manier kan zelfs een pagina zonder inkomende links worden bereikt sommige PageRank, maar het zou niet genoeg accumuleren om significant te zijn.

Een andere minder gedocumenteerde uitdaging is dat nieuwere pagina’s, hoewel potentieel maand belangrijker dan oudere pagina’s, het zal een lagere PageRank hebben. Dit betekent dat oude inhoud na verloop van tijd een onevenredig hoge PageRank kan hebben.

Er wordt geen rekening gehouden met de tijd dat een pagina actief is geweest in het algoritme.

Hoe PageRank tussen pagina’s stroomt

Als een pagina begint met een waarde van 5 en 10 links heeft, krijgt elke pagina waarnaar wordt gelinkt 0,5 PageRank (minus de dempingsfactor).

Op deze manier stroomt PageRank tussen iteraties over het internet.

Als er nieuwe pagina’s op internet verschijnen, beginnen ze met slechts een kleine hoeveelheid PageRank. Maar naarmate andere pagina’s naar deze pagina’s beginnen te linken, neemt hun PageRank in de loop van de tijd toe.

Wordt PageRank nog gebruikt?

Hoewel openbare toegang tot PageRank in 2016 werd verwijderd, wordt aangenomen dat de score nog steeds beschikbaar is voor Google-zoektechnici.

Een lek van de door Yandex gebruikte factoren toonde aan dat PageRank nog steeds een factor was die het kon gebruiken.

Google-technici hebben gesuggereerd dat de oorspronkelijke vorm van PageRank is vervangen door een nieuwe benadering die minder rekenkracht vereist om te berekenen. Hoewel de formule minder belangrijk is in hoe Google pagina’s rangschikt, is het nog steeds een constante voor elke webpagina.

En welke andere algoritmen Google ook kiest om aan te roepen, PageRank is tot op de dag van vandaag waarschijnlijk nog steeds ingebouwd in veel van de systemen van de zoekgigant.

Dixon legt in deze video in meer detail uit hoe PageRank werkt:



Patenten en originele documenten om verder te lezen:

Meer middelen:

Uitgelichte afbeelding: VectorMine/Shutterstock



Source link

More To Explore

WACHT! VOORDAT JE GAAT...

Geef me jouw E-mail Address, en dan stuur ik je een GRATIS kopie van mijn boek, waarin ik je laat zien hoe je jouw inkomen kan verdubbelen in 90 dagen!