fbpx

Is Google OK met kleine aanpassingen aan machinevertaling?

Share This Post


Google’s SEO Office Hours van oktober gaven antwoord op de vraag of het OK is om machinaal vertaalde inhoud te gebruiken die door mensen is beoordeeld en die slechts kleine bewerkingswijzigingen heeft ondergaan.

Aflevering Google SEO-kantooruren

Deze aflevering van After Hours volgt een nieuw format waarin vragen worden ingediend en antwoorden worden gegeven.

De Googlers die de vragen beantwoorden zijn Lizzi Sassman en John Mueller.

Lizzi Sasman (@okaylizzi) is een technisch schrijver die “zorgt” voor de Google Site Central-documentatie.

In tegenstelling tot het vorige live-formaat, waarbij het publiek in realtime vragen stelt, is er geen mogelijkheid om vervolgvragen te stellen.

Op deze manier sluiten de antwoorden aan bij de Google-documentatie en kan niemand nog vragen stellen.

De persoon die de vraag stelde, was bezorgd over het feit dat hun inhoud automatisch uit een andere taal zou worden vertaald.

Ze gebruikten menselijke redacteuren om inhoud te beoordelen die acceptabel werd bevonden, op kleine wijzigingen na.

Natuurlijk maakt de persoon die de vraag stelt zich zorgen of de “kleine aanpassingen” voldoende zijn om de inhoud acceptabel te maken voor Google.

Lizzi Sassman beantwoordt de vraag op een manier die strikt voldoet aan wat in de documentatie van Google staat.

Ongetwijfeld had het antwoord verduidelijkt kunnen worden met een vervolgvraag om te bepalen of “kleine aanpassingen” goed genoeg zijn. De vraag is immers expliciet of kleine tweaks goed genoeg zijn voor Google.

Mogelijk is het impliciete antwoord om uw oordeel te gebruiken over de kwaliteit van de vertaalde inhoud.

Oordeel zelf.

Is matig bewerkte, machinaal vertaalde inhoud acceptabel?

Zij vroegen:

“Een site gebruikt machinevertaling om berichten in andere talen aan te bieden.

De inhoud wordt beoordeeld door menselijke vertalers en na kleine aanpassingen zijn ze vaak tevreden met de kwaliteit.

Is dit goed voor Google?”

Lizzi Sassman van Google antwoordde:

“Nou, het is goed om te horen dat menselijke vertalers tevreden zijn, en dat is helemaal prima met Google zolang er een mens bij het beoordelingsproces betrokken is. Dat is de sleutel.

Het ding om in gedachten te houden is ervoor te zorgen dat de kwaliteit goed blijft en goed werkt voor de mensen die de inhoud lezen.”

Het antwoord zegt niet specifiek of kleine bewerkingen in orde zijn, alleen dat als “menselijke vertalers” het goed doen, dit goed zou moeten zijn voor Google.

Zou het kunnen dat Google niet controleert of inhoud automatisch wordt vertaald, maar in plaats daarvan vertrouwt op standaard kwaliteitssignalen voor inhoud?

We weten het niet.

De nieuwe indeling van het spreekuur geeft de vraagsteller niet de mogelijkheid om een ​​vervolgvraag te stellen.

Google Spambeleid

De ontwikkelaarsdocumentatie van Google over spam vermeldt geautomatiseerde tekstvertaaltools en zegt expliciet dat het spam is, behalve als er een menselijk element in het spel is.

Dit is wat de documentatie van Google zegt:

“Voorbeelden van automatisch gegenereerde spaminhoud zijn:

Tekst vertaald door een geautomatiseerde tool zonder menselijke proeflezing of curatie vóór publicatie”

Dus, op basis van de gepubliceerde richtlijnen van Google, is het duidelijk dat zolang een mens de door een machine vertaalde inhoud bewerkt, Google ermee instemt.

Ook vermeldde John Mueller in een Google Office-Hours-video van april 2022 hoe door AI gegenereerde inhoud als spam wordt beschouwd en noemde vervolgens machinevertaalde inhoud.

Mueller sprak over tools voor het genereren van AI-inhoud en vergeleek deze met tools voor automatische vertaling.

Om 24:55 minuten in de Office Hours-video van april 2022 zei Mueller:

“Ik denk, ik weet het niet, in de loop van de tijd zal dit misschien iets zijn dat zal evolueren, omdat het meer een hulpmiddel voor mensen zal worden.

Zoals het gebruik van machinevertaling als basis voor het maken van een vertaalde versie van een website.

Maar toch… je werkt het in wezen met de hand.”

Waarom zou een menselijke controle automatisch vertaalde inhoud moeten controleren?

Zoals hierboven vermeld, is de zorg van Google dat de inhoud waarnaar wordt verwezen vanaf de pagina’s met zoekresultaten van zoekmachines (SERP’s) van hoge kwaliteit is en dat gebruikers er blij mee zijn.

Een ding dat niet werd besproken, is dat vertaalde inhoud handtekeningen bevat die een vertaaldetectie-algoritme kan identificeren.

Het detecteren van automatisch vertaalde inhoud is iets waar al jaren onderzoek naar wordt gedaan.

Een onderzoekspaper uit 2021 (Detectie van machinaal vertaalde tekst met behulp van tekstovereenkomst met heen-en-weer vertaling – PDF-download) stelt dat inhoud die van de ene taal naar de andere is vertaald, voor mensen moeilijk te detecteren kan zijn

Met 100 vertaalde teksten konden menselijke analisten bijvoorbeeld maar iets meer dan de helft van de vertaalde teksten identificeren.

De onderzoekers merkten op:

“De gemiddelde nauwkeurigheid was 53,3% (55,0% voor moedertaalsprekers en 52,0% voor niet-moedertaalsprekers), wat bijna toeval was.”

De aanpak, genaamd Text Similarity With Round-Trip Translation (TSRT), presteerde beter dan menselijke beoordelaars en scoorde hoger dan state-of-the-art vertaaldetectoren toen het artikel in 2021 werd gepubliceerd.

Opmerkelijk is dat deze techniek de oorspronkelijke taal van vertaalde teksten kan detecteren.

Het is ook in staat om te bepalen welk vertaalalgoritme de vertaling heeft gedaan.

Ze meldden:

“De evaluatieresultaten laten zien dat TSRT beter presteert dan andere methoden, met een nauwkeurigheid tot 90,2%.

Bovendien kon TSRT ook de oorspronkelijke vertaler en vertaaltaal identificeren met een nauwkeurigheid van respectievelijk 93,3% en 85,6%.”

Het is onduidelijk of Google vertaalde inhoud kan detecteren en of Google zelfs probeert vertaalde inhoud te detecteren.

Maar we weten wel dat de technologie bestaat om het te detecteren. Technologie kan vertaalde inhoud beter detecteren dan mensen en bepalen welk vertaalalgoritme de vertaling heeft gedaan.

Als het feit dat het in strijd is met de richtlijnen voor webmasters en een negatieve gebruikerservaring kan hebben niet voldoende is om het bewerken van automatisch vertaalde inhoud te motiveren, kan de mogelijkheid dat Google de kwaliteit van de inhoud analyseert voor automatische vertaling een reden zijn om geef dit soort inhoud een kans. uitgebreide recensie.

Dagvaarding

Luister naar de Google Office Hours Hangout om 17:50 minuten.

Uitgelichte afbeelding door Shutterstock/g_tech





Source link

More To Explore

WACHT! VOORDAT JE GAAT...

Geef me jouw E-mail Address, en dan stuur ik je een GRATIS kopie van mijn boek, waarin ik je laat zien hoe je jouw inkomen kan verdubbelen in 90 dagen!