fbpx

GPT-4 niet trainen op API-clientgegevens

GPT-4 niet trainen op API-clientgegevens

Share This Post


In een significante afwijking van zijn eerdere praktijken, heeft OpenAI aangekondigd dat het niet langer klantgegevens zal gebruiken die via zijn API’s zijn ingediend om zijn uitgebreide taalmodellen, zoals GPT-4, te trainen.

De wijziging werd bevestigd door Sam Altman, CEO van OpenAI, in een recent interview met CNBC.

OpenAI’s nieuwe benadering van gebruikersgegevens

De beleidswijziging van OpenAI werd doorgevoerd op 1 maart 2023, toen het bedrijf stilletjes zijn servicevoorwaarden bijwerkte om deze nieuwe toewijding aan de privacy van gebruikers weer te geven.

Altman verduidelijkte: “Klanten willen duidelijk dat we niet trainen op hun gegevens, dus we hebben onze plannen gewijzigd: dat doen we niet.”

API’s, of Application Programming Interfaces, zijn technologische frameworks waarmee klanten rechtstreeks verbinding kunnen maken met OpenAI-software.

Altman verklaarde dat OpenAI al geruime tijd geen API-gegevens gebruikt voor modeltraining, wat suggereert dat deze officiële aankondiging een bestaande praktijk formaliseert.

Gevolgen voor zakelijke klanten

De verhuizing van OpenAI heeft verstrekkende gevolgen, vooral voor zijn zakelijke klanten, waaronder reuzen als Microsoft, Salesforce en Snapchat.

Het is waarschijnlijker dat deze bedrijven de API-mogelijkheden van OpenAI gebruiken voor hun activiteiten, dus de verandering op het gebied van privacy en gegevensbescherming is voor hen bijzonder relevant.

De nieuwe maatregelen voor gegevensbescherming zijn echter alleen van toepassing op klanten die de API-services van het bedrijf gebruiken. OpenAI’s bijgewerkte servicevoorwaarden: “We kunnen inhoud gebruiken van andere services dan onze API.”

Als zodanig kan OpenAI nog steeds andere vormen van gegevensinvoer gebruiken, zoals tekst die wordt ingevoerd in de populaire chatbot ChatGPT, tenzij de gegevens via de API worden gedeeld.

Bredere impact op de industrie

De beleidsverandering van OpenAI komt doordat industrieën worstelen met de potentiële gevolgen van grote taalmodellen, zoals OpenAI’s ChatGPT, die materiaal vervangen dat traditioneel door mensen is gemaakt.

Zo ging de Writers Guild of America onlangs in staking nadat onderhandelingen tussen de Guild en de filmstudio’s waren mislukt. De Guild verdedigde beperkingen op het gebruik van OpenAI’s ChatGPT voor het genereren of herschrijven van scripts.

De beslissing van OpenAI om geen klantgegevens te gebruiken voor training markeert een sleutelmoment in het voortdurende gesprek over gegevensprivacy en AI. Terwijl bedrijven de grenzen van AI-technologie blijven verkennen en verleggen, zal het waarborgen van de privacy van gebruikers en het behouden van vertrouwen waarschijnlijk centraal blijven staan ​​in deze discussies.

De evolutie van ChatGPT: GPT-3 naar GPT-4

Het is belangrijk op te merken dat de toezegging van OpenAI om geen klantgegevens te gebruiken voor training, van toepassing is op het nieuwste taalmodel, GPT-4, uitgebracht op 14 maart 2023.

GPT-4 introduceerde verschillende verbeteringen ten opzichte van zijn voorganger, GPT-3, waaronder een aanzienlijke toename van de woordlimiet (25.000 in vergelijking met ChatGPT’s limiet van 3.000 woorden), een grotere contextvenstergrootte en verbeterde redeneer- en begripsvaardigheden.

Een ander opvallend kenmerk van GPT-4 is de multimodaliteit, of het vermogen om naast tekst ook informatie uit afbeeldingen te begrijpen en af ​​te leiden. Het laatste model genereert meer menselijke tekst en gebruikt functies zoals emoji’s voor een persoonlijker gevoel.

De exacte grootte en architectuur van GPT-4 blijven echter geheim, wat leidt tot speculatie over de details van het model.

Ondanks deze geruchten heeft de CEO van OpenAI specifieke beweringen over de grootte van het model ontkend.

Qua prestaties heeft GPT-4 sterke punten laten zien bij het genereren van tekst, maar ook enkele beperkingen. Hij scoorde bijvoorbeeld in het 54e percentiel op het Graduate Record Exam (GRE) schrijven en presteerde in het 43e tot 59e percentiel op het AP Calculus BC-examen.

Bovendien presteerde het goed bij eenvoudige Leetcode-coderingstaken, maar de prestaties namen af ​​naarmate de taak moeilijker werd.

Hoewel de details van het GPT-4-trainingsproces niet officieel zijn gedocumenteerd, is het bekend dat GPT-modellen over het algemeen grootschalige machine learning omvatten met een breed scala aan tekst op internet.

vooruit kijken

Als gevolg van wijzigingen in het gegevensgebruikbeleid van OpenAI, bevatten de gegevens die worden gebruikt om de taalmodellen te trainen geen informatie die via de API wordt gedeeld, tenzij gebruikers expliciet akkoord gaan om deze voor dit doel te verstrekken.

Naarmate deze technologie verbetert en een grotere rol speelt in ons leven, is het interessant hoe bedrijven draaien en reageren op zorgen over het privé houden van gegevens en het winnen van het vertrouwen van mensen.

Uitgelichte afbeelding gegenereerd door de auteur via Midjourney.



Source link

More To Explore

WACHT! VOORDAT JE GAAT...

Geef me jouw E-mail Address, en dan stuur ik je een GRATIS kopie van mijn boek, waarin ik je laat zien hoe je jouw inkomen kan verdubbelen in 90 dagen!