fbpx

Hugging Face publiceert gratis chat GPT Clone: ​​HuggingChat

Hugging Face publiceert gratis chat GPT Clone: ​​HuggingChat

Share This Post


Hugging Face, de machine learning-community en het platform voor AI-tools, heeft de release aangekondigd van HuggingChat, een open source ChatGPT-kloon die iedereen zelf kan gebruiken of downloaden.

Knuffel gezicht

Hugging Face is een AI-bedrijf en community. Biedt toegang tot gratis, open source-tools voor het ontwikkelen van machine learning- en AI-toepassingen.

Een van de onlangs voltooide projecten van Hugging Face is een groot taalmodel met 176 miljard parameters, Bloom genaamd, dat beschikbaar is voor iedereen die ermee instemt zich te houden aan de verantwoordelijke AI-licentie.

Er is toegang tot open source-modellen in verschillende categorieën, zoals multimodaal, visie, audio, natuurlijke taalverwerking en versterkend leren.

Hugging Face host ook open source datasets en bibliotheken en dient als een manier voor teams om samen te werken, inclusief een repository, vergelijkbaar met GitHub.

Veel van de services zijn beschikbaar op gratis, professioneel en zakelijk niveau.

KnuffelChat

De HuggingChat ChatGPT-kloon is gebaseerd op het conversationele AI-model van Open Assistant.

Open Assistant zelf is een project van de non-profitorganisatie Large Scale Artificial Intelligence Open Network (LAION).

LAION is een wereldwijde non-profitorganisatie die zich toelegt op het bieden van toegang tot geavanceerde technologie als open source.

Zij schrijven:

“ONS GELOOF
Wij zijn van mening dat onderzoek naar machine learning en de toepassingen ervan enorme positieve effecten kunnen hebben op onze wereld en daarom moeten worden gedemocratiseerd.

ONZE BELANGRIJKSTE DOELSTELLINGEN
Vrijgeven van open datasets, machine learning code en modellen.

We willen de basis van grootschalig ML-onderzoek en datamanagement aanleren.

Door modellen, datasets en code herbruikbaar te maken zonder de hele tijd vanaf nul te hoeven trainen, willen we een efficiënt gebruik van energie en computerbronnen bevorderen om de uitdagingen van klimaatverandering aan te pakken.”

De GitHub-pagina voor het Open Assistant-chatmodel zegt:

“Open Assistant is een project om iedereen toegang te geven tot een geweldig op chat gebaseerd taalmodel.

Wij geloven dat we door dit te doen een revolutie in taalinnovatie zullen creëren.

Net zoals stabiele streaming de wereld heeft geholpen om op nieuwe manieren kunst en afbeeldingen te creëren, hopen we dat Open Assistant de wereld kan helpen verbeteren door de taal zelf te verbeteren.”

HuggingChat-trainingsdataset

HuggingChat is getraind op de geheel nieuwe dataset OpenAssistant Conversations (OASST1), die gegevens bevat die zijn verzameld tot 12 april 2023.

Het dataset research paper dateert van april 2023 (OpenAssistant Conversations – Democratizing Large Language Model Alignment – PDF).

Dit model maakt gebruik van dezelfde trainingsmethodiek die is gemaakt door OpenAI en die wordt genoemd Reinforcement Learning from Human Feedback (RLHF).

RLHF is een techniek voor het creëren van een hoogwaardige, geannoteerde vraag-en-antwoorddataset van menselijke kwaliteit die kan worden gebruikt om een ​​AI te trainen om instructies op te volgen.

Met deze release hebben ze hun doel bereikt om de RLHF-techniek beschikbaar te maken voor iedereen die een AI wil trainen.

In het onderzoeksdocument stond:

“In een poging afstemmingsonderzoek op grote schaal te democratiseren, publiceren we OpenAssistant Conversations, een door mensen gegenereerd, door mensen geannoteerd corpus van conversaties in assistent-stijl bestaande uit 161.443 berichten verspreid over 66.497 conversatiebomen, in 35 verschillende talen, gescoord met 461.292 kwaliteitsbeoordelingen .”

De dataset is het product van een wereldwijde crowdsourcing-inspanning van meer dan 13.000 vrijwilligers.

Crowdsourcing was een goede manier om meertalige trainingsgegevens te genereren die bijdroegen aan een hoogwaardige dataset.

Volgens de onderzoekers introduceerde de crowdsourcing-benadering echter ook beperkingen aan de kwaliteit van de dataset in de vorm van culturele en subjectieve vooroordelen van de personen die de trainingsgegevens hebben gemaakt en beoordeeld.

Ze waarschuwden ook dat deelnemers die meer betrokken waren, geneigd waren meer bij te dragen, waardoor een ongelijke verdeling van hun waarden en vooroordelen ontstond.

De onderzoekers concluderen dat de dataset mogelijk niet de diversiteit aan standpunten van alle bijdragers weergeeft.

Ze stuurden bijvoorbeeld een enquête naar hun Discord-kanaal (alleen in het Engels) waarin ze hun open source-bijdragers vragen stelden met betrekking tot hun demografische gegevens (maar niet etniciteit).

Afgezien van taalkundige vooringenomenheid, bleek uit de enquêteresultaten dat van de 226 respondenten er 201 man waren, 10 vrouw, vijf geïdentificeerd als niet-binair/anders, en 10 weigerden te antwoorden.

Hoewel ze niet 100% garanderen dat de dataset vrij is van schadelijke inhoud, ondersteunen ze deze toch omdat deze is gemaakt met strikte kwaliteitsrichtlijnen.

De onderzoekers schrijven:

“Om de kwaliteit van onze dataset te waarborgen, hebben we strikte richtlijnen opgesteld voor bijdragers die alle gebruikers moeten volgen.

Deze richtlijnen zijn ontworpen om te voorkomen dat er schadelijke inhoud aan onze dataset wordt toegevoegd en om bijdragers aan te moedigen om antwoorden van hoge kwaliteit te genereren.”

KnuffelChat is beschikbaar

HuggingChat is nu open voor gebruikers. Registratie om een ​​inlogaccount aan te maken is niet vereist om het te gebruiken.

Verwacht geen outputniveau van ChatGPT, de service is nog niet op dat niveau. De app-pagina vermeldt het als versie 0.0, wat u een idee zou moeten geven van hoe volwassen het op dit moment is.

Het is echter een opmerkelijke prestatie en een eerste stap voor de open source-gemeenschap en er zijn geen kosten verbonden aan het gebruik ervan.

Bezoek de HuggingChat-website hier:

HuggingChat-webpagina en gebruikersinterface



Source link

More To Explore

OpenAI sluit gebrekkige AI-detector af
Marketing Nieuwtjes

OpenAI sluit gebrekkige AI-detector af

OpenAI heeft zijn AI-classificatie, een tool die is ontworpen om door AI gegenereerde tekst te identificeren, stopgezet na kritiek op de nauwkeurigheid ervan. De beëindiging

WACHT! VOORDAT JE GAAT...

Geef me jouw E-mail Address, en dan stuur ik je een GRATIS kopie van mijn boek, waarin ik je laat zien hoe je jouw inkomen kan verdubbelen in 90 dagen!