NEW YORK - Meta Platforms (NASDAQ:META) Inc., het moederbedrijf van Facebook, heeft vandaag de lancering aangekondigd van nieuwe kunstmatige intelligentie (AI) modellen vanuit haar onderzoeksafdeling. Onder de modellen bevindt zich een "Self-Taught Evaluator", die zou kunnen leiden tot verminderde menselijke betrokkenheid in het AI-ontwikkelingsproces. Dit instrument werd voor het eerst geïntroduceerd in een onderzoekspaper in augustus en maakt gebruik van de "chain of thought"-techniek, vergelijkbaar met die gebruikt door OpenAI's nieuwste modellen.
Deze methode breekt complexe problemen op in kleinere, logische stappen, waardoor de nauwkeurigheid van antwoorden in moeilijke vakgebieden zoals wetenschap, codering en wiskunde wordt verbeterd.
De "Self-Taught Evaluator" werd getraind met uitsluitend door AI gegenereerde data, wat betekent dat er in deze fase van ontwikkeling geen menselijke input nodig was. Deze vooruitgang wijst op de mogelijkheid om autonome AI-agenten te creëren die kunnen leren van hun eigen fouten. Volgens onderzoekers van Meta zouden deze zelfverbeterende modellen uiteindelijk een breed scala aan taken kunnen uitvoeren zonder menselijke hulp, waardoor de huidige behoefte aan Reinforcement Learning from Human Feedback (RLHF) wordt overtroffen. RLHF is een kostbare en minder efficiënte methode die gespecialiseerde menselijke beoordelaars vereist om data te labelen en complexe antwoorden te valideren.
Jason Weston, een van de Meta-onderzoekers, deelde zijn visie op de toekomst van AI: "We hopen dat naarmate AI steeds meer bovenmenselijk wordt, het steeds beter zal worden in het controleren van zijn werk, zodat het daadwerkelijk beter zal zijn dan de gemiddelde mens." Hij benadrukte het belang van zelfonderricht en zelfevaluatie bij het bereiken van ongekende niveaus van AI-bekwaamheid.
Hoewel andere bedrijven, zoals Google en Anthropic, onderzoek hebben gedaan naar vergelijkbare concepten zoals Reinforcement Learning from AI Feedback (RLAIF), onderscheidt Meta zich door haar modellen beschikbaar te stellen voor openbaar gebruik.
Naast de "Self-Taught Evaluator" onthulde Meta vandaag ook bijgewerkte AI-tools. Deze omvatten verbeteringen aan het Segment Anything-model voor beeldherkenning van het bedrijf, een tool die de responstijd voor grote taalmodellen (LLM's) versnelt, en datasets ter ondersteuning van de ontdekking van nieuwe anorganische materialen.
Reuters heeft bijgedragen aan dit artikel.
Dit artikel is vertaald met behulp van kunstmatige intelligentie. Raadpleeg voor meer informatie onze gebruiksvoorwaarden.