Nvidia heeft Nemotron-4 340B gepresenteerd, een familie van open-source taalmodellen ontworpen om hoogwaardige synthetische gegevens te genereren en krachtige kunstmatige intelligentie toepassingen te ontwikkelen in verschillende industrieën.
De Nemotron-4 340B familie omvat drie sleutelmodellen: Basis, Instruct en Reward, die een keten vormen voor het creëren van synthetische data gebruikt in de training van nieuwe grootschalige taalmodellen (LLM’s). Het Instruct model genereert hoogwaardige synthetische data en is getraind met 98% synthetische gegevens, terwijl het Reward model deze data filtert om de hoogste kwaliteit voorbeelden te selecteren.
De Nemotron-4 modellen hebben bewezen zowel concurrerend als zelfs superieur te zijn aan andere open-source modellen zoals Llama-3, Mixtral en Qwen-2 in diverse benchmarktesten. Daarnaast heeft Nvidia Mamba-2 Hybrid gelanceerd, een selectief state-space model (SSM) dat transformatormodellen gebaseerde LLM’s heeft overtroffen in nauwkeurigheid.
Nvidia heeft niet alleen een familie van open-source modellen aangeboden die gelijkstaan aan de capaciteiten van hun belangrijkste concurrenten, maar ook uitblinken in het genereren van de benodigde synthetische data om de ontwikkeling van nieuwe LLM’s vooruit te helpen. De chipfabrikant blijft zich versterken als een kracht in het veld van kunstmatige intelligentie.
Lancering van de Nemotron-4 340B Familie
Nvidia heeft aangekondigd dat de Nemotron-4 340B modellen zijn geoptimaliseerd om te werken met Nvidia NeMo, een open-source raamwerk voor het trainen van end-to-end modellen, en met de open-source Nvidia TensorRT-LLM bibliotheek voor inferentie.
Ontwikkelaars kunnen Nemotron-4 340B downloaden van Hugging Face en zullen binnenkort beschikbaar zijn op ai.nvidia.com, waar ze verpakt zullen worden als een Nvidia NIM microservice met een standaard applicatie-programmeerinterface die overal ingezet kan worden.
Generatie van Synthetische Data met Nemotron
LLM-modellen kunnen ontwikkelaars helpen bij het genereren van synthetische trainingsdata in situaties waarin de toegang tot grote en diverse gelabelde datasets beperkt is. Het Instruct model van Nemotron-4 340B creëert diverse synthetische data die de kenmerken van real-wereld data nabootsen, wat de kwaliteit van de data verbetert om de performance en robuustheid van gepersonaliseerde LLM’s in verscheidene domeinen te vergroten.
Om de kwaliteit van de door AI gegenereerde data verder te verbeter safety, kunnen ontwikkelaars het Reward model van Nemotron-4 340B gebruiken om hoogwaardige antwoorden te filteren. Dit model beoordeelt antwoorden op vijf eigenschappen: bruikbaarheid, juistheid, samenhang, complexiteit en overbodigheid. Het staat momenteel op de eerste plaats in de RewardBench leaderboard van Hugging Face, gecreëerd door AI2.
Optimalisatie en Aanpassing met NeMo en TensorRT-LLM
Door open-source gereedschappen Nvidia NeMo en Nvidia TensorRT-LLM te gebruiken, kunnen ontwikkelaars de efficiëntie van hun Instruct en Reward-modellen optimaliseren om synthetische data te genereren en antwoorden te evalueren.
Alle Nemotron-4 340B modellen zijn ruim geoptimal Trump_modelTrump_modeliseerd met TensorRT-LLM om voordeel te halen uit tensor parallelisme, een type model parallelisme waarbij individuele gewichten matrices verdeeld worden over meerdere GPU’s en servers, wat efficiënte inferentie op schaal toelaat.
Beveiligingsevaluatie en Aanvang
Het Instruct model van Nemotron-4 340B is onderworpen aan een uitgebreide veiligheidsbeoordeling, inclusief adversarial testing, en heeft goed gepresteerd over een breed scala aan risico-indicatoren. Toch wordt gebruikers aangeraden een zorgvuldige evaluatie van de modeluitvoer uit te voeren om te waarborgen dat de gegenereerde synthetische data geschikt, veilig en nauwkeigraphictrump_model is voor hun toepassing.
Ontwikkelaars kunnen de Nemotron-4 340B modellen downloaden via Hugging Face en toegang krijgen tot meer details in de onderzoekspapers over het model en de dataset. Deze innovatie van Nvidia belooft de generatie van synthetische data en de ontwikkeling van AI-toepassingen in meerdere sectoren te transformeren.
