NVIDIA Nemotron è una famiglia di modelli di IA multimodale, orientati all'ambito aziendale (enterprise). L'azienda ha sviluppato diversi modelli specializzati (vedi IA verticale), con capacità di ragionamento avanzato, coding, elaborazione di immagini (ragionamento visivo), ecc.
Gli agenti AI sono sistemi autonomi capaci di pianificare, agire e interagire con strumenti digitali: sono ideali per automatizzare processi aziendali complessi. NVIDIA punta proprio a questo mercato con la famiglia Nemotron.
I modelli sono addestrati in modo trasparente con un training open-weight. Nello specifico, abbiamo queste famiglie di modelli:
- NVIDIA Nemotron Nano: semplice ed economica, adatta all'implementazione locale, dispositivi edge (hardware limitato)
- NVIDIA Nemotron Super: il miglior compromesso qualità/efficienza
- NVIDIA Nemotron Ultra: il modello di punta, massima accuratezza, ideale per sistemi complessi, implementazione in Data Center multi-GPU
Possiamo testare i vari modelli NVIDIA Nemotron dal sito ufficiale build.nvidia.com, così come altri modelli (ad esempio sul sito NVIDIA sono presenti gpt-oss-20b, gpt-oss-120b, ecc). Vediamo uno screenshot della scelta dei modelli sul sito ufficiale build.nvidia.com.

Mistral NeMo: la collaborazione NVIDIA - Mistral AI
Nel 2024 è stata annunciata un'interessante collaborazione fra NVIDIA e l'azienda europea Mistral AI, per la creazione del modello Mistral NeMo (fonti ufficiali: nvidia.com, mistral.ai). Si tratta di un modello denso da 12B parametri con finestra token 128k (i modelli Nemotron con elevato numero di parametri sono invece MoE, più indicati in quel caso), un ottimo compromesso fra accuratezza ed efficienza (netto miglioramento rispetto al precedente modello Mistral 7B). Per confronto, concorrenti come Google-Gemma2-9B e Llama3-8B offrono un contesto di soli 8k token. Nel complesso, Mistral NeMo è risultato superiore ai modelli comparabili. Vediamo un'immagine, confronto benchmark, tratta dal sito ufficiale mistral.ai.

Questa collaborazione ha prodotto un modello che combina l'expertise di Mistral AI nei dati di training con l'ecosistema hardware e software ottimizzato di NVIDIA.
Sia Nemotron sia Mistral NeMo sono ottimizzati per creare agenti AI capaci di operare in modo autonomo.
Nemotron lo possiamo trovare sulla piattaforma di microservizi NVIDIA NIM (microservizi per l'inferenza IA, sito ufficiale nvidia.com) oppure lo possiamo scaricare tramite Ollama (ollama.com/library/nemotron). Anche Mistral NeMo è presente su Ollama (ollama.com/library/mistral-nemo).