Dopo aver letto notizie del tipo _"Groq fa tremare ChatGPT di OpenaAI"_, _"Groq può togliere la leadership a NVIDIA"_ ecc, clickbait ed esagerazioni a parte, mi sono chiesto: **Groq, che azienda è?** Dato che non la conoscevo, sono andato ad approfondire la cosa, vediamo un passo alla volta e direi che ne è valsa la pena! ![Groq Inc, logo](https://wow.groq.com/wp-content/uploads/2023/11/header_1200x628-02.jpg.webp) Groq è una startup con sede a _Mountain View (California)_, quindi zona _Silicon Valley_ assieme a _Google_, ecc. L'azienda è stata fondata nel 2016 e attenzione a non confonderlo con Grok, chatbot ancora in fase sperimentale di [xAI](https://ethicalhacking.freeflarum.com/d/810-elon-musk-e-xai-la-nuova-ia-contro-openai-e-google), fondata da Elon Musk (almeno ad oggi, "tutto fumo e niente arrosto", fra parentesi). Groq è nota per aver sviluppato un hardware proprietario tutto suo, con la sigla LPU, secondo un ragionamento interessante: - i processori a livello costitutivo sono diventati estremamente complessi, funzionali per svolgere istruzioni sequenziali - l'[Intelligenza Artificiale](https://ethicalhacking.freeflarum.com/d/689-cosa-si-intende-per-intelligenze-artificiali) (specialmente i chatbot che usiamo oggi) necessita di prendere decisioni in tempo rapido, con difficoltà nel raggiungere prestazioni soddisfacenti e contenere il consumo di energia - dopo il fallimento nel tentare di aggiungere componenti e rendere ancora più complesse le CPU, è stata trovata una "soluzione parziale", quella delle GPU: eseguono molti calcoli in parallelo (maggiore produzione di calore, scarsa uniformità dello stesso e quindi possibilità di picchi, ecc), ma anche le GPU incontrano limiti soprattutto per quanto riguarda la rapidità di esecuzione - l'azienda Groq ha quindi brevettato **LPU** (_Language Process Unit_) ovvero "unità di elaborazione linguistica", con un particolare tipo di chip, chiamato _Tensor Streaming Processor (TSP)_: un modello linguistico come ChatGPT risulterebbe in questo modo [u]fino a dieci volte più veloce[/u] se fatto girare su un'architettura LPU anziché GPU e il rapporto qualità-prezzo sarebbe addirittura [u]cento volte migliore rispetto ai componenti forniti da [NVIDIA](https://ethicalhacking.freeflarum.com/d/560-analisi-seo-nvidia)[/u] (la crescita di NVIDIA, facendole raggiungere numeri stratosferici nell'ultimo anno, divenendo nella top 3 delle [aziende più grandi al mondo per capitalizzazione](https://ethicalhacking.freeflarum.com/d/1069-classifica-real-time-aziende-con-maggiore-capitalizzazione-al-mondo), è dovuta principalmente al fatto che si è resa indispensabile vendendo chi ultracostosi, che finora è stata l'unica azienda in grado di fornire su larga scala e con quel livello di prestazioni e affidabilità); le LPU quindi sono componenti sviluppati in modo specifico per essere efficienti nelle operazioni che riguardano machine learning, algoritmi di Intelligenza Artificiale Dal sito ufficiale, un'immagine che mostra le prestazioni, netta leadership globale grazie a questa tecnologia proprietaria. ![GPU vs LPU, Groq performance](https://wow.groq.com/wp-content/uploads/2024/02/AnyScale-Leaderboard-High-rez_.jpg.webp) Groq ha sviluppato un proprio chatbot che possiamo testare liberamente, all'indirizzo [groq.com](https://groq.com/), si effettua l'accesso con account Google, in modo analogo agli altri servizi. Possiamo scegliere fra due [LLM](https://ethicalhacking.freeflarum.com/d/844-code-llama-il-modello-linguistico-di-meta-per-la-programmazione), **Llama2-70b-4096** (70 miliardi di parametri, 4096 token alla volta) e **Mixtral-8x7b-32768** (8 blocchi da 7 miliardi di parametri ciascuno, 32768 token alla volta; vedi anche [Mistral AI](https://ethicalhacking.freeflarum.com/d/1134-mistral-le-chat-chatbot-ia-europeo)). In genere le risposte sono accurate e di buona qualità, contenendo bene il fenomeno delle "allucinazioni" (da un breve test, direi in linea con _ChatGPT_). Dopo ogni risposta, viene fornito un box info, con "input token", "velocità input T/s", "output token", "velocità oputput T/s", "tempo totale". È in continua evoluzione e miglioramento, rispetto alla media dichiarata 185 T/s nel primo test ufficiale (il secondo migliore, Anyscale, con 66 T/s quindi nettamente distaccato), ora dal mio test come vediamo nell'immagine che segue, ha raggiunto 523,19 T/s oltre ad avermi fornito una risposta chiara e precisa (si consiglia di usare la lingua inglese). ![Groq AI test chabot: GPU vs LPU](https://i.postimg.cc/4Nb5R7Xs/groq-AI-chatbot-test.png) Per concludere, divertente la provocazione ad Elon Musk, fatta da Groq (wow.groq.com): >Hey Elon, It’s Time To Cease & De-grok

Groq AI: Chatbot e l'unicità delle LPU

Giulio_M

Dopo aver letto notizie del tipo "Groq fa tremare ChatGPT di OpenaAI", "Groq può togliere la leadership a NVIDIA" ecc, clickbait ed esagerazioni a parte, mi sono chiesto: Groq, che azienda è? Dato che non la conoscevo, sono andato ad approfondire la cosa, vediamo un passo alla volta e direi che ne è valsa la pena!

Groq Inc, logo

Groq è una startup con sede a Mountain View (California), quindi zona Silicon Valley assieme a Google, ecc. L'azienda è stata fondata nel 2016 e attenzione a non confonderlo con Grok, chatbot ancora in fase sperimentale di xAI, fondata da Elon Musk (almeno ad oggi, "tutto fumo e niente arrosto", fra parentesi).

Groq è nota per aver sviluppato un hardware proprietario tutto suo, con la sigla LPU, secondo un ragionamento interessante:

i processori a livello costitutivo sono diventati estremamente complessi, funzionali per svolgere istruzioni sequenziali
l'Intelligenza Artificiale (specialmente i chatbot che usiamo oggi) necessita di prendere decisioni in tempo rapido, con difficoltà nel raggiungere prestazioni soddisfacenti e contenere il consumo di energia
dopo il fallimento nel tentare di aggiungere componenti e rendere ancora più complesse le CPU, è stata trovata una "soluzione parziale", quella delle GPU: eseguono molti calcoli in parallelo (maggiore produzione di calore, scarsa uniformità dello stesso e quindi possibilità di picchi, ecc), ma anche le GPU incontrano limiti soprattutto per quanto riguarda la rapidità di esecuzione
l'azienda Groq ha quindi brevettato LPU (Language Process Unit) ovvero "unità di elaborazione linguistica", con un particolare tipo di chip, chiamato Tensor Streaming Processor (TSP): un modello linguistico come ChatGPT risulterebbe in questo modo fino a dieci volte più veloce se fatto girare su un'architettura LPU anziché GPU e il rapporto qualità-prezzo sarebbe addirittura cento volte migliore rispetto ai componenti forniti da NVIDIA (la crescita di NVIDIA, facendole raggiungere numeri stratosferici nell'ultimo anno, divenendo nella top 3 delle aziende più grandi al mondo per capitalizzazione, è dovuta principalmente al fatto che si è resa indispensabile vendendo chi ultracostosi, che finora è stata l'unica azienda in grado di fornire su larga scala e con quel livello di prestazioni e affidabilità); le LPU quindi sono componenti sviluppati in modo specifico per essere efficienti nelle operazioni che riguardano machine learning, algoritmi di Intelligenza Artificiale

Dal sito ufficiale, un'immagine che mostra le prestazioni, netta leadership globale grazie a questa tecnologia proprietaria.

GPU vs LPU, Groq performance

Groq ha sviluppato un proprio chatbot che possiamo testare liberamente, all'indirizzo groq.com, si effettua l'accesso con account Google, in modo analogo agli altri servizi. Possiamo scegliere fra due LLM, Llama2-70b-4096 (70 miliardi di parametri, 4096 token alla volta) e Mixtral-8x7b-32768 (8 blocchi da 7 miliardi di parametri ciascuno, 32768 token alla volta; vedi anche Mistral AI). In genere le risposte sono accurate e di buona qualità, contenendo bene il fenomeno delle "allucinazioni" (da un breve test, direi in linea con ChatGPT).

Dopo ogni risposta, viene fornito un box info, con "input token", "velocità input T/s", "output token", "velocità oputput T/s", "tempo totale". È in continua evoluzione e miglioramento, rispetto alla media dichiarata 185 T/s nel primo test ufficiale (il secondo migliore, Anyscale, con 66 T/s quindi nettamente distaccato), ora dal mio test come vediamo nell'immagine che segue, ha raggiunto 523,19 T/s oltre ad avermi fornito una risposta chiara e precisa (si consiglia di usare la lingua inglese).

Groq AI test chabot: GPU vs LPU

Per concludere, divertente la provocazione ad Elon Musk, fatta da Groq (wow.groq.com):

Hey Elon, It’s Time To Cease & De-grok

Fondatori