Introduzione a SEA-LION.AI
SEA-LION.AI è un progetto molto interessante sviluppato da AI Singapore, istituto di ricerca a Singapore. I modelli sviluppati sono aperti, open-source con lo scopo di essere inclusivi per tutto il Sud-est asiatico (SEA), quindi cercando di comprendere e rappresentare le diverse lingue, anche culture e contesti. Come dichiarato dal sito ufficiale: <<First multimodal release, multiple quantized versions among open models (<200B) for SEA>>.
Oggi alla versione 4, i modelli più interessanti della famiglia sono Qwen-SEA-LION-v4-32B-IT e Gemma-SEA-LION-v4-27B-IT, il modello di base Qwen è stato sviluppato da Qwen AI (gruppo Alibaba), mentre Gemma da Google. Brevemente, anche se nel complesso i due modelli hanno performance abbastanza simili (modello 32B vs 27B), la variante Qwen è più indicata per ragionamento avanzato solo testo, la variante Gemma è un po' più efficiente (velocità, consumo risorse) e consente la multimodalità quindi ad esempio analisi di immagini.
L'efficienza raggiunta da entrambi è impressionante, trattandosi di modelli relativamente piccoli (32B, 27B), quindi sono molto ottimizzati e nei benchmark raggiungono ottimi risultati (sito ufficiale: leaderboard.sea-lion.ai).

SEA-LION.AI - Come accedere
Il progetto, lo ammetto mi è piaciuto fin da subito, appare molto interessante già dall'Homepage (sea-lion.ai). Compare infatti questa scelta:
- Try SEA-LION (in alto a destra): utilizzabile anche senza login, possiamo selezionare il modello preferito (Qwen / Gemma) oppure lasciarlo automatico
- SEA-LION Telegram: una funzionalità molto interessante, installa un bot Telegram (@sealion_ai_bot, SEA-LION AI Singapore), molto comodo, funzionalità che solo pochi altri tool hanno implementato
- SEA-LION Playground: questo è il paradiso per un nerd (è un caso che la traduzione di "playground" sia "parco giochi"? 😅), si possono confrontare fino a 4 diversi modelli in contemporanea e se vogliamo possiamo anche selezionare i parametri come "temperature", "top_p", ecc; per certi aspetti simile a LMArena (quest'ultimo consente di interagire con moltissimi LLM sia open-source sia proprietari) ma con il vantaggio di poter personalizzare direttamente i parametri, modalità da sviluppatore
Sono poi disponibili anche progetti extra, molto interessanti come AI Town, <<Multilingual AI Simulations with SEA-LION>>, che richiedono l'installazione di pacchetti (in alternativa possiamo eseguire le varie installazioni tramite GitHub).
Può accedere chiunque, dal semplice utente "curioso" a ricercatori, sviluppatori, quindi un progetto interessante consigliato a tutti, almeno come test, sperimentazione (poi vediamo nei dettagli tutte le particolarità, aspetti interessanti del progetto). In base all'indirizzo IP si collega a diversi server nel mondo (Singapore, USA, Europa) quindi anche latenza e velocità di risposta sono buone.
Vediamo ora dei test specifici. Saltiamo il semplice "Try SEA-LION" perché fondamentalmente se poi studiamo gli altri, questo sarebbe una ripetizione.
SEA-LION - Playground: test
Per usare questa funzionalità accedere tramite account Google. Il mio prompt è stato la richiesta di valutare questo nostro articolo: Inception - Mercury AI Diffusion: test del primo dLLMs a scala commerciale, nello specifico:
Ti chiedo di valutare punti di forza e debolezza di questo articolo pubblicato su un forum, contesto informale. Titolo "Inception - Mercury AI Diffusion: test del primo dLLMs a scala commerciale", contenuto (con markdown e link interni allo stesso sito): { copia-incolla del testo }
Ho confrontato i modelli Qwen-SEA-LION-v4-32B-IT e Gemma-SEA-LION-v4-27B-IT (possiamo scegliere anche altre versioni più vecchie dei modelli). Entrambe le risposte sono state buone, consigli generali, la prima un po' più completa avendo modalità "Reason"; di questa ho settato alcuni parametri, temperature 0.7 è un giusto compromesso (no allucinazioni ma no eccessiva rigidità dovendo fornire dei consigli, spunti, un minimo di creatività può essere utile), max token 1000 sicuramente è un valore piccolo, risposta molto concisa. Questo era solo un test, a seconda delle nostre necessità poi possiamo impostare i parametri opportuni. A seguire, uno screenshot che mostra l'utilizzo.

SEA-LION Telegram: test
La mia richiesta in questo caso era in ambito economia e finanza, analisi strategica fra un investimento a lungo termine in indice della Svizzera🇨🇭 o Singapore🇸🇬. Nello specifico, ecco il mio prompt:
[economia e finanza] chiedo una valutazione (per investire italiano, europeo), confronto fra un investimento a lungo termine in un indice della Svizzera o Singapore. Chiedo una risposta tecnica avanzata. Ecco le mie riflessioni: - entrambi stati con credit rating AAA - entrambi con import/export bilanciato (non dovrebbero esserci forti pressioni valutarie); tuttavia Eur/sgd ha un trend decrescente nel lunghissimo periodo (10+ anni), laterale in un orizzonte di 5 anni, rialzista nell'ultimo anno; Eur/chf continua ad essere costantemente decrescente (vorrei un commento di analisi fondamentale, dato che apparentemente due economie solide con import/export bilanciato); da investitore europeo, se nel lungo termine la valuta locale si rinforza, a me conviene (l'opposto di investire es. in India o Argentina, in cui la valuta locale generalmente si deprezza erodendo parte del rendimento o peggio portando ad una perdita complessiva) - conosco meglio l'economia di Singapore, concentrazione bancaria simile all'Italia, con la differenza di maggiore solidità (ROE, ROA e ovviamente anche il rating dello stato, efficienza generale), buoni dividendi con yield e payout sostenibile; per la Svizzera, le principali aziende sono Roche, Novartis, Nestlé, prospettive più neutre, EPS stabili o in calo; la principale banca, UBS Group, ha previsione crescita utili ma PE di circa 20 e ROA, ROE, margine netto notevolmente inferiore ad altri player (DBS Group o anche l'italiana UniCredit, valori anche doppi o tripli) - economia solida, bassi drawdown e tasso di cambio favorevole (quantomeno non svantaggioso come tipicamente i paesi emergenti che deprezzano la loro valuta nel tempo), dividendi sostenibili sono il mio interesse (quindi un investimento "buy & hold" a lungo, lunghissimo termine e con eventuali opportunità di DCA sui ribassi)
La risposta del software (modello Qwen-SEA-LION-v4-32B-IT) è stata lunga e dettagliata come la mia domanda, nello screenshot che segue riporto la parte conclusiva, con una chiara tabella operativa per i vari parametri (entrambe economie "simili" lato stabilità, la Svizzera risulta più "Premium" in quanto attenua maggiormente i drawdown, è considerata più un "rifugio" almeno ad oggi, Singapore pur simile per vari aspetti ha una volatilità un po' superiore ma anche reali opportunità di crescita maggiore).

Bonus Test: SEA-LION - qualche bias 😅
Questo mi ha fatto un po' sorridere. Analogamente al test eseguito in SEA-LION Playground, ho posto la stessa domanda anche nel semplice Try SEA-LION e di default ha risposto Qwen-SEA-LION-v4-32B-IT. La risposta nota punti di forza e alcuni punti di debolezza del mio articolo che ho condiviso, e come da richiesta mostra dei consigli di miglioramento. È molto curioso che in un punto indichi "assenza di confronto con modelli SEA-LION". Per capirci, nell'articolo parlavo di una nuova tecnologia, tipologia di architettura per i modelli IA (dLLM, Diffusion AI applicato all'IA generativa testuale anziché all'ImageAI come di consuetudine), quindi proporre un confronto con altri modelli effettivamente è un consiglio valido, che completa lo studio. La cosa curiosa è che a livello europeo, almeno ad oggi, ahimé io che scrivo sono uno dei pionieri per quanto riguarda SEA-LION.AI, quindi è molto di nicchia (d'altra parte, è nato per il contesto del Sud-est asiatico, in Europa sono enormemente più utilizzati altri modelli e soluzioni). Quindi significa che il modello semplicemente ha detto "potevi confrontarlo con me". Questo evidente bias o lieve intento autopromozionale, fa sorridere ("questo avrebbe fornito una prospettiva più completa"). Ecco uno screenshot che mostra questa parte di risposta.

Conclusioni su SEA-LION.AI
Che dire, voto 9.5/10, giudizio eccellente: con ulteriori migliorie a livello internazionale, raggiungerebbe la perfezione. Dal progetto iniziale, la filosofia del team (inclusività, adattamento ai vari contesti... Anche la lingua italiana, pur lontana dal progetto non essendo ovviamente parte del Sud-est asiatico, ottiene una qualità di risposta molto valida - solo qualche imprecisione occasionale nella traduzione, per un modello medio-piccolo è del tutto accettabile), ai risultati raggiunti con benchmark di tutto rispetto per modelli di medio-piccola dimensione, efficienza molto buona, dataset e fine-tuning di alta qualità. Poi la versatilità, dal semplice accesso anche senza login, alla sezione Playground molto dettagliata, al bot Telegram, lo rendono un progetto unico. Anche se oggi gli utenti italiani, europei che fanno uso di questi modelli sono pochi - io sono uno dei pochi e non ne conosco altri 😅-, sono sicuro che in futuro saranno sempre più in crescita, vista la sua validità internazionale!🌎
Bonus 2.0 - storia e curiosità sul logo
Merita un approfondimento il gioco di parole: "SEA LION" è la traduzione di leone marino (famiglia Otariini, es. le comuni foche) ma è anche SEA+LION dove "SEA" è il sudest asiatico e "LION" il leone (non leone marino 😅), simbolo di Singapore: in linea malese Singapore deriva da "Singapura", letteralmente "città del leone". La mascotte ufficiale di Singapore è il Merlion, creatura mitologica con testa di leone e corpo di pesce, creata nel 1964. Quindi il leone marino non centra direttamente con Singapore, con il progetto SEA-LION.AI, anche se compaiono delle raffigurazioni come quella che segue, creata tramite IA, tratta da un post LinkedIn ("Sony and AI Singapore Collaborate on SEA-LION LLMs", un esempio anche questo per una diffusione su larga scala, estensione ad altri contesti a livello mondiale quindi la nascita di nuove opportunità future). Nell'immagine finale, vediamo quindi il logo ufficiale di SEA-LION.AI, la fontana del Merlion a Singapore e una raffigurazione ImageAI tratta dal post LinkedIn, molto carina ma come specificato, non direttamente correlata con il progetto.
