Abbiamo già parlato di Leo AI, l'assistente di intelligenza artificiale generativa integrato nel browser Brave. Vediamo ora un confronto fra Leo AI e Opera Aria, Aria è l'analoga soluzione di IA integrata presente nel browser Opera.
A fine 2024, i due strumenti si presentano così:
- Brave Leo AI: di default con accesso gratuito, llama3.1 8B (general purpose chat)
- Opera Aria: non possiamo scegliere direttamente quale modello usare, abbiamo comunque un misto di (degli ottimi!) gpt-4o, gemini 1.5, imagen 3; possiamo però scegliere altre impostazioni avanzate, come specificare la tipologia di task, il tono da usare (formale, informale, ecc) e la lunghezza del testo; ricordiamo comunque che, a parte l'impostazione già predefinita eventualmente da selezionare, a livello di prompt testuale possiamo (anzi, è consigliato!) essere precisi in modo tale che il chatbot sappia che abbiamo esigenze specifiche per la risposta (ad esempio "spiegazione a livello universitario dell'argomento... strutturato in punti" piuttosto che "spiegazione dell'argomento")
Un chatbot integrato nel browser ha come scopo principale un'analisi relativa ad una specifica pagina web (altrimenti per domande generiche, tanto vale andare su ChatGPT o altro che sia). Nel caso in esame, la mia domanda è stata di farmi una sintesi di una pagina di Ethical Hacking Forum, in particolare:
Opera Aria (gpt-4o, gemini 1.5, imagen 3) - sintesi dell'articolo
Certo! Ecco una sintesi dell'articolo riguardante Qwen 2, l'IA cinese di Alibaba:
Sintesi dell'articolo su Qwen 2
Introduzione a Qwen 2: Qwen 2 è un modello di intelligenza artificiale sviluppato da Alibaba, progettato per competere con altre IA avanzate sul mercato.
Test e prestazioni: L'articolo discute vari test effettuati su Qwen 2, evidenziando le sue capacità in diversi ambiti, come la risoluzione di problemi di fisica e algebra. In particolare, il modello ha dimostrato buone performance nella comprensione e nell'elaborazione di richieste complesse.
Applicazioni pratiche: Viene menzionato come Qwen 2 possa essere utilizzato in vari settori, dalla programmazione alla cybersecurity, rendendolo uno strumento versatile per professionisti e aziende.
Conclusioni: L'articolo conclude che Qwen 2 rappresenta un passo significativo per Alibaba nel campo dell'IA, con potenzialità promettenti per il futuro.
Se hai altre domande o vuoi approfondire qualche aspetto specifico, fammi sapere! 😊
Brave Leo AI (Llama 3.1 8B by Meta) - sintesi dell'articolo
Sintesi dell'articolo "Qwen 2: l'IA cinese di Alibaba, test e recensione"
L'articolo descrive Qwen 2, un'intelligenza artificiale (IA) sviluppata da Alibaba che può eseguire compiti di ricerca e analisi di dati. L'autore del post descrive la sua esperienza di utilizzo di Qwen 2, evidenziando le sue funzionalità e limiti.
Funzionalità di Qwen 2
- Eseguire compiti di ricerca e analisi di dati
- Utilizzare linguaggi di programmazione come Python
- Integrarsi con altre tool e librerie
Limiti e criticità
- Difficoltà nell'utilizzo e configurazione
- Limiti nella capacità di comprensione del linguaggio naturale dovuta a una mancanza di dettagli sulla sicurezza e sulla protezione dei dati
Risultati della recensione
L'autore conclude che Qwen 2 è una IA potente e versatile, ma richiede una certa esperienza e conoscenza per essere utilizzata in modo efficace.
Se desideri approfondire questo argomento, sono a tua disposizione per fornirti ulteriori informazioni.
Conclusioni
A livello generale, il chatbot fornisce una sintesi dell'articolo. La capacità di analisi però non è delle migliori, pertanto può essere consigliato per richieste "semplici", altrimenti è più opportuno usare direttamente ChatGPT, Mistral AI, Google Gemini, che risultano più accurati. Ad esempio, da questo test vediamo quali sono le criticità di entrambi gli strumenti:
- Opera Aria indica <<risoluzione di problemi di fisica e algebra [...] buone performance nella comprensione e nell'elaborazione di richieste complesse>>, cosa non vera, ho proprio evidenziato che è carente in questo punto!!
- Brave Leo AI indica una risposta molto generalista e come "limiti e criticità" indica <<Difficoltà nell'utilizzo e configurazione>> e anche <<Limiti nella capacità di comprensione del linguaggio naturale dovuta a una mancanza di dettagli sulla sicurezza e sulla protezione dei dati>>; cose che nell'articolo non sono affatto scritte
Quindi in conclusione, un task di questo tipo non era forse semplicissimo da interpretare, anche se per curiosità ho poi sottoposto la valutazione anche a ChatGPT e Mistral AI - Le Chat, non occorre riportare le risposte, hanno comunque analizzato il contesto in modo molto più pertinente e accurato. Diciamo che i due tool come qualità del risultato si equivalgono, appena sufficiente possiamo dire, non oltre. Per l'analisi di articoli più semplici, la capacità di comprensione e rielaborazione probabilmente è migliore. Diciamo che, almeno ad oggi, questi due strumenti li consiglierei eventualmente solo per task brevi e semplici, altrimenti l'affidabilità viene meno ed è evidente il gap con altri strumenti, di qualità sicuramente superiore.