La novità dei giorni scorsi: Google Bard diventa Google Gemini! È stato rilasciato ed è disponibile anche per l'Italia il nuovo modello molto più avanzato del precedente, infatti bard.google.com rimanda ora a gemini.google.com. Si nota subito un notevole incremento di qualità (ChatGPT, fatta eccezione per le "notizie recenti" in quanto è fermo al 2021, nel complesso era superiore a Google Bard, mentre ora con l'arrivo di Gemini su molti aspetti si equivalgono e per altri è attualmente superiore quest'ultimo, ricordiamo che entrambi sono in continuo svilupppo ed evoluzione). Fare un test generale, completo, sarebbe impossibile, quindi ho evidenziato alcuni punti.

Domanda generale (ambito programmazione):

HTML: come integreresti al meglio nella pagina (lato UX e best-practices di programmazione) un elemento tramite <model-viewer> ?

La risposta (che non riporto per intero) è lunga e dettagliata, organizzata in punti (ognuno dei quali presenta dei sottoelementi specifici):

Integrare un elemento tramite <model-viewer>: UX e best practices di programmazione
Per integrare al meglio un elemento 3D nella tua pagina web tramite <model-viewer>, tenendo a mente l'UX e le best practices di programmazione, ecco alcuni punti chiave da considerare:

UX:

  1. posizionamento e dimensioni: [...]
  2. interazione: [...]
  3. accessibilità: [...]

Best practices di programmazione:

  1. ottimizzazione delle prestazioni: [...]
  2. compatibilità del browser: [...]
  3. accessibilità: [...]
  4. documentazione [...]

Esempio di codice:

<model-viewer src="model.gltf" ar="1.5" camera-controls autoplay>
  <orbit-controls></orbit-controls>
</model-viewer>

Domanda di analisi Real Time di una pagina web

Anche qui la risposta è piuttosto lunga e dettagliata, dai consigli che si leggono è chiaro che non sono indicazioni generiche ma effettivamente ha letto il contenuto; la risposta molto articolata è stata suddivisa in punti (riporto solo una sintesi):

Analisi SEO e UX della pagina https://ethicalhacking.freeflarum.com/d/1076-wordpress-non-hai-i-permessi-per-caricare-questo-tipo-di-file

SEO

  • on-page: [...]
  • off-page: [...]

UX

Miglioramenti

Conclusione
La pagina https://ethicalhacking.freeflarum.com/d/1076-wordpress-non-hai-i-permessi-per-caricare-questo-tipo-di-file è ben ottimizzata per i motori di ricerca e offre un'esperienza utente soddisfacente. Tuttavia, ci sono alcuni miglioramenti che potrebbero essere apportati per migliorare ulteriormente le prestazioni della pagina.

Analisi di un'immagine

Google Gemini consente anche di caricare un'immagine e quindi fare una richiesta basandosi sul file caricato.

Il primo test è fallito, probabilmente a causa di un bug, ovvero:

Riesci a descrivermi la seguente immagine che ho allegato?
[questa immagine è stata rimossa]

Quindi ho risolto in questo modo:

L'immagine si trova all'indirizzo https://i.postimg.cc/nLZJD9Ys/lisa-missione-nasa-esa-2035.jpg

Nello specifico si tratta dell'immagine presente nella discussione LISA: la missione NASA-ESA per cercare nuove onde gravitazionali

Il risultato è stato più che soddisfacente, Gemini ha individuato sia gli elementi testuali nell'infografica sia gli altri elementi visuali. Riporto una sintesi della risposta:

Ecco l'immagine della Missione LISA 2035:
[anteprima dell'immagine]
L'immagine mostra l'osservatorio spaziale LISA in orbita attorno al Sole. LISA è una costellazione di tre satelliti che utilizzano laser per misurare le increspature dello spazio-tempo causate dalle onde gravitazionali. [...]

Ecco alcuni dettagli aggiuntivi sull'immagine:

  • I tre satelliti LISA sono disposti in un triangolo equilatero, con lati di 2,5 milioni di chilometri.
  • I satelliti utilizzano laser per misurare la distanza tra loro con una precisione di pochi picometri.
  • Le increspature dello spazio-tempo causate dalle onde gravitazionali causano piccole variazioni nella distanza tra i satelliti.
  • Queste variazioni di distanza possono essere utilizzate per ricostruire la forma e l'ampiezza delle onde gravitazionali.

LISA è un progetto ambizioso che ci aiuterà a comprendere meglio l'universo. L'osservatorio sarà in grado di rilevare onde gravitazionali da sorgenti che non possono essere osservate con altri mezzi. Ciò ci fornirà nuove informazioni sulla formazione e l'evoluzione dell'universo.

In conclusione possiamo dire che Gemini si è dimostrato uno strumento di buona qualità! Decisamente un passo avanti rispetto a Google Bard che, oltre ad una limitazione generale nelle funzionalità, aveva anche problemi di vario genere, vedi ad esempio I bias (pregiudizi) dell'IA, ChatGPT e Google Bard a confronto. Il nuovo Gemini sarà comunque in evoluzione, già da ora occorre riconoscere che la qualità e attendibilità dei risultati è molto valida, sempre da perfezionare ma un netto salto avanti rispetto a prima.

un anno dopo

Gemini 2.0 vs Gemini 1.5

A fine 2024 arriva in versione sperimentale (ora nel 2025 è effettiva) la versione 2.0 di Google Gemini, con un significativo miglioramento rispetto alla versione 1.5.

Diciamo pure che la precedente versione 1.5 era una delusione per Google, rispetto a ChatGPT decisamente più avanzato e accurato (Gemini dalla sua parte aveva solo una migliore integrazione con l'ecosistema Google, accesso al web real time, vantaggio non da poco dato che Google ha decisamente il monopolio come motore di ricerca).

Anche la versione gratuita di Google Gemini, con l'aggiornamento 2.0, è notevolmente migliorata. Vediamo poi su Chatbot Arena che Gemini Advanced, la versione a pagamento, a livello di benchmark, valutazione da parte degli utenti, avrebbe superato anche ChatGPT (poi con deepseek-r1, grok-3, diciamo che sono più o meno tutti alla pari come punteggio generale, differenziandosi eventualmente per compiti specifici).

Rispetto alla versione 1.5, con la versione 2.0 abbiamo una migliore qualità generale della risposta (sia il contenuto, sia la forma), migliore riconoscimento multimodale, sempre con un funzionamento veloce ed efficiente.

Il nuovo Gemini 2.0 si presenta così:

  • Gemini 2.0 Flash: rapido ed efficiente, domande semplici e generiche, riassunto di un testo
  • Gemini 2.0 Flash Thinking Experimental: livello di profondità maggiore, analisi più dettagliate e ragionamento logico approfondito
  • Gemini 2.0 Flash Thinking Experimental with Apps: maggiore integrazione con app dell'ecosistema Google, dall'automazione di compiti (gestione calendario, appuntamenti) alla ricerca di informazioni specifiche

Quindi a seconda della nostra situazione, scegliamo il modello opportuno, più indicato per quel compito specifico. Da ricordare poi che il nostro prompt è fondamentale, più riusciamo ad essere chiari nell'esporre la richiesta, compreso il background, contesto e obiettivo preciso, più la risposta del chatbot sarà accurata e indirizzata alla nostra richiesta specifica, altrimenti il chatbot dovrà necessariamente "interpretare" cosa noi vogliamo e la risposta sarà molto generica. Questo discorso vale per qualunque chatbot.

Dal sito ufficiale blog.google vediamo come migliora il benchmark sia generale sia specifico (codice, matematica...) fra le varie versioni.
Gemini 2.0 benchmark (blog.google)

    23 giorni dopo

    Gem e Deep Research gratis per tutti

    Di recente Google ha deciso di rendere disponibile a tutti e non solo agli utenti Premium, l'uso dei Gem predefiniti e personalizzati e la Deep Research (dopo gli aggiornamenti già visti, Giulio_M, in pratica la Deep Research crea un vero e proprio report, dopo un'analisi avanzata prendendo come fonte decine di siti web, l'analisi può impiegare qualche minuto e ha senso se effettivamente vogliamo ottenere un report, altrimenti meglio usare le altre due opzioni).

    I Gem invece sono versioni personalizzate per fornire risposte su misura (anziché doverlo specificare ogni volta nel prompt, ad esempio "ambito X, linguaggio formale, tecnico, dettagliato...").

    Gli attuali Gem predefiniti sono:

    • Generatore di idee: Trova facilmente ispirazione e idee originali per feste, regali, nuove attività e tanto altro
      Consulente di carriera: Sfrutta al meglio il tuo potenziale professionale. Ottieni un piano dettagliato per affinare le tue capacità e raggiungere i tuoi obiettivi professionali
    • Partner di programmazione: Migliora le tue capacità di programmazione. Ottieni l'aiuto di cui hai bisogno per sviluppare i tuoi progetti e imparare mentre scrivi codice
    • Coach per l'apprendimento: Sono qui per aiutarti a imparare nuovi concetti e a esercitarti a metterli in pratica. Dimmi cosa vorresti imparare e ti aiuterò a iniziare
    • Revisore di testi: Migliora il tuo modo di scrivere. Ottieni consigli chiari e costruttivi, sia per la grammatica che per la sintassi

    Selezionando Nuovo Gem, possiamo creare una nostra personalizzazione, che ci servirà da template (se ad esempio dobbiamo svolgere in modo ripetitivo delle operazioni, quindi senza dover specificare tutti i dettagli ogni volta in una nuova chat).

    Powered by: FreeFlarum.
    (remove this footer)