• CyberNews
  • Google Bard usa i dati degli utenti per il training IA

Da punto-informatico leggiamo la notizia che ormai era tanto ovvia e scontata. Google (con Bard, ecc) fa uso dei dati degli utenti per il training, addestramento dei modelli di IA.

Tutti conosciamo la situazione ben nota del Garante della Privacy che aveva messo uno stop a ChatGPT in Italia (fine marzo 2023, situazione risolta dopo circa 30 giorni), principalmente per la mancanza di trasparenza nelle informazioni. Non solo ChatGPT ma anche Google e altri quantomeno incorrono in questa "zona grigia" (vedi anche di recente <<OpenAI e Microsoft accusate di violazione della privacy>>, approfondimento); visto il trend del momento (di fatto, è di questo che si tratta!) quindi anche Google ha provveduto ad aggiornare le policy, in questo modo:

Ad esempio, potremmo raccogliere informazioni pubblicamente disponibili online o da altre fonti pubbliche per contribuire all’addestramento dei modelli di AI di Google e alla creazione di prodotti e funzionalità quali Google Traduttore, Bard e funzionalità AI Cloud. Oppure, se le informazioni della tua attività vengono visualizzate su un sito web, potremmo indicizzarle e visualizzarle sui servizi Google.

Da precisare che per "dati pubblici" si intendono tutti i dati che Google riesce a reperire anche tramite altre piattaforme, al di fuori dell'ecosistema Google (ad esempio, i contenuti di un Social o Forum pubblico sono indicizzati/indicizzabili su Google...).

Riflessione: oggi sappiamo bene che Google è molto più di un motore di ricerca, è un intero ecosistema. Esso ha a disposizione il database di informazioni (dati degli utenti) più grande al mondo, secondo voi per i propri progetti (Bard, ecc) non dovrebbe forse attingervi? È grazie a questo che è leader, sempre un passo avanti rispetto alla concorrenza e grazie a dati e risorse a disposizione, lo potrà tranquillamente diventare anche per lo sviluppo delle Intelligenze Artificiali. Oggi si tratta solo (questo ovunque!!) di scrivere un paio di righe di policy, ritenute "conformi", quindi giusto un contentino per poi avere il via libera. Riguardo a ciò, pur sempre con il positivismo dell'innovazione, è comunque importante esserne informati e consapevoli.

9 giorni dopo

Oggi 13 luglio 2023 vediamo la novità: Google Bard arriva in Europa, anche in Italia!
Siamo ancora agli inizi ma si rivelerà una rivoluzione, Google è l'ecosistema che dispone del database più grande al mondo, il proprio tool accede ai risultati real time (di fatto della stessa azienda che ne conosce e controlla gli algoritmi e non servizi di terzi!). Vediamo da un rapido test, mostrato poi nell'immagine che segue, come si presenta:

  • in alto a sinistra, la scritta "Sperimentale": sembra un'inezia, in realtà è segno di trasparenza da parte di Google (analogo a dire chiaramente che si tratta di una "Beta")
  • in basso, la scritta <<Bard potrebbe mostrare informazioni offensive o imprecise che non rappresentano le opinioni di Google>>, con link all'Informativa sulla privacy di Bard: dopo i problemi di ChatGPT e il Garante della Privacy, questa chiarezza normativa era necessaria per il debutto in Europa (mentre negli USA c'è più "libertà" e meno attenzione a questi aspetti)
  • vengono generate tre diverse bozze di risposta! Un'incredibile completezza, risposte diverse da confrontare, validare, interessante per quanto riguarda il problema dell'affidabilità della risposta (del tipo "si presenta bene e quindi sembra corretta, ma invece è sbagliata!!"), spesso critico per questi tool (soprattutto ChatGPT)
  • sempre per invogliare l'utente ad un controllo aggiuntivo, al termine della risposta compare anche il bottone "Cerca su Google"
  • dalle impostazioni, "Guida", possiamo accedere a varie sezioni come ad esempio "Aggiornamenti", per seguire la cronologia
  • possibili anche varie integrazioni

google-bard-italia-esempio-calcolo-pi-greco

2 mesi dopo

Ecco una conferma (preoccupante) a quanto già detto, da punto-informatico.it:

Google Bard cerca le risposte in Gmail e Drive

Nei giorni scorsi si è parlato della "massima integrazione" di Google Bard con altre applicazioni, dell'ecosistema Google (Bard Extensions). Ora però arriva una novità che non è proprio fra le migliori in ottica privacy e rispetto dei dati degli utenti, infatti con lo scopo di "fornire risposte migliori" il software scansiona le app dei propri utenti, compreso Drive e Gmail. Tuttavia viene richiesto il permesso all'utente (opt-in), che può essere revocato in qualsiasi momento. Al momento attuale, le funzionalità di Bard Extensions sono disponibili solo il lingua inglese. È invece già disponibile anche in Italia la possibilità di condividere link pubblici di una chat (ovvero io condivido a te il link della mia chat con Bard, tu puoi leggere e continuare la conversazione con il tuo account).

Sul sito ufficiale bard.google.com vediamo tutti gli update in ordine cronologico.

Sappiamo che il tema IA ed etica è molto complesso e controverso, come indicazione generale a livello europeo abbiamo una miglior attenzione all'etica, al rispetto dei dati personali degli utenti, rispetto al contesto americano.

Vedi approfondimenti:
Aleph Alpha: la risposta europea ad OpenAI
Anthropic, Google, Microsoft e OpenAI: IA etica e sicura (forse)

7 giorni dopo

Google condivide e indicizza le chat di Google Bard (che abbiamo deciso di rendere pubbliche)

Una novità molto interessante, da searchenginejournal.com. Scrivendo site:bard.google.com/share troviamo diverse pagine già indicizzate, si tratta di conversazioni come questa, per esempio: Fai un grafico con la temperatura massima registrata del mar mediterraneao nel corso degli ultimi 100 anni anno per anno.

La notizia positiva, come già detto, è che riguarda le chat rese pubbliche. Ovvero, nella nostra chat inizialmente privata con il bot, possiamo scegliere "Condividi", viene in questo caso generato un link pubblico. Altrimenti ovviamente le conversazioni private, come ci si aspetta, rimangono private.

Google comunque valuterà bene come e cosa indicizzare, se il materiale condiviso e potenzialmente indicizzabile sia realmente di utilità (focus sulla qualità, non quantità).

Powered by: FreeFlarum.
(remove this footer)