Anthropic (Claude) accusato di violazione di copyright

Giulio_M

Come già accaduto a Perplexity AI (quest'ultimo con un'accusa anche più grave, che poi però ha saputo gestire e risolvere), ora sotto indagine finisce Anthropic, l'azienda che ha sviluppato il modello Claude (analogo a GPT di OpenAI, PaLM di Google, ecc). Sebbene in passato Anthropic fosse l'azienda americana, almeno sulla carta più orientata verso un'IA etica e sicura, ora ha ricevuto un'accusa di violazione di copyright.

Diciamolo, a differenza di Perplexity AI qui la situazione è più dubbia (<<nella documentazione ufficiale Perplexity AI ha dichiarato di rispettare le regole di accesso, cosa che invece non ha fatto>>) e la responsabilità sembrerebbe essere inferiore. Quando si vuole avere un modello enorme, con miliardi di parametri e un database così esteso, avere il controllo del copyright di tutti i dati usati per l'addestramento del modello, non è cosa semplice.

L'azienda ha fatto uso di The Pile ovvero un set di circa 880 GB di dati testuali open-source, in lingua inglese, per l'addestramento per modelli linguistici di grandi dimensioni (LLM). Il problema è che all'interno - l'azienda Anthropic poteva saperlo come no - c'erano anche dei libri piratati, quindi violazione di copyright. È stata indetta una causa collettiva presso il Tribunale della California (testo ufficiale su fingfx.thomsonreuters.com) e l'accusa afferma che Anthropic ne fosse a conoscenza, creando un impero miliardario basato (anche) su centinaia di migliaia di risorse (libri, documenti) protetti da copyright.

Da un lato è chiaro che un'azienda non riesce ad avere il controllo su tutto, quando ha bisogno letteralmente di miliardi di dati e documenti per addestrare i propri modelli linguistici. Dall'altro però, una maggiore attenzione a casi come questi (oltre a Perplexity AI, anche gli altri come ChatGPT, Google Gemini ecc sono sotto controllo e potenzialmente non esenti da rischi di questo tipo, quindi in futuro potrebbero saltare fuori delle prove anche contro di loro) è opportuna, affinché ci sia uno sviluppo il più possibile etico e regolamentato di queste tecnologie, nel rispetto anche della proprietà intellettuale altrui.

Aggiornamento a giugno 2025: l'IA vince contro il copyright! Un giudice della California, a fine giugno 2025, ha decretato un risultato storico: l’azienda può usare i libri che vuole per addestrare Claude (il suo chatbot di IA), senza necessitare di permessi; questo con la condizione che deve acquisatre prima le opere (comunque è chiaro che poter pagare un'opera - libro, articolo - poche decine di dollari e renderlo poi disponibile a milioni di persone, è un grandissimo risultato per un'azienda di IA, quindi Anthropic si è portata avanti acquuistando molti libri, per arricchire il proprio database e rendere migliore, più completo, il servizio che offre). Ora con questo precedente, anche le altre aziende (OpenAI, Google, Meta, ecc) cercheranno di andare nella stessa direzione.

A settembre 2025: Anthropic ha accettato un accordo di 1,5 miliardi di dollari per risolvere una causa collettiva negli Stati Uniti, in cui è accusata di aver scaricato milioni di libri pirata per addestrare il suo modello Claude. Se approvato, sarà il risarcimento per copyright più grande mai registrato negli USA (circa 3000 dollari a libro, per un totale di 500.000 libri, da qui la cifra totale 1,5 miliardi di dollari).

Giulio_M

Claude segnala gli utenti sospetti alle autorità? 😱

Di recente l'azienda Anthropic ha rilasciato Claude 4 nelle versioni Opus 4 e Sonnet 4, con un miglioramento rispetto alla precedente versione (3.7), Claude si colloca fra i migliori al mondo in termini di benchmark generale e in particolare raggiunge nuovi standard per il coding, il suo punto di forza. Quindi un modello più avanzato, equilibrio tra prestazioni e velocità, una continua innovazione.

Ora però arriva un'altra notizia: Claude Opus 4 potrebbe segnalare utenti sospetti alle autorità. Nel caso di richieste gravemente illegali, almeno in teoria, il modello potrebbe avvertire le autorità, così è stato dichiarato da Sam Bowman, responsabile della sicurezza dell'IA dell'azienda. Tradotto:

Con questo tipo di input, se il modello vede che si sta facendo qualcosa di gravemente scorretto, come commercializzare un farmaco sulla base di dati falsificati, cercherà di utilizzare uno strumento di posta elettronica per segnalarlo a chi di dovere

Possibilità teorica o reale, a molti utenti non è piaciuta questa misura in ottica privacy e libertà di espressione (ricordiamo che è difficile trovare il giusto compromesso tra sicurezza e diritto alla privacy). In seguito Bowman ha dichiarato che la misura eventualmente riguarda solo test interni, accesso sperimentale, non accessibile al pubblico. Che sia vero o no, questo ha creato un precedente e, vista la fortissima crescita dell'IA, ancor più dei Social Network i chatbot potrebbero trasformarsi in uno "strumento di controllo delle masse". Quantomeno, si apre a questa riflessione.

Giulio_M

(Anche) Anthropic userà le chat degli utenti per l'addestramento dei propri modelli

Novità datata 28/08/2025, rirportata sul sito ufficiale anthropic.com. Per lo sviluppo di nuovi modelli IA, occorrono moltissimi dati e le interazioni degli utenti (informazioni, feedback, ecc) sono utilissime! La regolamentazione è molto stringente e vuole imporre dei limiti all'uso dei dati con lo scopo di tutelare la "privacy" degli utenti. Quindi la normativa prevede che l'utente possa decidere di non contribuire al miglioramento del modello, ovvero non inviare i propri dati.
Con il nuovo aggiornamento di Anthropic (Updates to Consumer Terms and Privacy Policy), la funzione "you can help improve Claude" è ora attiva di default (chi vuole, la può disattivare manualmente). Se si attiva la funzione "contribuisci al miglioramento del modello", i dati restano memorizzati per 5 anni; in caso contrario invece per 30 giorni (questo breve periodo è comunque necessario per sicurezza, nel caso fosse svolta attività illecita). Ovviamente l'azienda dichiara di adottare tutte le misure per la tutela e protezione dei dati sensibili, anonimizzazione, offuscamento ecc, oltre a non vendere dati a terzi. Tratta dal sito ufficiale, vediamo l'immagine di come appare il nuovo box con le impostazioni Updates to Consumer Terms and Privacy Policy.

Claude Anthropic - modifica Updates to Consumer Terms and Privacy Policy, 28 agosto 2025 (fonte immagine: anthropic.com)

Fondatori