Anche Wikipedia, come tutti, non è stata esente dall'impatto dell'Intelligenza Artificiale, nel bene e nel male. Vediamo quindi la situazione al 2025, affrontando i punti principali.
Per fermare il web-scraping, Wikipedia lancia un dataset specifico per l'addestramento AI
Il problema riguarda il "web scraping non autorizzato", gli sviluppatori di IA prelevavano contenuti in grande quantità, ritenendo Wikipedia come un'ottima fonte di informazioni, in media. Quindi Wikipedia, in collaborazione con Kaggle (piattaforma di data science di proprietà di Google) ha creato un dataset ottimizzato per l'addestramento IA, in lingua inglese e francese, formato JSON, quindi dati selezionati di alta qualità, a beneficio di entrambe le parti: protegge Wikipedia dal traffico eccessivo causato da bot e fornisce una fonte sia efficiente sia legalmente utilizzabile a tutti gli sviluppatori IA (grandi aziende, PMI e anche ricercatori indipendenti).
Questo anche alla luce di un dato importante: l'IA rallenta i server di Wikipedia, nello specifico nell'ultimo anno il traffico (prevalentemente quindi da bot) è aumentato del +50%, specialmente per materiali "pesanti", come immagini e video. Quindi Wikimedia Foundation dichiara: <<I nostri contenuti sono gratuiti, la nostra infrastruttura no>>.
Wikipedia e IA: strategia "human first"
Anche per Wikipedia, non manca la classica domanda: "Wikipedia sostituirà la conoscenza curata dagli umani, tramite l'IA?". La risposta, molto decisa, è stata un secco NO. L'enciclopedia digitale più nota al mondo, da quasi 25 anni ha basato il proprio successo sulla validissima community di volontari. L'IA verrà solo adottata per quanto riguarda la rimozione delle barriere tecniche, solo uno strumento di assistenza e supporto ai volontari umani, che verranno supportati e potenziati; trasparenza e traduzioni multilingue saranno agevolate dall'uso consapevole dell'IA, preferendo inoltre modelli open-source e open-weight, in perfetto accordo con la filosofia di Wikimedia Foundation (rispetto a modelli chiusi proprietari). Fornire conoscenza liberamente accessibile a chiunque sul pianeta è la missione di Wikipedia e grazie all'IA generativa questa missione è divenuta ancora più importante.
Wikipedia rimuove articoli generati con IA
Inizialmente l'adozione dell'IA da parte di Wikipedia, consentiva la generazione di rapidi riassunti, esperimento che è stato poi sospeso a giugno 2025. Ora è stata introdotta una policy più chiara che permette ai moderatori di rimuovere gli articoli scritti tramite IA (vedi anche il punto precedente, strategia "human first"). Quindi, oltre alla moderazione generale (es. contenuti pubblicitari, scarsa qualità, non rilevanza enciclopedica), i testi palesemente opera di chatbot (struttura e design di risposta, tipologia di link esterni...) possono essere rimossi dallo staff in modo agile, diretto, senza dover creare formalmente una discussione a riguardo. Nei casi borderline, "zona grigia" (effettivamente un chatbot può scrivere un articolo di qualità e analogamente a quanto si diceva in Guida ai contenuti SEO che piacciono a Google (e non solo), ciò che conta, anche per Wikipedia è ovviamente: <<creare contenuti di valore per soddisfare i bisogni dell'utente che legge>>), lo staff valuterà singolarmente caso per caso, con una discussione a riguardo.
Conclusioni
Nel 2025, Wikipedia non è stata "schiacciata" dall'IA ma ha deciso di vederla come un alleato, non un rivale. L'IA viene adottata nel modo migliore, per essere un ottimo strumento a vantaggio del team umano, che si libera da compiti ripetitivi, mantenendo controllo e gestione. Riguardo alla diffusione dell'IA generativa, la quantità non è un problema, se la qualità rimane al centro.