Il CEO di Microsoft AI afferma che i contenuti online sono « freeware » per addestrare l'intelligenza artificiale (Immagine: Vitor Pádua / )
Il meglio della tecnologia è arrivato il nostro canale WhatsApp
Per Mustafa Suleyman, amministratore delegato di Microsoft Microsoft e cofondatore di DeepMind, i contenuti disponibili sul web sono “freeware”. Ciò significa che, a giudizio dell’esecutivo, è accettabile l’utilizzo di pubblicazioni online per la formazione di sistemi di IA generativa.
La discussione è legata al fatto che servizi come ChatGPT e Google Gemini non generano risultati da soli. Tutte le risposte presentate da questi servizi si basano su grandi volumi di dati che servono come formazione per i modelli linguistici di questi sistemi. E questi volumi provengono prevalentemente dal web.
Contenuti sul web come “freeware”
Nell'intervista recente con Andrew Ross Sorkin, da CNBCA Mustafa Suleyman è stato chiesto se “le aziende di intelligenza artificiale hanno effettivamente rubato la proprietà intellettuale del mondo”. Fu allora che l'esecutivo citò il termine « freeware » come giustificazione:
Penso che, per quanto riguarda i contenuti già presenti sul web aperto, il contratto sociale per tali contenuti a partire dagli anni ’90 sia basato sul fair use. Chiunque può copiarlo, ricrearlo, riprodurlo. È stato « freeware », se vuoi, questa è stata l'intesa.
Mustafa Suleyman, responsabile dell'intelligenza artificiale presso Microsoft
Per l’esecutivo, le eccezioni possono esistere solo quando gli autori rendono chiare le restrizioni sull’uso dei contenuti.
La preoccupazione degli autori e dei media risiede nel fatto che l’utilizzo dei loro contenuti per la formazione sull’intelligenza artificiale è stato effettuato senza compenso.
In generale, questi servizi utilizzano le pubblicazioni online come una sorta di base di conoscenza, presentano all'utente il risultato “masticato” e lasciano agli utenti poco o nessun accesso alle pagine che fungevano da base per le risposte.
Usando il termine “freeware” (originariamente creato per designare software libero), Suleyman suggerisce che non è sbagliato che i servizi di intelligenza artificiale facciano questo perché, quando una persona o un’organizzazione rende disponibile un contenuto sul web, accetta l’uso di quel materiale liberamente.
Processi e accordi
Sappiamo che non è così. Sebbene le leggi varino in base al Paese, i contenuti disponibili gratuitamente sul Web sono protetti da copyright.
Tuttavia, i limiti di ciò che l’intelligenza artificiale può e non può fare con questi contenuti sono ancora oggetto di dibattito. In altre parole, c’è ancora molta incertezza giuridica sull’argomento.
Per ora, le grandi organizzazioni mediatiche stanno intentando azioni legali contro aziende come OpenAI e la stessa Microsoft nel tentativo di ottenere un risarcimento per l’utilizzo dei loro contenuti da parte dei sistemi di intelligenza artificiale. Un esempio viene da Il New York Timesche ha intentato una causa contro OpenAI alla fine del 2023.
Ci sono anche organizzazioni che preferiscono concludere accordi. Questo è il caso di Volteche ha stretto una partnership con OpenAI con la quale l'azienda avrà accesso a tutti i contenuti del veicolo pubblicati negli ultimi 101 anni.
OpenAI (immagine: Vitor Pádua/)
Sopravviveranno solo i veicoli di grandi dimensioni?
Questi processi e accordi sono anche circondati da controversie, poiché indicano che solo le grandi organizzazioni mediatiche saranno in grado di ottenere un compenso dalle società di intelligenza artificiale generativa per quanto riguarda l’utilizzo dei loro contenuti.
Piccoli creatori e pubblicazioni indipendenti potrebbero smettere di continuare il loro lavoro in uno scenario in cui l’intelligenza artificiale generativa domina la propagazione delle informazioni mentre utilizza contenuti di altre persone senza offrire alcun compenso.
Aziende come Adobe pagano i produttori di contenuti per avere dati per addestrare modelli di intelligenza artificiale, ma anche questo approccio è stato visto con riserve: gli importi pagati sono giusti?
Questo è sicuramente un romanzo che avrà molti capitoli a venire.
Con informazioni: The Register, The Verge