Close

Il New York Times blocca ChatGPT

La testata blocca il web crawler GPTbot e potrebbe citare in giudizio OpenAI per violazione del copyright
Un robot con intelligenza artificiale per indicare che New York Times blocca ChatGPT
Tempo di lettura: 2 minuti

Indice dei contenuti

Il New York Times ha bloccato ChatGPT, impedendo al web crawler GPTBot di accedere ai suoi contenuti online. Il risultato è che ora OpenAI, la società proprietaria del chatbot più famoso del momento, non può più usare i contenuti della storica testata USA per addestrare i suoi modelli di intelligenza artificiale.

Cosa ha fatto il New York Times contro ChatGPT

Secondo quanto riportato da The Verge, il New York Times ha bloccato GPTBot, il web crawler di ChatGPT, impedendogli di accedere ai suoi contenuti. La decisione del giornale americano è giunta dopo che a inizio mese il NYT aveva aggiornato i suoi termini di servizio, vietando l’uso dei suoi contenuti per l’addestramento dei cosiddetti Large Language Model, modelli linguistici di grandi dimensioni come quelli usati da OpenAI per mettere a punto e perfezionare ChatGPT.

Tecnicamente il blocco di un web crawler, per impedirgli di accedere al contenuto del nostro sito web, si ottiene inserendo uno specifico comando di esclusione nel file robots.txt del nostro sito.

Se, ad esempio, vogliamo impedire al web crawler “Pippo” di avere accesso al nostro sito, nel file robots.txt ci basta aggiungere due righe di istruzioni: una prima riga con l’indicazione “User-agent: Pippo”, seguita dalla riga di comando “Disallow: /”.

Ciò è quanto ha fatto il New York Times con GPTBot, chiudendogli le porte, così da impedirgli di vedere i contenuti pubblicati.

Perché il New York Times ha bloccato ChatGPT

Il New York Times ha bloccato GPTBot non solo per impedirgli di vedere i suoi contenuti, ma soprattutto per impedirgli di estrarre tali contenuti e usarli per addestrare ChatGPT.

L’addestramento dei Large Language Model avviene, infatti, dandogli in pasto una sterminata quantità di dati (nell’ordine dei Petabyte). Grazie alla lettura di questi dati, infatti, il modello assorbe le regole e il contenuto di quel linguaggio che poi impara a usare da solo, fornendoci le risposte che noi gli sollecitiamo attraverso le nostre domande.

Il problema è la natura dei contenuti, cioè se sono liberi o soggetti al copyright e il titolare non ci ha autorizzato a usarli.

La decisione del NYT di bloccare GPTBot è stata presa per evitare il rischio che ChatGPT potesse diventare un suo diretto concorrente. Cominciando, ad esempio, a rispondere alle ricerche online degli utenti fornendo contenuti realizzati, tra l’altro, proprio a partire da quelli della testata americana.

New York Times vs OpenAI: si va in tribunale?

Dopo il blocco di GPTBot, il passo successivo del New York Times potrebbe essere quello di citare in giudizio OpenAI. Secondo quanto riportato dal sito NPR, la storica testata potrebbe decidere di trascinare in tribunale la società per accertare se, prima del blocco, abbia violato la legge americana sul copyright, copiando illegalmente gli articoli del New York Times e usandoli per addestrare il suo modello linguistico.

Se la citazione in giudizio ci sarà e se durante il processo dovesse emergere una situazione del genere, il tribunale potrebbe punire OpenAI con una multa. Secondo la legge sul copyright USA, la questa potrebbe arrivare a 150mila dollari per ciascuna violazione commessa intenzionalmente.

In aggiunta alla multa, il tribunale potrebbe addirittura ordinare a OpenAI di distruggere il database usato per addestrare ChatGPT. In tal caso OpenAI sarebbe costretta a ricreare tale set di dati, attingendo però esclusivamente a contenuti per i quali abbia ricevuto esplicita autorizzazione all’uso.

TAG