
Il Chicago Tribune ha avviato una nuova battaglia legale contro l’ecosistema dell’intelligenza artificiale, depositando presso un tribunale federale di New York una causa per violazione del copyright contro il motore di ricerca AI Perplexity. La denuncia, visionata da TechCrunch, si inserisce in un contesto sempre più complesso in cui editori e sviluppatori di modelli generativi si confrontano sui limiti del fair use e sugli strumenti tecnici utilizzati per alimentare le piattaforme di AI.
Le accuse: contenuti usati “verbatim” e scraping per la RAG
Secondo il reclamo, gli avvocati del Chicago Tribune avrebbero contattato Perplexity a metà ottobre per chiedere chiarimenti sull’utilizzo dei contenuti del quotidiano. La risposta della società è stata che i suoi modelli non vengono addestrati sui testi del Tribune e che, eventualmente, il sistema può ricevere “non-verbatim factual summaries”, ossia riassunti non letterali.
Gli avvocati sostengono che Perplexity stia restituendo porzioni di contenuto identiche agli articoli originali, violando così il copyright.
La testata, però, contesta apertamente questa versione. Gli avvocati sostengono che Perplexity stia restituendo porzioni di contenuto identiche agli articoli originali, violando così il copyright. Particolarmente significativo è il riferimento alla retrieval augmented generation (RAG), una tecnica spesso citata come soluzione per limitare le allucinazioni dei modelli generativi, poiché consente di attingere a fonti esterne verificate e aggiornate. Il Tribune afferma che Perplexity utilizza proprio i suoi articoli come materiale di retrieval, ottenuti tramite scraping non autorizzato.
Il ruolo del browser Comet e l’accusa di aggiramento dei paywall
Un fronte ulteriore della causa riguarda il browser Comet, sviluppato da Perplexity. Secondo gli avvocati del Chicago Tribune, il browser sarebbe in grado di bypassare il paywall della testata per accedere agli articoli integrali e produrre detailed summaries per gli utenti finali. Se confermato, questo comportamento configurerebbe non solo una violazione delle condizioni d’uso del sito, ma anche un danno economico diretto, minando il modello di business delle testate digitali basate su abbonamento.
Un contesto legale sempre più affollato: editori contro AI
La causa del Chicago Tribune non è un episodio isolato. La testata è parte di un gruppo di 17 pubblicazioni di MediaNews Group e Tribune Publishing che nell’aprile scorso hanno intentato una causa contro OpenAI e Microsoft per l’utilizzo dei loro contenuti come materiale di training. Quel procedimento è tuttora in corso. A novembre, altre nove testate degli stessi gruppi editoriali hanno avviato ulteriori azioni legali contro le due aziende.
Chicago Tribune è parte di un gruppo di 17 pubblicazioni di MediaNews Group e Tribune Publishing che nell’aprile scorso hanno intentato una causa contro OpenAI e Microsoft.
Il caso Perplexity si aggiunge inoltre a una lista crescente di vertenze nel settore: Reddit ha presentato una denuncia in ottobre, mentre Dow Jones ha avviato a sua volta un’azione legale. Anche Amazon, pur non arrivando a un procedimento formale, ha inviato di recente una lettera di diffida riguardo alle funzionalità di shopping integrate nei browser AI.
Le possibili implicazioni per l’intero settore dell’AI generativa
Una delle questioni più rilevanti sollevate dalla causa riguarda il ruolo della RAG e la sua potenziale responsabilità legale. Se negli ultimi mesi la generazione aumentata da retrieval è stata considerata un elemento chiave per migliorare l’accuratezza dei modelli, il caso Tribune potrebbe rappresentare il primo vero test per verificare se l’utilizzo di materiali protetti da copyright nella fase di retrieval possa essere equiparato al training tradizionale ai fini della violazione.
Al momento, Perplexity non ha rilasciato commenti né al Chicago Tribune né a TechCrunch. L’assenza di dichiarazioni ufficiali, unita al moltiplicarsi delle azioni legali, suggerisce che il settore si stia muovendo verso una fase di definizione normativa più rigida, dove trasparenza dei dataset, gestione dei diritti e modalità di accesso alle fonti saranno elementi determinanti.
Per ora, resta da vedere se i tribunali considereranno la raccolta e l’utilizzo dei contenuti tramite RAG come una forma di sfruttamento del copyright analoga all’addestramento dei modelli. Ciò che appare chiaro è che le dinamiche tra editori e aziende di AI stanno rapidamente evolvendo, e casi come quello del Chicago Tribune contro Perplexity potrebbero diventare precedenti significativi per il futuro dell’informazione digitale e dell’AI generativa.





