Apple Intelligence è già in crisi? Moltissimi siti dicono "no" all'allenamento dell'IA

Moltissimi editori hanno deciso di non prendere parte all'addestramento di Apple Intelligence, escludendo i propri siti. L'IA della Mela già in difficoltà?

Avatar di Marco Pedrani

a cura di Marco Pedrani

Managing Editor

Apple si è trovata davanti uno scoglio non indifferente nell'addestramento di Apple Intelligence, con molti importanti siti web che hanno scelto di non partecipare. Facebook, Instagram, The New York Times e The Atlantic sono tra i grandi editori che hanno bloccato l'accesso ai loro contenuti per l'addestramento dell'IA dell'azienda.

Questa decisione evidenzia le crescenti preoccupazioni sul modo in cui i sistemi di IA vengono addestrati utilizzando contenuti online. Apple utilizza il suo web crawler Applebot per raccogliere dati pubblicamente disponibili sul web al fine di addestrare i suoi modelli di IA, incluso il sistema Apple Intelligence. Tuttavia, l'azienda consente agli editori di scegliere di non partecipare attraverso un tag speciale nei file robots.txt dei loro siti web.

Oltre un quarto dei siti di news blocca Applebot-Extended.

Il rifiuto di molti grandi editori potrebbe limitare significativamente la quantità e la qualità dei dati disponibili per addestrare l'IA di Apple. Ciò potrebbe potenzialmente influire sulle capacità e l'accuratezza del sistema risultante, specialmente in aree come le notizie e i contenuti dei social media.

Secondo un'analisi condotta dal giornalista di dati Ben Welsh, più di un quarto dei siti di notizie esaminati (294 su 1.167 pubblicazioni principalmente in lingua inglese e basate negli Stati Uniti) sta già bloccando Applebot-Extended. Questo numero potrebbe aumentare man mano che cresce la consapevolezza di questa opzione tra gli editori.

Le motivazioni dietro il rifiuto di alcuni siti potrebbero essere di natura finanziaria. Si ritiene che Apple abbia stretto accordi con alcune aziende mediatiche, pagando una commissione in cambio del diritto di utilizzare i loro contenuti per l'addestramento. Jon Gillham, fondatore di Originality AI, suggerisce:

Molti dei più grandi editori al mondo stanno chiaramente adottando un approccio strategico. In alcuni casi, credo ci sia una strategia aziendale coinvolta - come trattenere i dati fino a quando non viene stipulato un accordo di partnership.

Questa situazione solleva importanti questioni sul futuro dell'addestramento dell'IA e sul rapporto tra le aziende tecnologiche e gli editori di contenuti. Da un lato, l'accesso a dati di alta qualità è cruciale per lo sviluppo di sistemi di IA efficaci. Dall'altro, gli editori hanno legittime preoccupazioni sulla protezione dei loro contenuti e sul mantenimento del loro valore in un'era di IA generativa.

Leggi altri articoli