🤖 Las IA: ¿roban o aprenden?

La Wikly

1×

0:00

-10:59

🤖 Las IA: ¿roban o aprenden?

Y también: una película para volver a Nueva York

Emilio Doménech

Bosco Bárcena

mar 12, 2024

🧑‍⚖️ Ey, qué tal, hoy indagamos en los procesos judiciales que podrían definir el futuro de la inteligencia artificial con un caso interesantísimo de nuestros colegas de The New York Times.

Si quieres apoyar este proyecto para que publiquemos más entregas como esta, considera sumarte a nuestra comunidad:

🕰️ Leer esta newsletter te llevará 6 minutos y 4 segundos.

👋 Aguanta hasta el final para un gran meme de Kate Middleton. Bienvenido a La Wikly.

🦾 A la defensiva

Lo importante. El boom de la inteligencia artificial tiene pocos visos de aminorar, pero los tribunales estadounidenses podrían convertirse en el gran escollo de la tecnología en los próximos meses.

Medios, artistas y escritores han armado un frente común contra las compañías tecnológicas porque dicen que han entrenado a las IA con sus trabajos.
Por ahora, los tribunales se han mostrado escépticos ante las demandas. No consideran que las IA estén produciendo copias flagrantes del trabajo de otros.

Ahí es donde entra el caso que enfrenta a The New York Times con OpenAI y Microsoft, pues su resolución podría ofrecer luces acerca de los límites legales de la IA.

Explícamelo. El Times demandó en diciembre a las compañías colaboradoras por el supuesto abuso que modelos de IA generativa como ChatGPT hacen de sus piezas periodísticas.

El Times es el primer gran medio de comunicación en emprender esta batalla judicial. Para la cabecera, está en juego la supervivencia del periodismo.
Para las tecnológicas, una sentencia en contra significaría poner freno a la innovación y atentar contra la «competitividad de Estados Unidos».

Contexto. El gran salto tecnológico que ha supuesto la IA pone a prueba de nuevo los límites establecidos por las leyes protectoras de derechos de autor. El problema es la escala.

Las IA se entrenan con líneas de texto que encuentran por internet tal y como hacen los humanos. Después, con todas esas frases y palabras aprendidas, pueden reproducir textos nuevos.
La diferencia es que las IA se entrenan con billones de líneas de texto que los humanos necesitarían varias vidas para poder leer, retener y ordenar en su cabeza.

Entonces, ¿en qué momento puede haber una vulneración de los derechos de autor por parte de esas IA? Ya hay demandantes intentando probar suerte en los tribunales:

Escritores como John Grisham o George R.R. Martin interpusieron una demanda por lo que consideran un «robo sistemático» de sus obras, de las que se habrían alimentado los modelos de OpenAI para entrenar a sus herramientas de IA.
Getty Images o creadores particulares también han arremetido con argumentos similares contra herramientas texto a imagen como Midjourney o DevianArt.
Y en el último mes, medios independientes como The Intercept, Raw Story o AlterNet demandaron a OpenAI y Microsoft por dar respuestas que reproducen de forma textual sus trabajos periodísticos sin hacer referencia a su origen.

Hasta el del Times, una de los casos más mediáticos ha sido el de la cómica y escritora Sarah Silverman contra Meta Platforms y OpenAI. El recorrido que lleva su batalla legal sintetiza el momento actual del duelo en los juzgados: los jueces han desestimado la mayor parte de sus demandas.

No consideran que los textos que generan Llama (Meta) o ChatGPT (OpenAI) tengan «similaridades sustanciales» con sus libros originales.
Ahí reside de momento el quid de la cuestión: la protección legal de los derechos de autor parece alcanzar sólo a lo que los chatbots «producen», según la interpretación de los jueces.

Es decir, no ponen en cuestión que las herramientas IA se hayan alimentado de sus obras (¡quizá sí!), pero tampoco aprecian infracción alguna por ello.

📜 La demanda diferente

El Times espera haber aprendido de donde otros han fallado. Hay dos ejes de ataque que diferencian a su caso del de Silverman y el resto.

La copia literal. Desde el Times consideran que ellos sí tienen pruebas de «similaridades sustanciales» de los textos generados con sus artículos.

Los abogados aseguran que los chatbots resumen sus noticias sin pagar licencias de un modo que califican de «mimético».
La demanda aporta 100 ejemplos concretos de textos que copian palabra por palabra los del diario.

Ejemplo que The New York Times ofrece en su demanda sobre cómo ChatGPT reproduce extractos textuales de sus artículos.

OpenAI defiende que los abogados del Times habrían llevado a cabo «decenas de miles de intentos para generar los resultados altamente anómalos» y pidió al juez del caso desestimar las pruebas por un supuesto hackeo de su chatbot.

La competencia. El Times también enfatiza que OpenAI y Microsoft se han vuelto «potenciales competidores» mediáticos, aprovechándose de la «inversión masiva» del diario en periodismo de calidad.

Usando ejemplos de los textos casi idénticos, tratan de subrayar la probabilidad de que los lectores dejen de pagar por el acceso a su medio.

Contra ese argumento, Microsoft presentó otra moción en la que acusaban al Times de practicar «futurología apocalíptica» al sugerir que la IA acabará con los medios.

Para Microsoft, el contenido con el que entrenan a sus herramientas de IA sirve para «enseñarles lenguaje», no para «suplantar el mercado» de medios periodísticos como el Times.
Además, desde OpenAI defienden el entrenamiento de sus modelos con los artículos como «uso legítimo» protegido por la ley de derechos de autor.

También remarcan su intención de «colaborar» con los medios para beneficio mutuo.

💡 La idea

Las estrategias del Times permiten explorar dos escenarios inquietantes:

¿Seguirán los tribunales juzgando las IA sin tener en cuenta su escala?
¿Pondrán las IA en peligro a los medios de comunicación?

Escala. Ahora mismo, los tribunales deciden estos casos de IA como cualquier otro juicio sobre derechos de autor: poniendo el foco en el material producido (output), no en el de entrenamiento (input).

Es decir, importa qué ha generado la IA y si ese contenido generado copia un material existente protegido por derechos de autor.
Por tanto, es irrelevante el material con el que la IA se ha entrenado tal y como lo son los artículos protegidos por derechos de autor que Bosco y yo hemos leído para escribir esta newsletter.

El Times podría lograr una pequeña victoria si los tribunales determinan que ChatGPT usa inputs del diario para producir outputs casi idénticos, pero no se resolvería la cuestión de fondo: las leyes tienen que adaptarse a la escala tecnológica de las IA.

Competitividad. A la espera de legislación, la parte más interesante de la demanda del Times refiere a su visión apocalíptica de la difícil convivencia entre IA y medios de comunicación. La teoría del Times es que sus trabajos serán menos lucrativos si ChatGPT los reproduce de forma muy similar.

Si ChatGPT ya resume las conclusiones de las investigaciones sobre Trump que son exclusivas para suscriptores del Times, ¿para qué iba alguien a pagar por una suscripción al diario?
Si ChatGPT ya recomienda las mejores televisores O-LED según los análisis de Wirecutter, ¿por qué iba alguien a entrar en esa web y pinchar en los enlaces afiliados que dan beneficios al diario?

El columnista de tecnología Ben Thompson, referente para La Wikly, defendía en su newsletter que ese era un buen argumento salvo por un detalle: las IA alucinan.

Es decir, las IA pueden equivocarse con bastante frecuencia, así que los lectores siempre acabarán recurriendo al Times y a Wirecutter para la información fidedigna y de prestigio que buscan.
Nuestra pregunta es: ¿qué porcentaje de lectores ignorarán esa premisa fiándose de ChatGPT y prescindirán de pagar por una suscripción o de entrar en la web y pinchar un enlace afiliado?

Es imposible imaginar un mundo en el que ChatGPT tenga buena información si no hay periodistas que hagan el trabajo de calle. Y en eso, el Times es uno de los medios de cabecera a nivel global y por tanto será difícil que muera.

¿Pero en qué medida puede ChatGPT reducir el número de potenciales clientes de medios con sus herramientas de IA avanzadas?
Y sobre todo, ¿en qué medida pueden los medios con menos recursos que el Times diferenciarse lo suficiente como para que ChatGPT no les deje sin el poco pastel restante?

Suerte a todos.

🎬 Una recomendación

Con la colaboración de Filmin
Por Emilio Doménech

Vidas pasadas es una película estadounidense de 2023 dirigida por Celine Song. Sigue la historia de dos amigos de la infancia, Nora y Han Sung, que se separan cuando la familia de Nora emigra desde Corea del Sur a Norteamérica. Años después, se reencuentran.

La película triunfó en los premios del cine independiente Spirit y logró dos nominaciones a Mejor Película y Mejor Guion Original en los Óscar de este domingo.

Song firmó uno de los mejores largometrajes del 2023 con su historia de amor por destino que encierra un potente alegato acerca de los ciclos vitales.