El uso de materiales protegidos por derechos de autor para entrenar modelos de inteligencia artificial ha alimentado un sinfín de demandas contra las principales empresas del sector. Pero recientemente ha salido a la luz una iniciativa secreta de Anthropic, bajo el nombre Project Panama, para comprar millones de libros y “escanearlos de forma destructiva” para entrenar a Claude.
La práctica fue revelada por un reporte de The Washington Post, tras la liberación de documentos de una demanda contra Anthropic por la cual la compañía pagó una compensación de 1.500 millones de dólares.
Según se menciona, a principios de 2024 Anthropic puso en marcha Project Panama con el objetivo de conseguir material de calidad en formato físico para entrenar a Claude. Aparentemente, la idea de la startup era que su inteligencia artificial aprendiera a escribir bien y no se viera influenciada por la baja calidad del contenido disponible en internet.
Si bien Anthropic quedó en el ojo de la tormenta por la descarga de libros digitales de forma ilegal por parte de algunos de sus ejecutivos, la empresa afirmó nunca haber usado ese material para entrenar sus modelos de lenguaje de uso comercial. Pero lo que realmente llamó la atención fue su plan de conseguir cantidades colosales de libros físicos, para luego destruirlos en pos de obtener su contenido.
Anthropic compró y destruyó millones de libros físicos para entrenar a Claude

De acuerdo con la información a la que accedió The Whashington Post, Anthropic se propuso adquirir libros usados de tiendas de segunda mano, como también de bibliotecas públicas. Finalmente, la startup de IA se habría inclinado por una librería estadounidense y por otra británica para adquirir el material en cuestión.
Si bien se desconoce el alcance final de Project Panama, se revela que los desarrolladores de Claude compraron millones de libros, aparentemente en lotes de decenas de miles. Estos se guardaron en grandes almacenes, para luego desarmarlos cortándoles el lomo y escanearlos en alta definición. Una vez concluido el proceso, los libros destruidos se enviaron a reciclaje.
No se sabe a ciencia cierta cuántos libros compró y “escaneó destructivamente” Anthropic para entrenar a Claude. Según se reporta, el monto final invertido en Project Panama y la cantidad de libros adquiridos permanecían censurados en la documentación judicial que se liberó recientemente. Según una de las empresas que trabajó en el proceso, la firma de IA buscaba digitalizar de 500.000 a 2.000.000 de libros en solo 6 meses.
Creas o no que desguazar millones de libros para entrenar una IA es antiético, el juez determinó que lo que hizo Anthropic no fue ilegal. A pesar de que la compañía no pidió permiso a los autores del material protegido para usarlo durante el entrenamiento de Claude, la práctica quedó englobada como “uso justo”. Esto, debido a su naturaleza transformativa al pasarlos del formato impreso al digital para uso interno y no para comercialización. También, porque al destruir la versión física del libro y reemplazarla por una escaneada no se generaron nuevas copias en circulación.

