Los ingresos publicitarios caen y la avalancha de contenido generado por inteligencia artificial amenaza la economía de internet. Expertos advierten sobre el colapso del modelo y la pérdida de calidad informativa.
Las plataformas digitales atraviesan una crisis sin precedentes. Los ingresos publicitarios caen y la avalancha de contenido generado por inteligencia artificial amenaza con destruir la economía que sostuvo a la web por más de cuatro décadas. Detrás del caos, surge una pregunta central: ¿puede sobrevivir internet sin creadores humanos?
Internet fue el gran escenario del conocimiento colectivo y la comunicación global, desde los primeros foros hasta las webs de noticias. Pero en los últimos años, algo cambió: las redes se llenaron de ruido, los motores de búsqueda colapsaron bajo montañas de contenido artificial y repetitivo. Mientras los gigantes tecnológicos multiplican la producción automática con inteligencia artificial, los periodistas, artistas y comunidades humanas pierden visibilidad y poder. A esta problemática se la llama “crisis del contenido”, una transformación silenciosa que amenaza con convertir a la red en una copia vacía de sí misma.
La crisis de contenido se debe a tres fenómenos: el colapso del modelo de las inteligencias artificiales, Google Zero y la inundación de contenido. En primer lugar, es necesario entender qué es la IA: se trata de modelos conocidos como LLM (modelos de lenguaje de gran escala), sistemas que aprenden patrones del lenguaje a gran escala y luego los usan para predecir texto, creando respuestas a partir de probabilidades. Se estima que los modelos actuales tienen una tasa de error entre el 20% y el 40%, errores conocidos como “delirio de la IA”, cuando inventan información sobre lo preguntado.
En cuanto al colapso del modelo, se refiere a la disminución del rendimiento de la IA generativa, como ChatGPT o Gemini, al ser enfrentada con textos generados por ellas mismas y no por humanos. Un grupo de investigadores de las universidades de Cambridge y Oxford analizó qué sucede cuando las herramientas de IA generativa consultan contenido producido por IA. Los resultados fueron alarmantes. El Dr. Ilia Shumailov, de la Universidad de Oxford y ex investigador sénior en Google DeepMind, y su equipo descubrieron que cuando el software de IA generativa se basa únicamente en contenido producido por IA, las respuestas comienzan a degradarse gradualmente.
El equipo confirmó el colapso del modelo mediante un experimento: comenzaron con una wiki preentrenada con IA que se actualizaba a partir de sus propios resultados. A medida que los datos erróneos contaminaban el conjunto original de datos de entrenamiento, la información se fue deteriorando progresivamente hasta volverse ininteligible. Por ejemplo, después del noveno ciclo de consultas, un extracto del artículo wiki sobre los campanarios de las iglesias inglesas del siglo XIV se había transformado en un texto incoherente sobre los diversos colores de los conejos y sus colas. Esto se ve más claramente en un modelo gráfico, donde se tiende a emparejar los resultados. Muestra cómo se generan diferentes imágenes de razas de perros, pero a través de los ciclos, las razas menos conocidas quedarían excluidas de los conjuntos de datos repetidos, favoreciendo a razas más populares como los golden retrievers. La IA crea su propio método de selección, del tipo “usar o perder”, que elimina las razas menos populares de su base de datos. Sin embargo, tras suficientes ciclos de entrada únicamente con datos de IA, esta solo es capaz de generar resultados sin sentido.
Shumailov afirma que cada vez resulta más difícil para los desarrolladores humanos filtrar el contenido creado a gran escala por sistemas de IA de modelos de lenguaje de gran tamaño, sin que se vislumbre una solución aparente. Para evitar este error, las diferentes empresas comenzaron a invertir en acuerdos de libre uso del contenido clásico, ya sean foros o páginas de noticias en su mayoría. Esto significa que los medios tradicionales y sus textos de calidad siguen teniendo un gran peso e importancia para las grandes empresas tecnológicas. Por ejemplo, Amazon paga hasta 25 millones de dólares al año al New York Times por licencias de contenido e IA, lo que le otorga acceso a una amplia gama de contenido del medio, incluido material de su sección de noticias, la sección de cocina y The Athletic, que Amazon puede utilizar para entrenar modelos de IA y para ofrecer funciones como las respuestas de Alexa. Según un informe de mayo de 2023, The New York Times ganó casi 100 millones de dólares en tres años gracias a un acuerdo con Google de Alphabet, que permitió a la empresa ofrecer contenido del Times en todas sus plataformas.
