Pasar al contenido principal
Tecnológico de Monterrey Tecnológico de Monterrey
  • Inicio
  • Noticias
  • Recursos
  • Elecciones
  • Nosotros
  • Contacto

Compartir

Implicaciones ecológicas y soluciones regenerativas en torno a la IA

Las implicaciones ecológicas y soluciones regenerativas en torno a la IA

2025-08-12
Fernando Gutiérrez
Noticias

La inteligencia artificial (IA) está transformando nuestro paisaje informativo a una velocidad sin precedentes. Al igual que en los sistemas ecológicos, esta transformación está impulsada por un hambre insaciable de recursos —en este caso, de datos—. Los paralelismos entre la extracción de datos en la IA y la explotación de recursos naturales resultan interesantes. En este breve texto, exploramos cómo la IA remodela nuestro entorno cognitivo y proponemos enfoques sostenibles para abordar los retos derivados de esta reconfiguración.

¿Qué es el “dato fácil” en IA?
El “dato fácil” se refiere a conjuntos de datos públicos, abundantes y de acceso sencillo, con alto valor informativo —recursos que requieren un procesamiento mínimo antes de ser usados para entrenar modelos de IA—. Ejemplos incluyen Wikipedia, Common Crawl, textos de dominio público y publicaciones abiertas en redes sociales (Schaul et al., 2023). Estos conjuntos son esenciales para el desarrollo de grandes modelos de lenguaje, ya que aportan patrones lingüísticos diversos y conocimiento fundamental para la IA.

Sin embargo, este suministro está disminuyendo. Según un artículo publicado en la revista WIRED (2024) y un estudio de la Data Provenance Initiative del MIT, aproximadamente el 25% de los datos de mayor calidad de grandes conjuntos como C4 (Creado por Google), RefinedWeb (desarrollado por Hugging Face) y Dolma (generado por Allen Institute) ha dejado de estar disponible. La razón es sencilla, muchos sitios web ahora restringen la recolección automatizada de datos mediante protocolos robots.txt o han implementado restricciones de suscripción, limitando su uso en el entrenamiento de IA (Hern, 2024). Esto no solo afecta a las grandes tecnológicas, sino que también dificulta la investigación académica y la innovación.

La fiebre de los datos se desvanece
El despliegue acelerado de sistemas de IA ha generado una demanda de datos sin precedentes. Por otra parte, las fuentes públicas están sometidas a una creciente presión extractiva. En respuesta, medios y plataformas en línea han adoptado medidas de protección: modificación de términos de servicio, implementación de barreras de pago o firma de acuerdos comerciales exclusivos con desarrolladores de IA. Estas acciones buscan proteger la propiedad intelectual y garantizar una compensación justa (Hasker, 2024).

Este cambio ha dado lugar a lo que algunos expertos, como Shayne Longpre (MIT) y Yacine Jernite (Hugging Face), describen como una crisis emergente de consentimiento (Hern, 2024). La ausencia de acuerdos claros y equitativos sobre el uso de datos ha generado conflictos entre desarrolladores y creadores de contenido, reduciendo el acervo de datos accesibles y complicando el panorama ético del desarrollo de IA.

Un reto para la IA: calidad y diversidad de las fuentes
La precisión, versatilidad y relevancia de un modelo de IA están directamente vinculadas a la calidad y diversidad de sus datos de entrenamiento. Conjuntos amplios y actualizados provenientes de fuentes confiables —revistas académicas, noticias verificadas, estadísticas oficiales, bases de datos estructuradas— mejoran tanto el rendimiento como la fiabilidad ética.

Por el contrario, entrenar con datos limitados o sesgados puede perpetuar la desinformación, los errores y la insensibilidad cultural (Ferreira, 2025). Las fuentes diversas permiten que los modelos sean más conscientes del contexto cultural, reduzcan sesgos y se adapten mejor a distintas realidades. Pero la escasez actual de este tipo de datos no es solo un desafío técnico: representa una ruptura en el equilibrio del ecosistema informativo.

La IA en la ingeniera de ecosistemas
La IA no solo consume información; también remodela activamente las condiciones bajo las que se crea y comparte. Al igual que los ingenieros de ecosistemas en la naturaleza, la IA altera qué conocimiento se genera, cómo circula y qué se prioriza. La extracción no regulada de grandes volúmenes de datos —texto, imagen, audio— refleja la sobreexplotación ecológica y puede conducir a tensiones sistémicas. Cuando las empresas toman enormes cantidades de datos de internet sin control ni límites, se presenta un fenómeno similar al que se prodcue cuando se explotan demasiado los recursos naturales (Sustainability Directory, 2025).

Esto exige una mirada analítica renovada: no basta con preguntarnos qué contenido produce la IA, sino también cómo se forman y mantienen las estructuras que lo sustentan. La lógica extractiva de la minería de datos debe dar paso a un enfoque ecológico, que conciba los datos como parte de un ciclo regenerativo de uso, consentimiento y reciprocidad. en lugar de tomar datos sin límites, como si fueran un recurso infinito, deberíamos tratarlos como algo que forma parte de un ciclo sustentable: usarlos con permiso, cuidarlos, y devolver beneficios a quienes los comparten, para que el sistema pueda sostenerse y renovarse con el tiempo.

Lecciones ecológicas: sobreexplotación y retroalimentación
Una alternativa positiva puede encontrarse en la gestión comunitaria de datos (Mendonca et al., 2025). Imaginemos a una universidad, un colectivo local de medios y un grupo de desarrolladores colaborando para entrenar un modelo de IA con textos y entrevistas curadas. Los datos se etiquetan con contexto y consentimiento; los colaboradores reciben crédito y acceso a los resultados. El modelo, a su vez, apoya a la comunidad mediante resúmenes, traducciones o herramientas de análisis.

En los ecosistemas, el equilibrio se mantiene mediante ciclos de retroalimentación. En la IA, esto podría significar estructuras de gobernanza que devuelvan voz y valor a los autores del contenido. La transición de la minería de datos a la gestión de datos es esencial para priorizar la transparencia, la trazabilidad y la redistribución de beneficios.

Conclusión: hacia un ecosistema de datos regenerativo
La disminución de la disponibilidad de datos de alta calidad refleja una crisis informativa muy amplia. La sobreexplotación de las fuentes abiertas ha provocado un colapso parcial de los bienes comunes del conocimiento, donde el acceso a contenido fiable es cada vez más limitado.

Esto refleja las advertencias de algunos pensadores del siglo pasado que se dedicaron al estudio de las tecnologías de comunicación y sus efectos en la sociedad. Marshall McLuhan (1967) y Neil Postman (1992) coincidían en que las tecnologías no solo cambian lo que sabemos, sino que redefinen todo, qué cuenta como conocimiento, verdad y participación. La IA actualmente reconfigura el entorno cognitivo: transforma, filtra y selecciona lo que vemos y lo que no. Por ello, se requiere una comprensión más profunda que vaya más allá del contenido y cuestione las estructuras que lo producen.

Es momento de sustituir la lógica extractiva por un enfoque ético, regenerativo y colaborativo. La gestión de datos puede y debe asumir un nuevo paradigma sustentado en el consentimiento informado, la contextualización y el beneficio compartido. Más que una solución técnica, se trata de una transformación cultural y ecológica imprescindible para construir un futuro en el que la IA y las sociedades coexistan en equilibrio.

Referencias

Ferreira, M. G. (2025). Ethical and Bias Considerations in Artificial Intelligence. Journal of Biomedical Informatics https://www.sciencedirect.com/science/article/pii/S0893395224002667

Hasker, S. (2024, diciembre 2). AI licensing deals can protect good journalism, says Reuters chief. The Times. https://www.thetimes.com/business-money/technology/article/ai-licensing-deals-can-protect-good-journalism-says-reuters-chief-kgxjqstjw  

Hern, A. (2024, mayo 2). Los modelos de IA se están quedando sin datos de calidad para nutrirse. WIRED en Español.             https://es.wired.com/articulos/los-modelos-de-ia-se-estan-quedando-sin-datos-de-calidad-para-nutrirse

McLuhan, M., & Fiore, Q. (1967). The medium is the massage: An inventory of effects. New York, NY: Bantam Books.

Mendonca, F., DiMarzo, G., & Abdennadher, N. (2025). Data Cooperatives: Democratic Models for Ethical Data Stewardship. https://arxiv.org/abs/2504.10058

Postman, N. (1992). Technopoly: The surrender of culture to technology. New York, NY: Knopf.

Schaul, K., Chen, S., & Tiku, N. (2023, April 19). Inside the secret list of websites that make AI like ChatGPT sound smart.  The Washington Post. https://www.washingtonpost.com/technology/interactive/2023/ai-chatbot-learning/

Sustainability Directory. (2025, 4 de abril). Data Colonialism Risks. Sustainability Directory. https://sustainability-directory.com/term/data-colonialism-risks/

Logo Footer Tecnológico de Monterrey
  • Inicio
  • Noticias
  • Recursos
  • Elecciones
  • Nosotros
  • Contacto

© 2024 Observatorio de Medios Digitales