GENAI: Descubriendo la Inteligencia Artificial Generativa

GENAI: Descubriendo la Inteligencia Artificial Generativa

La Inteligencia Artificial Generativa (IA Generativa) se refiere a los modelos de aprendizaje profundo que pueden generar texto, imágenes y otros contenidos de alta calidad basados en los datos con los que fueron entrenados. Estos modelos pueden aprender la gramática de código de software, moléculas, imágenes naturales y una variedad de otros tipos de datos.

¿Qué son los modelos de IA Generativa?

Los modelos de IA Generativa pueden tomar datos brutos, como toda la Wikipedia o las obras colectivas de Rembrandt, y "aprender" a generar salidas estadísticamente probables cuando se les solicita. A un alto nivel, los modelos generativos codifican una representación simplificada de sus datos de entrenamiento y la utilizan para crear una nueva obra que es similar, pero no idéntica, a los datos originales.

La revolución de los Transformers

Los transformers, introducidos por Google en 2017 en un artículo trascendental "Attention Is All You Need", combinaron la arquitectura de codificador-decodificador con un mecanismo de procesamiento de texto llamado atención para cambiar la forma en que se entrenaban los modelos de lenguaje. Un codificador convierte el texto sin anotar en representaciones conocidas como embeddings; el decodificador toma estos embeddings junto con las salidas anteriores del modelo y predice sucesivamente cada palabra en una oración.
Los transformers han llegado a ser conocidos como modelos de base por su versatilidad. Los transformers de lenguaje se utilizan hoy en día para tareas no generativas como la clasificación y la extracción de entidades, así como para tareas generativas como la traducción, el resumen y la respuesta a preguntas.


El regreso del aprendizaje supervisado

El aprendizaje supervisado ha hecho recientemente un regreso y ahora está ayudando a impulsar los grandes modelos de lenguaje. Los desarrolladores de IA están utilizando cada vez más el aprendizaje supervisado para dar forma a nuestras interacciones con los modelos generativos y sus poderosas representaciones integradas.

Los desafíos de la IA Generativa

La IA generativa tiene un enorme potencial para crear nuevas capacidades y valor para las empresas. Sin embargo, también puede introducir nuevos riesgos, ya sean legales, financieros o de reputación. Muchos modelos generativos, incluyendo los que alimentan ChatGPT, pueden emitir información que suena autoritaria pero no es verdadera (a veces llamada "alucinaciones") o es objetable y sesgada. Los modelos generativos también pueden ingerir inadvertidamente información que es personal o tiene derechos de autor en sus datos de entrenamiento y emitirla más tarde, creando desafíos únicos para las leyes de privacidad y propiedad intelectual. Resolver estos problemas es un área abierta de investigación.