Inteligencia artificial generativa (Gen AI): ¿qué es y cómo funciona?

ESPECIAL

Lo que se debe saber para aprovechar el potencial de la Gen AI



Dirección copiada

La inteligencia artificial generativa se enfoca en la capacidad de las máquinas para originar contenido como imágenes, video, audio o texto.

Publicado el 17 ago 2023



Apps de inteligencia artificial generativa (Gen AI)
Crédito: Shutterstock

Las aplicaciones de inteligencia artificial generativa (Gen AI) como ChatGPT de OpenAI, Bard de Google, Claude de Anthropics, GitHub Copilot o Stable Diffusion de Runway y LMU Múnich han cautivado la imaginación de personas en todo el mundo.

La presencia disruptiva de la Gen AI se compara con lo que fue en su momento la de internet o la correspondiente a la telefonía móvil. Así de transformadora y de revolucionaria.

De acuerdo con McKinsey, esta tecnología está lista para desatar la próxima ola de productividad. En 2023, su valor de mercado ya es de $13.17 millones de dólares (mdd) y para finales de 2025, se espera que alcance los $22,120 mdd.

¿Qué es la inteligencia artificial generativa (Gen AI)?

La inteligencia artificial generativa se enfoca en la capacidad de las máquinas para originar contenido como imágenes, video, audio o texto a partir de datos existentes.

Al ser una rama de la inteligencia artificial (AI, por sus siglas en inglés) utiliza técnicas de aprendizaje automático y redes neuronales.

Se usa el término “generativa” porque —literalmente— genera algo nuevo, sustentado en la información o las bases de datos proporcionadas.

La Gen AI está diseñada para interactuar en conversaciones. Se trata de modelos entrenados con enormes cantidades de datos que pueden generar texto coherente, en respuesta a un comando, pregunta o instrucción.

Tal es el uso del modelo transformador generativo preentrenado (GPT, por sus siglas en inglés) de Open AI, o de Bert y Palm 2, de Google, Titan, de Amazon, o LlaMa, de Meta.

Historia y evolución de la inteligencia artificial generativa

Alan Turing y John McCarthy son dos nombres estrechamente ligados al tema de la inteligencia artificial, cuyos trabajos y propuestas a lo largo del siglo XX constituyen antecedente y referencia obligada de todo lo alusivo a la ciencia e ingeniería de hacer dispositivos inteligentes.

La “Máquina de Turing” es considerada como la primera muestra de un trabajo sustancial de inteligencia artificial. Este invento, que lleva el nombre de su creador, corresponde a 1935 y se trata de computación abstracta. Tenía una memoria y un escáner, con la tarea de identificar una serie de símbolos dispersos en una cinta, e interpretarlos de acuerdo con las instrucciones almacenadas en su memoria, modificando así su propio algoritmo.

Por su parte, se le atribuye a John McCarthy el primer uso de la expresión inteligencia artificial en 1956, para hablar de la utilización de ordenadores y otras tecnologías destinadas a simular comportamientos y pensamientos equiparables al de un ser humano.

El salto cuántico desde entonces está lleno de elementos fascinantes, pero es precisamente en 2022 que detona la inteligencia artificial generativa:

En abril se presentó Google PaLM, software generativo que produce textos de calidad, códigos informáticos y resolución de problemas matemáticos, a partir de 540 millones de parámetros.

En septiembre vio la luz, DALL-E 2, herramienta de Open AI, que transforma texto en imágenes realistas de calidad.

Para noviembre, ChatGPT, chatbot construido sobre modelos de AI abierta, con cientos de millones de parámetros para generar respuestas de casi cualquier tema, fue lanzado.

Marzo de 2023 marca la fecha en que Google presentó su chatbot Bard, capaz de dar respuestas razonables al usuario y dialogar.

Adobe FireFly fue presentado en mayo, disponible en Photoshop, usa AI generativa para crear imágenes a partir de texto, así como modelos 3D.

Ejemplos de aplicaciones y funcionalidades

Deep Agency, es un estudio fotográfico virtual, sin cámaras, ni equipos, ni modelos. Se ocupa de crear todo el contenido a partir de Gen AI.

Fliki, genera video con voces realistas a partir de un texto; dispone de 75 lenguas.

Wonder Studio,es un estudio de efectos visuales que permite incorporar personajes y animaciones CGI (Computer Generated Images) en cualquier video.

Tipos de Gen AI: unimodal o multimodal

La Gen AI puede ser unimodal, cuando se usa un solo tipo de entrada, por ejemplo, texto, que es lo más común.

O bien, multimodal, cuando se usan varios tipos de entradas, que pueden ser textos, imágenes, audios o videos.

El impacto de Gen AI en diversos sectores y áreas

El impacto de Gen AI es un fenómeno que está sucediendo en paralelo con el acelerado aprendizaje automático de esta herramienta. Así que las áreas y sectores que mencionamos en esta ocasión, pueden tener grandes variaciones en un lapso de dos a tres meses.

El mayor impacto esperado se ubica en los sectores de capacitadores digitales, de pioneros digitales, de empresas que buscan mayor productividad y en entidades con riesgo de disrupción.

Por capacitadores digitales se entiende que son las empresas que aportan tecnologías, herramientas y servicios para el desarrollo de aplicaciones de Gen AI.

Los pioneros digitales son entidades líderes en tecnologías que manejan enormes conjuntos de datos, sujetos a una mejor monetización gracias a Gen AI.

Empresas que elevan su productividad siendo más rentables gracias la optimización de costos derivada del uso de Gen AI, se identifican como el tercer sector.

Otra faceta es la que corresponde a las empresas en riesgo de disrupción, que son aquellas afectadas negativamente por Gen AI, ya sea por disminución sustancial de ingresos o por inviabilidad del modelo de negocio. En este sector se ubican muchos proveedores de todo tipo de servicios.

En una vista por industrias, el potencial de aplicaciones derivadas de Gen AI está en el diseño, en la salud, en el arte, en la música, en la producción cinematográfica, en el desarrollo de software, etc.

Ventajas y desafíos de la Gen AI

Algunas de las ventajas relevantes que se obtienen con el uso de la Gen AI incluyen a la que parece más obvia, que es la creación de contenido de calidad -música, imágenes, multimedia-, parecido a lo creado por los humanos. Puede generar datos que se parecen a los reales como insumo para cierto tipo de investigaciones -del tipo de simulaciones-, sin necesidad de recopilar datos reales. Es una ayuda importante en términos de innovación y de mayor eficiencia, ya que es capaz de realizar tareas altamente complejas en periodos de tiempo reducidos.

Desafíos e inconvenientes los hay de varios tipos, como es el caso de los datos de entrenamiento para el algoritmo, que pueden ser falsos, imprecisos, sesgados, engañosos o desactualizados. Así que la calidad de la información que se suministra para la generación de contenido mediante Gen AI, es un factor relevante a considerar.

El output o contenido generado, está etiquetado generalmente como de dominio público, pero entra en conflicto con la presunción de propiedad privada o restringida, incluso con temas de confidencialidad. La problemática asociada a la propiedad intelectual, los derechos de autor, las patentes y los secretos industriales forman parte de los terrenos con más desafíos.

¿Cómo funciona la inteligencia artificial generativa: algoritmos y modelos?

Gen AI funciona a partir de la utilización de una entrada de información inicial, en forma de comando, instrucción o imagen; la búsqueda y comparación entre millones de parámetros precargados; el aprendizaje automático y la generación del nuevo contenido.

Requiere poca intervención humana, salvo en la fase de preparación del sistema, donde los datos de entrenamiento y ajustes son suministrados por humanos. Entonces, el tema del aprendizaje o entrenamiento está en el centro de la comprensión acerca de Gen AI.

Un modelo generativo puede ser entrenado de varias maneras, aunque prevalece el uso de una red neuronal o GAN (Generative Adversarial Network). Se trata de un modelo de aprendizaje automático formado por muchas capas interconectadas, donde cada una aprende de los datos introducidos previamente y, luego, usa ese conocimiento para predecir los siguientes datos.

Por lo que toca a los algoritmos, con los grandes modelos de lenguaje (LLM, por sus siglas en inglés) como protagonistas, se trata de modelos de aprendizaje profundo, capaz de reconocer, resumir, traducir, predecir y generar contenido a partir del conocimiento obtenido de conjuntos de datos masivos, que en este caso se conoce como aprendizaje no supervisado.

Los grandes modelos de lenguaje son las aplicaciones más exitosas de los modelos transformadores, que son a su vez redes neuronales que aprenden contexto y, por lo tanto, significado mediante el seguimiento de relaciones en datos secuenciales como lo son las palabras de una frase.

LLM además aceleran las aplicaciones de procesamiento del lenguaje natural, tal y como sucede en la traducción, los chatbots y los asistentes de inteligencia artificial.

Ética y responsabilidad en el uso de la inteligencia artificial generativa

Etica, moral y responsabilidad son términos que podrían parecer lejanos al campo de acción de la inteligencia artificial generativa, sin embargo, forman parte de las preocupaciones importantes ligadas al desarrollo y uso de esta rama de la AI.

Cuestiones como la privacidad, la seguridad, la transparencia y la equidad están incluidas en estas consideraciones.

Los prejuicios políticos, los raciales y la información falsa constituyen los tres elementos de los que más se está ocupando la ética de la AI, debido a las implicaciones que pueden tener en la democracia y la justicia social.

Así que, para disminuir el riesgo de sesgos, es necesario establecer, supervisar y garantizar que los datos con los que se alimenta el entrenamiento de los sistemas Gen AI sean diversos, verídicos y representativos.

Casos de uso exitosos de la Gen AI

Entre los casos de uso exitosos y más variados están las actividades de ventas, mercadotecnia, asistentes virtuales, chatbots y en general, todos aquellos sitios donde los textos son la herramienta básica de trabajo, ahora con la posibilidad de ser generados por medio de herramientas como ChatGPT.

Para la industria del entretenimiento, incluidos los videojuegos, la generación de avatares digitales hiperrealistas se está generalizando, de la mano con el mercado de voz, donde ya hay ejemplos concretos de generación de audios vía AI, a partir de las entonaciones, frases, ritmo y temas de conferencistas, hasta tal grado indiferenciadas del original, que pueden pasar como audios auténticos. Estos usos pueden adaptarse también al campo de la telemedicina.

Creando inteligencia artificial generativa: guía para principiantes

Para quien tiene la curiosidad de experimentar un poco, desde la visión de un principiante, hay varias plataformas que tienen disponible la facilidad para crear agentes o bots a partir de Gen AI. Es el caso de Google Cloud y su Generative AI App Builder:

Luego de dar de alta esta herramienta de creación y configurarla, es posible desarrollar aplicaciones mediante la combinación de texto, imágenes o videos, para obtener la generación de otros, nuevos, que a través de un chatbot interactúan con los clientes.

El futuro de Gen AI: tendencias y avances

Es demasiado pronto para evaluar la magnitud de los cambios en los paradigmas en casi todas las áreas del quehacer humano, porque todas están siendo tocadas por la inteligencia artificial generativa.

Hay quienes miran lo democrático de estas herramientas y ponen su atención en los beneficios de que estén al alcance de millones de usuarios para ser aprovechadas, ya sea mejorando procesos productivos, reduciendo costos, optimizando tareas e impulsando el desarrollo económico.

No obstante, hay otra realidad apenas vislumbrándose, que requiere unas enormes capacidades de gestión y una gran sensibilidad en el ámbito de los gobiernos, de las cúpulas empresariales y de los grandes corporativos: la desaparición de puestos de trabajo, que ya está sucediendo en organizaciones como Mindvalley, por mencionar solo un ejemplo, donde ya no están contratando más personal y se estima que en menos de un año habrán recortado la plantilla, debido a que la Gen AI se está empleando para producir nuevo contenido como si fuera de los autores, conferencistas y expertos originales.

Algunas reflexiones finales

De momento, si se consideran los costos de entrenamiento y operación de las herramientas de la inteligencia artificial generativa, solo las grandes corporaciones pueden soportarlas.

Su uso debe ser con consciencia y bajo la advertencia de sus limitaciones. Sin embargo, nuevas áreas de oportunidad laboral se abrirán y requerirán de profesionales preparados, con habilidades y conocimientos distintos a los anteriores.

La Gen AI es parte de un universo de capacidades computacionales, códigos numéricos y algoritmos. Altamente eficiente, veloz, sorprendente, pero en ningún caso es la sustitución de un humano.

Artículos relacionados

Artículo 1 de 4