Inteligencia Artificial (II), análisis de Mariana Gonzalez

OPINIÓN

50375802637_b4cf4e7eac_c
Foto: OpenAI

*Escribe Mariana Gonzalez, especialista en Computación Científica, Fac. Ciencias Exactas UBA. MBA, ITBA.

Dall-e

Lectura: 5 minutos

En el anterior artículo sobre Inteligencia Artificial (I), estuvimos analizando ChatGPT, el chatbot de inteligencia artificial que está dando que hablar desde noviembre del año pasado, cuando se anunció. Es un producto de la empresa Open AI, con alta participación de Miscrosoft.

El 8 de febrero pasado esta empresa anunció que incluirá la tecnología de OpenAI en su buscador Bing. O sea, cuando busquemos algo, nos va a contestar como una persona en vez de darnos un listado de referencias para que nosotros elijamos.

Google es uno de los que más se sintieron amenazados. Su buscador, lejos el más usado, necesita incorporar la posibilidad de «conversar» con el que pregunta.

Para eso, está desarrollando Bard, un sistema basado en inteligencia artificial como ChatGPT, para potenciar su buscador web a través de un lenguaje conversacional usando su producto LaMDA (Language Model for Dialogue Applications, modelo de lenguaje para aplicaciones de diálogo), una red neuronal entrenada en conversaciones y capaz de dar respuestas en lenguaje natural.

Pero, no es sencillo, las acciones de Alphabet, empresa matriz de Google, cayeron un 7,68% después que Google en un anuncio promocional mostró como su Bard cometía un error grosero ante una pregunta simple.

China, también puja en esta competencia, a través de Baidu, su motor de búsqueda al estilo de Google pero que permite, además, pesquisar audios. Se llamará Ernie Bot», pero no informaron fecha de lanzamiento.

Meta (Facebook) el 15 de noviembre, anunció Galáctica, un modelo de lenguaje que resume y redacta artículos científicos, pero generaba incoherencias, respuestas absurdas, frases racistas, por lo que lo retiró solo tres días después de su anuncio.

Todos los «grandes», están desarrollando sus propios productos para competir hoy, aunque a muchos nos preocupa más el mañana de todo esto.

La carrera de los buscadores para «conversar» como personas está lanzada.

Pero, la inteligencia artificial aplicada no se queda solo con poder «charlar» como una persona. Hay más aplicaciones que nos dan placer, curiosidad, preocupación, incertidumbre, desamparo, TODO a la vez.

Dentro de esos desarrollos que está permitiendo la inteligencia artificial, encontramos Dall-e, también de OpenAI. «Es un nuevo sistema de IA que puede crear imágenes y arte realistas a partir de una descripción en lenguaje natural» según su propia definición.

A partir de un texto con una descripción que puede ser irreal, Dall-e crea una imagen: una foto, una pintura, un emoji. La imagen que es la portada de este artículo, la creé con la frase «un chatbot con una perla en la oreja mirando el mundo que quiere dominar».

Todos los meses dan algunos créditos a cada usuario para generar imágenes, pero una vez usadas cobran los siguientes usos.

Estas aplicaciones de inteligencia artificial que «crean» imágenes están también basadas en modelos GPT (Generative Pre-Training Transformer, transformador generativo preentrenado), como ChatGPT. Van a incidir este año, en el trabajo de artistas, gráficos, publicistas, curiosos.

Estas aplicaciones fueron nominadas como una de las 10 tecnologías innovadoras de 2023 por MIT Technology Review, «Los modelos de IA que generan imágenes asombrosas a partir de frases simples se están convirtiendo en poderosas herramientas creativas y comerciales», «OpenAI introdujo un mundo de mezclas extrañas y maravillosas». Pero, también, alerta: «Los artistas están atrapados en medio de una de las mayores revoluciones en una década. Y, al igual que los modelos de lenguaje, los generadores de texto a imagen pueden amplificar las asociaciones sesgadas y tóxicas enterradas en los datos de entrenamiento extraídos de Internet».

Google también presentó su aplicación generadora de imágenes, llamada Imagen, que está liderando los análisis comparativos entre esas aplicaciones. Inclusive, Imagen ya hace videos de segundos a partir de un texto.

La startup Stability AI del Reino Unido, creó Stable Diffusion, una aplicación de texto a imagen de código abierto (significa que todos tienen acceso a su código de programación) y, además, gratuito. Decisiones disruptivas dentro del marco de un potencial excelente negocio. Generó algunas de las imágenes más sorprendentes entre todas esas aplicaciones.

Un párrafo del artículo de MIT Technology Review: «La emocionante verdad es que realmente no lo sabemos. Mientras que las industrias creativas, desde los medios de entretenimiento hasta la moda, la arquitectura, el marketing y más, sentirán el impacto primero, esta tecnología otorgará superpoderes creativos a todos. A más largo plazo, podría usarse para generar diseños para casi cualquier cosa, desde nuevos tipos de drogas hasta ropa y edificios. La revolución generativa ha comenzado».

Los próximos anuncios serán de «texto a video». Microsoft, Meta, Google están trabajando en eso. Por ahora, las pruebas nos han dado pocos segundos de video pero, pronto, a esas aplicaciones les introduciremos un guión… y saldrá una película.

*Mariana Gonzalez
Computación Científica, Fac. Ciencias Exactas UBA
MBA ITBA
Empresaria en Argentina y Uruguay en empresas de tecnología.

Otro artículo escrito por Mariana Gonzalez: Inteligencia artificial (I)

Anuncio publicitario

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s