Herramientas para la generación de textos, imágenes y audio con IA
Recientemente, durante el evento AI@ ’22, Google ha presentado diferentes herramientas en el ámbito de la robótica, la comprensión del lenguaje natural, la accesibilidad, la asistencia sanitaria y la creatividad. La generación de textos y la creación de audio con IA, las voces sintéticas y muchas otras aplicaciones son cada vez más accesibles.
[No te pierdas nuestro curso de formación en IA Generativa]
El gigante tecnológico ha anunciado una serie de herramientas de Inteligencia Artificial que pronto estarán disponibles para su uso público, incluyendo la conversión de texto en imagen, un generador de audio de Inteligencia Artificial y una herramienta de edición de texto.
Generación de textos con IA
Google está utilizando su modelo de IA conversacional de última generación LaMDA para impulsar Wordcraft, su prototipo de aplicación de generación de textos con IA. Afirman que la aplicación será mucho mejor que otras del mercado a la hora de editar contenidos ya existentes. Al parecer, Wordcraft también es capaz de escribir de forma creativa.
Voces creadas con IA
¿Y qué hay de la generación de sonidos? Las voces sintéticas (voces generadas con Inteligencia Artificial) avanzan a una velocidad de vértigo y, cada día, asistimos al nacimiento de productos que las hacen accesibles como Auris, desarrollado por Voikers y Avantgarde IT. El marco AudioLM de Google puede producir un discurso realista, así como música de piano, escuchando únicamente el audio.
Crear imágenes con IA
En cuanto a la imagen, el generador de texto a imagen (tipo DALL-E o Midjourney) se está añadiendo a AI Test Kitchen, la plataforma donde se puede probar la tecnología emergente que Google trabaja en el ámbito de la IA. Sin embargo, todavía está limitada. Por el momento sólo puede generar edificios de ciudades y pequeños monstruos. Pero no por ello es menos espectacular.
Estas tecnologías servirían para que los profesionales del Marketing y la Comunicación generasen contenidos gráficos, sonoros o contenidos de texto, así como de vídeo -completados con imágenes, sonido y texto- sin moverse del escritorio. La Inteligencia Artificial generativa tiene el potencial de ayudarnos a expandir nuestra creatividad y expresarnos de formas nuevas y artísticas. Esto es sólo el principio…
Compartimos a continuación las distintas herramientas (extraídas de un hilo de Twitter de @GoogleAI):
- «Para explorar cómo un motor de diálogo puede ayudar a los escritores a generar ideas, estamos construyendo una herramienta de edición de texto en LaMDA. Nos asociamos con escritores profesionales que utilizaron el editor para crear un volumen de historias cortas. Echa un vistazo a su gran trabajo«.
- «Presentamos un nuevo framework, AudioLM, que aprende a generar habla realista y música de piano escuchando sólo el audio». Puedes consultarlo aquí.
- «Conoce Imagen Video y Phenaki, dos enfoques de investigación para la generación de texto a vídeo. Mediante la combinación de técnicas de difusión y aprendizaje de secuencias, podemos generar vídeos con superresistencia a nivel de fotogramas y coherentes en el tiempo».
Contacta con nosotros. Estaremos encantad@s de guiarte en este apasionante mundo.