“Un mundo más allá de las pantallas”, el evento que reúne a los grandes profesionales del audio online y la IA Conversacional
El evento ha consistido en un conjunto de ponencias de profesionales relevantes del sector que han analizado las claves, tendencias, modelos y proyectos del Audio Online, Tecnología de Inteligencia Artificial Conversacional y las Marcas en la Era de la Conversación. Por lo tanto, el evento en sí quedó dividido en tres grandes bloques: audio, tecnología y marcas. Éstos son los grandes tres elementos que hacen posible que esta industria esté creciendo de manera exponencial.
Por un lado, en cuando a audio online, se exponen algunas claves para entender la producción de Audiolibros y podcasts, así como otras producciones de audio. Con la intervención de Marta García (Fundadora de Smart Locuciones, Audiolibros), Juan Baixeras (Country Manager de Audible en España e Italia) y Javier Celaya (Director de América Latina y Acuerdos Globales de Podimo).

Marta García describe su visión acerca de los audiolibros y de cómo van más allá de lo conceptual (un libro narrado para ser escuchado), el audiolibro también es emocional porque muestra sentimientos en la voz que se pierden con el libro tradicional. También se ha hablado sobre producción de audiolibros (cómo se hace la selección de narradores, grabación, entregas, revisiones, etc…) y de cómo los narradores aportan otra visión a los proyectos gracias a su voz, su registro, etc.
Juan Baixeras habla del sector del audio y de cómo se encuentra en su periodo de “infancia”, con la suma de proyectos y esfuerzos de las empresas que se dedican al sector, se está consiguiendo que este crezca y se haya creado una industria.
Javier Celaya explica que hay más de 15.000 libros en español actualmente y una industria que cada vez tiene más peso en millones de euros de facturación. En relación a ello, Celaya se encarga de desarrollar los informes de evolución del entorno digital en español (ebooks y audiolibros). Según los datos de este informe, en el año 2019 este entorno digital creció un 35%, 2020 (año de pandemia) el crecimiento fue de 133%, en el primer trimestre del año 2022 se ha consumido más contenido y se han registrado más usuarios que en todo el año 2021. Estos datos, explicados por el especialista, ejemplifican el crecimiento increíble de este sector.
En cuanto a temáticas dentro de los audiolibros, cabe destacar que se escucha más ficción que no-ficción, en cambio, en el mundo del podcast español, las categorías que más destacan, según Baixeras, son el true crime, mindfulness y comedia.
Existe una gran diferencia entre las producciones destinadas a convertirse en audiolibro y aquellas que están destinadas a ser un podcast, no solo en cuanto a temática, sino también en cuanto a la manera de enfocar el guion o de cómo diseñar todo el contenido. Para Celaya, el podcast da más juego en cuanto a creatividad, ya que, en audiolibro, generalmente, tanto autores como agentes, no dejan cambiar nada de lo que se escribió en el guion.
El sector del audio (en el que se incluyen, entre otros, podcasts y audiolibros) actualmente funciona como herramienta para hacer dinámicas algunas tareas que hasta ahora eran costosas de llevar a cabo. Ambos profesionales entrevistados en el evento coinciden en que estamos acostumbrados a aprender escuchando lo que nos rodea, por lo tanto, no es sorpresivo que acompañemos las tareas cotidianas con audio online, o que se esté dando una conversión a audio de muchos textos que antes se debían leer (en el ámbito académico hay un gran cambio que implica dedicar tiempo a escuchar para aprender y no tanto estudiar unos textos que requieren de mucha más atención y menos cercanía). También es posible observar como las organizaciones de audio digital comienzan a innovar adaptando comics a audio o resucitando las radionovelas que tanto éxito tuvieron en el pasado. Además, según Celaya, otro elemento en el que el sector del audio en español como industria necesita investigar e innovar es en las voces sintéticas que convierten a audio textos como los titulares informativos destacados del día, entre otras muchas aplicaciones. Este tema se desarrolla en los siguientes bloques del evento.
Todos los elementos mencionados convergen en un mismo punto: las personas estamos dispuestas a consumir más contenido si lo escuchamos porque el audio es flexible y más dinámico que cualquier otro formato.
Rocío Echevarría (Directora de Negocio de PRISA Audio) habla de la producción de proyectos de audio y de cómo esa inversión en audio y los nuevos modelos hacen que se generen grandes cambios en la organización.
Se hace mención al crecimiento de la inversión publicitaria (clave para el crecimiento del sector). Echevarría menciona que en 2017 (primer año de medición de la inversión en audio digital) hubo una inversión de 4 millones de euros mientras que en el pasado año 2021 esta cifra aumentó a un total de 61.8 millones de euros en inversión, lo cual implica que las marcas toman al audio digital como uno de los principales formatos a los que dedicar inversión publicitaria.
Uno de los grandes retos al que se enfrenta la industria, desde el punto de vista de negocio es conseguir una evolución exitosa de la publicidad en este formato tan novedoso, si cambian los intereses del oyente y la manera de consumir contenido, también debe cambiar la manera de publicitarse en él.
El segundo bloque, dedicado a la tecnología, ha sido presentado por Iago Cid (Mánager de soluciones tecnológicas en Avantgarde IT) el cual explica la evolución de la Inteligencia Artificial (IA), y qué esperar en el futuro de este sector tan novedoso. El gran objetivo de las IA y su desarrollo es que los propios algoritmos puedan tomas sus propias decisiones y unas bases de datos que sean cada vez menores para obtener unos resultados igual de eficientes que las anteriores. Actualmente, GPT-3 es el motor de IA más conocido y potente del mundo y gracias a éste se desarrollan grandes proyectos con cada vez más facilidad y eficiencia haciendo crecer el sector de manera exponencial.
En cuanto a voces sintéticas desarrolladas con IA, cada vez nos estamos acercando más al punto donde no se distingue una voz natural de una sintética. Ello aporta grandes ventajas al sector del audio pues “con las herramientas adecuadas se pueden entrenar voces sintéticas para general nuestra propia voz” dice Iago Cid.
Continuando con la temática tecnológica en el sector del audio digital, Andrés Pazos (Senior Business Development Manager de Amazon Alexa) expone la importancia de los altavoces inteligentes con servicio de voz como Alexa en las nuevas rutinas de la sociedad actual y cómo evolucionan en su día a día. Pazos asegura que la voz es la manera más natural para comunicarnos con la tecnología.
Javier Huertas (Business Parterships Lead en Aflorithmic) explica la evolución del Text-To-Speech o TTS y la evolución de las voces artificiales, haciendo especial mención en la combinación de estas voces artificiales con otros elementos de producción como efectos de sonido (entradas, salidas transiciones) o música que hacen de la experiencia de escuchar voces sintéticas algo más natural para el usuario, ya que, actualmente, las voces sintéticas son muy neutras y se está trabajando en el desarrollo de voces más emocionales.
En el evento también se ha hablado de algunos conceptos muy novedosos, como lo es la biometría de voz. Belén Aliño (Business Development Manager de Veridas) habla de la importancia de la seguridad en el uso de la identidad digital y en relación con ello, explica el concepto de biometría de voz, el cual es un sistema que te permite identificar y autenticar a la gente a través de su voz, es decir, “una huella vocal” que permite identificar a esa persona, lo que implica un modo nuevo de verificar identidades. Esta tecnología se puede aplicar en multitud de lugares como compras online o call centers donde sabrán quién llama sin pedir datos previos. Además, con esta tecnología se consigue mejorar la experiencia del usuario, el cual tiene que dedicar menos tiempo a este tipo de acciones.
Roberto Carreras (Fundador y CEO de Voikers) explica las ventajas del audio frente a textos muy extensos, en porcentajes, es mucho más probable que el usuario acabe de escuchar una información extensa a que se lea esa misma información al completo. Por ello, Enrique Zornoza (Project Manager en Avantgarde IT – Auris), explica el desarrollo de Auris, un proyecto desarrollado por Voikers y avantgarde IT, que permite transformar texto a audio de manera automática en español a través de una gran selección de voces en español con distintos acentos. Zorzona explica que el proceso de creación de Auris persigue un objetivo claro: evitar la monotonía a la que estamos acostumbrados con voces sintéticas, especialmente si reproducen textos largos. Además, esta herramienta está destinada a democratizar la utilización de voces sintéticas en español. Algunos creadores de contenido (podcasters, medios independientes, etc.) quizás no tendrían los recursos suficientes para disponer de una herramienta así para sus proyectos.
Auris es una herramienta novedosa, la primera que permite utilizar voces sintéticas para leer textos. Además, una vez generado un player y puesto a disposición del usuario desde Auris se puede hacer un seguimiento de su éxito con gráficos que lo muestran de manera automática.
El evento también trata sobre los distintos dispositivos a través de los cuales se puede consumir audio online. El avance de las tecnologías permite acceder a dicho contenido en cualquier momento del día y con multitud de dispositivos. Uno de los dispositivos más novedosos y, además, uno de los que más ha crecido en los últimos dos años en cuanto a su utilización para reproducir audio online es el Smart Speaker o altavoz inteligente. La primera ponente en el bloque de Marcas en laEra de la Conversación es Olalla Novoa (Voice Strategy, Communications and Digital Transformation PRISA Media) explicando contenidos ofrecidos y su adaptación a este dispositivo desde el punto de vista de un gran medio como es PRISA. En cuanto a los contenidos publicitarios en este dispositivo, PRISA cuenta con una segmentación de anuncios por Smart Speaker que cada vez tiene más éxito.
“Las empresas necesitan escuchar, los usuarios tienen que entender en qué punto estamos” Esther Checa (Directora de Innovación en t2O), segunda ponente del bloque de empresas. Para adaptarse a los nuevos tiempos, a nuevos medios que surgen como podría ser el altavoz inteligente, entre otros muchos, es necesario entender el comportamiento del usuario en los nuevos canales de voz porque la manera de comunicarnos con este tipo de asistentes no tiene que ver con la manera de relacionarnos con otras personas. Según Esther Checa, son muy importantes las investigaciones que llevan a cabo compañías como Amazon o Google porque simplifican la forma en la que se puede hablar con los dispositivos. Por otro lado, menciona las grandes oportunidades de clusterización y segmentación que ofrece la IA conversacional, ya que el usuario tiene una conversación con ella, lo que permite conocer sus comportamientos de una manera hasta ahora nunca vista.
Para finalizar el evento, Roberto Carreras explica el modelo actual de audio online, sus ventajas y cómo se ha adaptado para satisfacer los nuevos comportamientos del usuario. “La posibilidad que existe a día de hoy de que todo lo que se lee o se ve también se pueda escuchar, en ello hay algo muy relevante que es el cambio de comportamiento de la gente. Cuando una tecnología cambia el comportamiento de la gente a la hora de hacer algo, ya no hay quien lo pare” declara Carreras. Durante el evento, Roberto Carreras presentó también la nueva plataforma Korero, que tiene por objetivo poner en contacto a podcasters y a anunciantes, facilitando que los primeros puedan monetizar su contenido y, los segundos, hacer campañas en el creciente mercado de la Publicidad en Podcasts.
