No cabe duda de que uno de los grandes fenómenos que han sacudo del mundo —y, especialmente, las redes— durante los últimos meses ha sido el boom de la inteligencia artificial. En cuestión de semanas, herramientas como Dall-E o Chat GPT se convirtieron en la sensación viral del momento inundando nuestros feeds con infinidad de imágenes generadas mediante texto, debates sobre el significado de los conceptos de arte y artista, y augurios particularmente apocalípticos.
la realidad es que, si nos centramos en el campo de la creación audiovisual —y, más concretamente, en la fase de posproducción—, las IA llevan una buena temporada entre nosotros haciéndonos la vida mucho más fácil integradas en software tan popular como Photoshop, After Effects, Premiere Pro o Final Cut Pro. No obstante, estas ayudas, de un perfil muy discreto, están quedando eclipsadas debido a una evolución tecnológica que ha alcanzado velocidades de vértigo.
Una de las últimas muestras de los límites a los que están llegando estos procesos deja en pañales a la actualización de NVIDIA Broadcast que hace que nuestros ojos miren directamente a cámara aunque estén centrados en otro punto. Está creada por la compañía FlawlessIA y abre un futuro repleto de posibilidades que, probablemente, pondrá los pelos de punta a más de uno, pero que podría marcar un antes y un después para los estudios cinematográficos y los actores y actrices de doblaje.
Fucks por Fricks
El pasado 2022, Scott Mann estrenó su cuarto largometraje bajo el título de 'Fall', un thriller de supervivencia que pasó por la última edición del Festival de Sitges en el que dos mujeres se quedan atrapadas a 600 metros de altura tras escalar una torre de comunicaciones. Por suerte o por desgracia, el filme protagonizado por Grace Fulton y Virginia Garden se ganó una calificación R por culpa de su lenguaje malsonante, que incluía la friolera de 35 "fucks" en su versión original.
El problema para extraer rentabilidad de producciones con calificaciones por edades para adultos hizo que la distribuidora Lionsgate exigiese un corte suavizado para alcanzar un PG13, mucho más accesible y fácil de comercializar. Para lograrlo, la MPAA requirió que sólo hubiese un uso de la palabra de marras en todo el metraje; un auténtico quebradero de cabeza que podría traducirse en un desastre en la sala de montaje o en un desembolso considerable para rodar reshoots de ciertas escenas. Y, entonces, apareció la IA.
Scott Mann, que ha compaginado su carrera como cineasta con la investigación sobre inteligencia artificial enfocada al medio en su startup FlawlessIA, encontró con 'Fall' la excusa perfecta para poner a prueba el sistema que tenía en desarrollo: un software que permite manipular los rostros de los intérpretes y alterar sus expresiones faciales y gestos bucales para ajustarse al diálogo.
De este modo, y tal como puede verse en el vídeo sobre estas líneas, Mann y su equipo modificaron los "fucks" y los cambiaron por "fricks" —algo así como el equivalente a cambiar nuestro "hostias" por "ostras"—; salvando la papeleta y permitiendo a la película, presupuestada en 3 millones de dólares, recaudar más de 7 en Estados Unidos y superar los 17 millones en todo el mundo. Sólo necesitaron citar a las actrices en el estudio, grabar unos cuantos diálogos modificados y dejar que la IA hiciese su magia.
Detrás del trabajo de FlawlessIA se esconde una herramienta poderosísima que, además de ampliar el margen de maniobra de estudios y realizadores una vez concluida la fotografía principal, está llamada a cambiar para siempre el mundo del doblaje. Quien se haya puesto alguna vez detrás del atril para prestar su voz a un personaje interpretado en otro idioma sabrá que una de las mayores dificultades radica en una sincronización que podría tener los días contados.
Para que el doblaje sea lo más natural posible y no despiste al espectador, las sílabas y golpes de voz deben ajustarse lo máximo posible al movimiento de los labios del intérprete en pantalla. Para ello, el actor o actriz de doblaje debe milimetrar la velocidad de su interpretación, viéndose en ocasiones obligado a repetir takes hasta dar con la "sincro" perfecta. Ya se sabe que en la industria audiovisual el tiempo es dinero, y la obra de Mann podría suponer grandes ventajas al respecto.
Vamo a calmarno
Aunque muchos puedan, no sin cierta razón, caer en la tentación de entregarse al catastrofismo y profetizar un futuro próximo casi distópico y, teniendo en cuenta que, tal y como comentábamos anteriormente, la irrupción de la IA en el medio no es algo reciente, es de rigor centrarse en los beneficios que puede brindar esta tecnología como esta a sectores implicados en producciones cinematográficas o televisivas.
Por una parte encontramos a los estudios y a los hombres y mujeres de los trajes y los maletines, que tendrían una extensa red de seguridad al realizar inversiones en proyectos. Factores como el potencial ahorro en reshoots o la opción de ofrecer versiones con diferentes calificaciones por edades centradas en el lenguaje sin sobrecostes excesivos son dos buenos ejemplos de ello.
Por otra, los trabajadores del mundo del doblaje también sacaría provecho, comenzando por unos traductores que podrían localizar textos con mucha mayor facilidad sin necesidad de ajustar sílabas y buscar sinónimos y frases que cuadren con los labiales originales. Además, los actores y actrices podrían centrar sus esfuerzos en la interpretación —pese a tener que seguir, con mayor libertad, pendientes de tempos y cadencias—, lo cual podría traducirse en mejores resultados a nivel dramático.
Por supuesto, aún queda mucho por hacer y pulir —el valle inquietante sigue haciendo acto de presencia—, pero eso es lo de menos al hablar de temas como este. La verdadera problemática radica en el uso que puede darse a este tipo de utilidades a nivel sociopolítico y que, si nos ponemos conspiranoicos, podría dejar en pañales los horrores de la posverdad.
Ver 12 comentarios