Zoe, el futuro de los avatares

 
Científicos de la Universidad de Cambridge en Reino Unido crearon a Zoe, una interfaz “del futuro” con la que es posible, entre otras cosas, enviar mensajes manifestando emociones con el rostro del usuario, según informó la BBC.

Uno de los científicos que desarrolló este proyecto explicó que “en el futuro la imagen de los “avatares” (representaciones gráficas de personas en el mundo virtual) harán parte de la interacción entre humanos y máquinas.
Los textos originarán los movimientos de Zoe en tiempo real y es posible hacer que la muñeca virtual cambie de humor con solo apretar un botón. Cinco niveles de intensidad controlaran emociones como la alegría, la rabia, la tristeza, el miedo o la ternura.
Estas interfaces podrán ser usadas en mensajes que se enviarán con el rostro del usuario, en “diálogos” con la computadora, como actores virtuales o personajes de juegos. Así, se podría poner fin a muchos malentendidos que se generan respecto a los tonos de ciertos mensajes.
Los creadores revelan que dentro de un año se podrán ver personas virtuales muy similares a los humanos.

El sistema, llamado “Zoe”, es el resultado de una colaboración entre los investigadores de Cambridge Research Lab de Toshiba y del Departamento de Ingeniería de la Universidad de Cambridge. Los estudiantes han encontrado un notable parecido entre la cabeza sin cuerpo y Holly, el ordenador de la nave en la comedia británica de ciencia-ficción, Enano Rojo.

En realidad, la cara es la de Zoe Lister, una actriz tal vez más conocido como Zoe Carpenter en la serie de Canal4, Hollyoaks. Para recrear el rostro y la voz, los investigadores pasaron varios días grabando el discurso de Zoe y las expresiones faciales. El resultado es un sistema que es lo suficientemente ligero como para trabajar en la tecnología móvil, y podría ser utilizado como un asistente personal en los teléfonos inteligentes, o “mensajes con cara” para amigos.

El marco detrás de “Zoe” es también una plantilla que, en poco tiempo, podría permitir a la gente a subir sus propios rostros y voces, pero en cuestión de segundos, en lugar de días. Esto significa que, en el futuro, los usuarios podrán personalizar sus propias emociones.

Con la capacidad de desarrollo adecuada un usuario podría, por ejemplo, escribir el texto del mensaje “Voy a llegar tarde” y establecer la emoción “frustrado”. Su amigo recibiría entonces un “mensaje con cara” que se parecía al remitente, repitiendo el mensaje cara de frustración.

El equipo que creó Zoe actualmente están buscando aplicaciones y también está trabajando con una escuela para niños autistas y sordos, donde la tecnología podría utilizarse para ayudar a los alumnos a “leer” las emociones y leer los labios. En última instancia, el sistema puede tener múltiples usos – como en los juegos, en los libros de audio-visuales, como un medio de dar conferencias en línea, y en otras interfaces de usuario.

Esta tecnología podría ser el comienzo de toda una nueva generación de interfaces que harían de la interactuación con un dispositivo algo más agradable que hablar con otro ser humano.

“Nos llevó mucho tiempo crear a Zoe, porque tuvimos que empezar de cero y enseñar al sistema interpretar el lenguaje y la expresión. Ahora que ya entiende esas cosas, no debería ser demasiado difícil de transferir el mismo modelo a una voz y rostro diferentes”.

Además de ser más expresivo que cualquier sistema anterior, Zoe ocupa menos espacio. El programa utilizado para ejecutarse es de tan sólo unas decenas de megabytes de tamaño, lo que significa que se puede integrar fácilmente en los dispositivos informáticos más pequeños, como tabletas y teléfonos inteligentes.

Funciona mediante el uso de un conjunto de “colores primarios” emociones fundamentales. La voz de Zoe, por ejemplo, tiene seis configuraciones básicas – feliz, triste, tierno, enojado, asustado y neutral. El usuario puede ajustar estos valores a diferentes niveles, así como alterar el tono, la velocidad y la profundidad de la propia voz.

Mediante la combinación de estos niveles, es posible predefinir o crear combinaciones emocionales casi infinitas. Por ejemplo, la combinación de la felicidad con ternura y un ligero aumento de la velocidad y la profundidad de la voz hace que suene agradable y acogedor. Una combinación de velocidad, la ira y el miedo hace que el sonido Zoe como si estuviera entrando en pánico. Esto permite un nivel de sutileza emocional que los diseñadores dicen, no ha sido posible en otros avatares como Zoe hasta ahora.

Para que el sistema sea lo más realista posible, el equipo de investigación recogió un conjunto de datos de miles de sentencias, que se utilizan para entrenar el modelo de habla con la ayuda de la actriz en la vida real, Zoe Lister. Ellos también hicieron un seguimiento a la cara de Lister mientras ella hablaba con el software de visión por ordenador. Esta se convirtió en la voz y el rostro de modelado, los algoritmos matemáticos que les dio la voz y los datos de imagen que necesitaban para volver a crear expresiones en el rostro digital, partiendo directamente solo del texto.

La eficacia del sistema se probó con los voluntarios a través de un sitio web de crowdsourcing. A cada participante se les dio un video o un clip de audio de una sola frase del equipo de prueba y se les pidió identificar cuál de las seis emociones básicas emulaba. Se evaluaron diez frases, cada una por 20 personas diferentes.

Los voluntarios que sólo tenían vídeo sin sonido sólo reconocieron con éxito la emoción en el 52% de los casos. Cuando sólo tenían audio, la tasa de éxito fue del 68%. Los dos juntos, sin embargo, produjo una tasa de reconocimiento con éxito del 77%, ligeramente más alta que la tasa de reconocimiento para el Zoe de la vida real, ¡que era del 73%!. Esta mayor tasa de éxito en comparación con la vida real es probablemente debido a que la cabeza parlante sintética es deliberadamente más estilizada en su forma.

Además de la búsqueda de aplicaciones para su nueva creación, el equipo de investigación trabajará ahora en la creación de una versión del sistema que se pueda personalizar por los propios usuarios.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>