TTS Aholab, la aplicación que da voz propia

GAIZKA ESPARZA

Daniel García Lorenzo, ingeniero técnico de telecomunicación por la Escuela técnica superior de ingeniería de Bilbao (UPV/EHU), ha sido el encargado de desarrollar la aplicación TTS Aholab como proyecto fin de carrera. Un trabajo de matricula de honor, que ha recibido varios premios, entre ellos el de mejor aplicación en la categoría de Educación e Innovación, mejor aplicación de Bizkaia y mejor aplicación del concurso Start BiscayApp’14, promovido por la fundación BiscayTIK.dani

La idea original era acercar la tecnología que desarrolla el laboratorio Aholab al usuario final de una forma más práctica con la intención de que llegara al mayor número de personas posible. La aplicación está dirigida a personas con dificultades en el habla e incorpora características novedosas respecto a otros servicios de conversion de texto a voz existentes en el mercado. «La mayoría permiten únicamente al usuario introducir un texto y sintetizarlo sin dejarle modificar ningún tipo de parámetro de la voz de salida y mucho menos la selección de una voz sintética personalizada. En este aspecto, la aplicación permite sintetizar textos en múltiples idiomas con la posibilidad de seleccionar aspectos como el tono, la velocidad de dictado, la intensidad o incluso la distorsión de la voz de salida. También permite a los usuarios emplear modelos de voz adaptados a sus necesidades para realizar la conversión texto-voz. Para ello, los usuarios pueden crear u obtener estas voces sintéticas personalizadas en la plataforma Zure-TTS», explica Daniel.

En definitiva, una de las principales ventajas de esta aplicación es la de poder crear una voz que se adapte a cada persona, teniendo en cuenta su género, edad o características físicas. Pero no es la única, además, acelera el proceso de comunicación respecto a otras haciéndo que sea mucho más práctico su uso. «Muchas de las personas con discapacidades orales tienden a no utilizar los sintetizadores de texto a voz, ya que consideran que es un proceso relativamente lento y se expresan antes escribiendo a mano lo que quieren decir. Por ello la aplicación también está diseñada para funcionar de una forma práctica y adaptada a las necesidades reales de estas incorporando mecanismos que faciliten y minimicen el tiempo necesario para poder llevar a cabo la comunicación», argumenta Daniel.screenshot-3

La app dispone de varios recursos que se dividen entre los del usuario, compuestos por todas las locuciones generadas por ellos mismos y que se almacenan en la memoria del dispositivo, y los de aplicación, compuestos por una base de datos, archivos de audio por defecto, un archivo de preferencias de usuario y una librería de gestos. «Es posible asignar gestos, trazos o símbolos a cada locución para poder reproducirlas con posterioridad desde cualquier pantalla o punto de la aplicación de un modo más intuitivo. Imaginemos que el usuario tiene almacenada una locución que dice: “¿Me puede decir la hora por favor?”. En este caso se puede asignar un gesto a la misma, una circunferencia, por ejemplo. De este modo, si en un momento concreto el usuario necesita preguntar la hora no necesita buscar la locución acorde entre todas las categorías y locuciones que tiene guardas sino que puede optar por simplemente dibujar una circunferencia y el audio asignado a dicho gesto se reproduce automáticamente reduciendo así drásticamente el tiempo necesario para poder expresarse», relata el creador de la aplicación.

En cuanto al banco de voces que se encuentra en el servidor Zure-TTS, hay que señalar que está compuesto por todas aquellas voces que diferentes personas han decidido donar mediante un sencillo proceso de grabación de cien frases. Una vez grabadas el sistema crea un modelo sintético de la voz a partir de dichas grabaciones disponible para poder realizar el proceso de síntesis.

Daniel recogiendo el premio otorgado por fundación BiscayTIK.
Daniel recogiendo el premio otorgado por fundación BiscayTIK.

A día de hoy la aplicación se encuentra en fase de difusión entre los usuarios. «Las críticas recibidas han sido positivas y parece tener bastante gancho y visión de futuro», celebra Daniel. En estos momentos trabajan en futuras modificaciones de app tras recibir opiniones y recomendaciones de los propios usuarios. Daniel nos adelanta que en poco tiempo se va a añadir en la web de la app  un formulario para que toda persona que así lo desee pueda enviar sus recomendaciones, dudas, impresiones o quejas. Todo ello con el objetivo final de mejorar y adaptar la aplicación a la demanda existente.

 

 

 

 

 

 

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *