DeepSpeech de Mozilla, el futuro de los motores de voz a texto ya es público - Imperio Noticias

>

DeepSpeech de Mozilla, el futuro de los motores de voz a texto ya es público

El último desarrollo de Mozilla es un motor de voz a texto que cambia la forma en la que interactuamos con los dispositivos

DeepSpeech de Mozilla, el futuro de los motores de voz a texto ya es público

Mozilla ha puesto a disposición del público en general su más reciente desarrollo, se trata de DeepSpeech 0.7.0, el cual es un motor de voz a texto que junto con un nuevo modelo acústico, se ha y sigue entrenado para el inglés estadounidense hasta ahora.

Motor de código abierto



-Es claro que la tendencia actual es la tecnología de voz, pero en contra de todo lo que se podía esperar en el pasado con los tan conocidos comandos de voz, la tecnología DeepSpeech de Mozilla aportará inteligencia artificial para interactuar.

Mozilla DeepSpeech 0.7.0

A pesar de que ya existen desde hace tiempo los asistentes virtuales como Siri y Alexa, DeepSpeech 0.7.0 ofrece muchas más posibilidades gracias a que es una implementación de TensorFlow, que utiliza la arquitectura de DeepSpeech de Baidu, la cual reconoce automáticamente la voz.

Como ya es de esperarse, DeepSpeech,desarrollado por Mozilla es de código abiertoy ha trabajado en este proyecto desde el 2016, lo que le llevó a la versión 0.1.0 que llegó en noviembre del 2017.



Mientras que en diciembre del 2019, Mozilla informó que ya trabajaba en la versión 0.6.0 de DeepSpeech y que tenía un problema mayor, no tenía retro compatibilidad con las versiones anteriores, lo que obligaba a los desarrolladores a empezar de cero su trabajo y adaptarlo a la novedad.

La idea de la última versión de DeepSpeech, según las propias palabras de los desarrolladores de Mozilla Research, ha sido la de crear un motor de reconocimiento del habla que sea simple, abierto y ubicuo, es decir, el motor no requerirá hardware de servidores para poder ejecutarse, evitando así el funcionamiento de otros desarrollos de redes neuronales.

Precisamente, esto es lo que define Mozilla como simpleza con DeepSpeech, pero además se ofrece en código abierto, la Licencia Pública de Mozilla y define ubicuo en el sentido de que el motor pueda ejecutarse en tantas plataformas e idiomas diferentes como sea posible.

Mozilla

Síguenos en Facebook y entérate de las noticias trend de la semana

No hay comentarios.:

Publicar un comentario