La unidad DeepMind de Google, que está trabajando para desarrollar computadoras súper inteligentes, ha creado un sistema para el habla generada por máquina que dice que supera la tecnología existente en un 50 por ciento.
DeepMind, con sede en el Reino Unido, que Google adquirió por aproximadamente 400 millones de libras ($ 533 millones) en 2014, desarrolló una inteligencia artificial llamada WaveNet que puede imitar el habla humana al aprender cómo formar las ondas de sonido individuales que crea una voz humana, dijo en un entrada de blog el viernes. En las pruebas a ciegas para el inglés de EE. UU. Y el chino mandarín, los oyentes humanos encontraron que el discurso generado por WaveNet sonaba más natural que el creado con cualquiera de los programas existentes de texto a voz de Google, que se basan en diferentes tecnologías. WaveNet todavía tuvo un rendimiento inferior al de las grabaciones del lenguaje humano real.
Muchos programas de habla generados por computadora funcionan utilizando un gran conjunto de datos de grabaciones cortas de un solo hablante humano y luego combinando estos fragmentos de habla para formar nuevas palabras. El resultado es inteligible y suena humano, si no completamente natural. El inconveniente es que el sonido de la voz no puede modificarse fácilmente. Otros sistemas forman la voz de manera completamente electrónica, generalmente basada en reglas sobre cómo se pronuncian ciertas combinaciones de letras. Estos sistemas permiten manipular fácilmente el sonido de la voz, pero han tendido a sonar menos natural que el discurso generado por computadora basado en grabaciones de hablantes humanos, dijo DeepMind.
WaveNet es un tipo de IA llamada red neuronal que está diseñada para imitar cómo funcionan las partes del cerebro humano. Dichas redes necesitan ser entrenadas con grandes conjuntos de datos.
Pat clava la situación con su comentario, una vez más.