Loquendo y los sintetizadores de voz
Hablar de Loquendo es citar a uno de los mejores sintetizadores de voz desarrollado hasta la fecha y el más comercializado profesionalmente. Sin llegar a ser perfecto, ha supuesto un enorme avance en el camino para que una máquina pueda leer un texto igual que una persona. A continuación vamos a explorar los sintetizadores de voz desde sus orígenes hasta la llegada de Loquendo y su proliferación en videos de Youtube.
Aparatos que han intentado reproducir la voz humana han habido muchos a lo largo de la historia, inicialmente mediante procesos mecánicos que imitaban las cuerdas vocales. Fue en los años 30 cuando los laboratorios Bell Labs desarrollaron el vocoder, un aparato electrónico con teclado que era capaz de pronunciar palabras inteligibles.
El vocoder se basaba en una serie de moduladores con filtros analógicos que permitían imitar los fonemas humanos. Versiones más modernas del vocoder se usaron en películas de ciencia ficción, pues se pensaba que así hablarían los robots en el futuro. Grupos de música de los 70 como los alemanes Kraftwerk hicieron un uso intensivo de estos aparatos.
Muy poco a poco se fueron mejorando estos sistemas y extendiéndose al gran público. En 1978 Texas Instrument crea el chip TMC0281, un mini sintetizador de voz de bajo coste que podía implementarse en gran cantidad de dispositivos. En la película E.T. aparece un juguete que tenía este chip y permitía leer palabras escritas. Los usuarios más expertos en electrónica también podían conectar este chip a su microordenador.
Las limitaciones sonoras y de procesamiento de los primeros ordenadores impedían que sólo por software pudieran imitar voces humanas. Sin embargo algunos programas parecían desafiar estas limitaciones. El juego español “El Enigma de Aceps” (1987, ACE software) de Amstrad era una aventura conversacional que, a diferencia de otros títulos parecidos, era capaz de leer los textos que aparecían durante la partida. La voz era muy robótica, pero se entendía y sin necesidad de hardware adicional.
A principios de los 90, con la llegada de las primeras tarjetas de sonido de 16 bits para ordenador, empiezan a aparecer nuevos programas “Text-To-Speech” (TTS) más avanzados donde podemos ya elegir entre diferentes voces, sexo, edad y la pronunciación ya no es tan monótona. Esto se conseguía simulando los acentos y los entonemas (curva melódica que hacemos al pronunciar una frase). Un programa muy famoso fue el “Text Assistant”, para Windows. Incluía el español, aunque más bien era español latino o neutro dado su acento.
Con el aumento de la memoria en los aparatos electrónicos se ideo una manera distinta de imitar el habla humana, mediante la pronunciación de palabras digitalizadas. Algunos GPS usan este sistema. Los inconvenientes son, aparte del gran consumo de memoria, la artificialidad que produce escuchar las palabras una a una, pronunciadas de manera independiente. Además, las palabras son siempre limitadas, ya que es impensable digitalizar todos los vocablos de un idioma.
A principios del nuevo siglo la empresa Loquendo empieza a investigar un sistema más avanzado de TTS y también más profesional. El secreto para conseguir más naturalidad consistía en usar fonemas digitalizados y no palabras enteras. Esto permite al ordenador leer palabras nuevas, como “pixfans” (pi-x-fan-s) o “supercalifragilisticoespialidoso”. Además, gracias al uso de entonemas, las frases suenan mucho más naturales.
Su uso profesional está muy extendido, y empresas como Ono o Iberia usan este programa para ahorrar empleados. Está disponible en más de 25 idiomas, y solo en español hay cinco versiones diferentes (castellano, español americano, mexicano, chileno y argentino), aparte de catalán, gallego y valenciano.
Enlace: Web para probar el Loquendo
Pero las voces Loquendo no se hicieron famosas entre el público joven por su uso profesional, sino por su uso más gamberro. Y es que es muy tentador escribir frases obscenas para oírlas como si las pronunciase un locutor de verdad. Con la proliferación de Youtube muchos usuarios han optado por usar las voces Loquendo en vez de la suya propia y así conseguir un vídeo más profesional y adulto, aunque sólo sea en la forma y no en el contenido. El problema es que se ha convertido en una plaga, con miles de videos, y cualquier excusa es buena usar el TTC. Sólo en Youtube hay más de 75.000 videos con voces Loquendo.
Deja tu huella
Crea tu avatar