La importancia de la fonética en el reconocimiento de voz
Con la aparición del ya popular Kapten, ese GPS que no tiene pantalla, TENYUS SocialWare, la empresa Spin off de la Fundación Tecnología Social (FTS) ha dado un paso importante en la distribución de productos y servicios de la que llamamos tecnología responsable.Y con este artículo informando sobre algunos aspectos del producto, hacemos verdad nuestra máxima de que el usuario de la tecnología, debe estar en el centro de la misma; ser su protagonista indiscutible y proponer mejoras y diseños que puedan satisfacerle cada día más.
Este artículo responde a las preguntas de muchos usuarios acerca de la implantación del funcionamiento del Kapten en otros países, que sobre todo vienen de Latino América, EE.UU y de algunas otras partes del globo.
Se pregunta el usuario el por qué de la no implantación aún del producto en su país cuando TELEATLAS, la proveedora de los mapas, sí tiene cubierto el país en mayor o menor grado en otros dispositivos GPS.
La razón es fonética, semántica y tecnológica. Las cartografías GPS llevan muchas capas de información que realmente ahora ocupan muy poco sitio, "pesan poco", no solo porque las memorias son cada vez más grandes ahora, sino porque la información de las cartografías es puramente vectorial.
He explicado en algún otro artículo de este blog, cómo se dibujan los mapas gráficos a partir de la información vectorial del recorrido de las calles y vías en coordenadas concretas. Y esta información pesa realmente poco.
Existen otras capas de información que complementan a la puramente vectorial. Uun buen ejemplo es la capa de toponímicos donde figuran todas las calles y vías y los nombres de los lugares.
Otra capa que podemos comprender fácilmente es la de los POI o puntos de interés, que sitúa hoteles, bancos, bares, aparcamientos, hospitales y demás servicios en el mapa en su lugar correcto.
En el Kapten se añade una capa más, que es la "capa fonética". Esta sirve para ayudar al reconocimiento de voz a fin de que el uso de Kapten sea lo más sencillo posible. Aunque el equipo incorpora el prestigioso reconocimiento de NUANCE corriendo en un entorno Linux embebido, los fabricantes creyeron que no era suficiente: que un mapa tiene muchas toponimias, y que un usuario puede hablar con muchos timbres y acentos.
Por ello, hay una capa fonética que se elabora a partir de la capa de toponimias de la cartografía comercial, y que hace que el entendimiento de las direcciones, nombres de calles y demás de Kapten, sean increíbles. Ya se le hable con acento andaluz, mexicano, en alto o bajo, niño mujer u hombre, el nivel de acierto del Kapten es realmente sorprendente..
Esa capa requiere un desarrollo por parte de la empresa fabricante, Kapsys, y por tanto, que un país esté cubierto por TELEATLAS, no significa que solo con ponerle el mapa, el Kapten funcionaría al 100%. Más bien sería un desastre cuando se le nombrase una calle y no la entendiera.
Así que a medida que Kapsys vaya terminando los primeros desarrollos como es el caso ya de Francia, España, Alemania e Inglaterra y próximamente Italia y Portugal, deberá seguir realizando desarrollos para otras latitudes. Y seguro que lo harán: la empresa vive de esto y siempre que exista rentabilidad probada, el desarrollo será una realidad.




