Gama de idiomas
En todo el mundo se hablan más de 6.800 idiomas y dialectos, de los cuales solo 600 tienen escritura.
Vision Objects desarrolla continuamente nuevos idiomas con un proceso industrial perfectamente dominado, basado en la recogida de muestras completas de escritura y que ha demostrado su eficacia, ya que, hoy por hoy, no hay nada que supere su índice de precisión.
Vision Objects admite los idiomas más hablados del mundo:
En el corazón de la tecnología de reconocimiento de escritura de MyScript
Distintos tipos de escritura
La tecnología Vision Objects reconoce todos los estilos de escritura en los alfabetos más utilizados del mundo, que son: el árabe, el chino, el cirílico, el devanagari, el griego, el hebreo, el japonés, el coreano, el latino, el tamil y el tailandés.
Para poder ser reconocida, la escritura manuscrita debe primero segmentarse en caracteres, después en palabras y por último en oraciones. Esta segmentación difiere en cada estilo de escritura. Identificamos tres tipos de escritura distintos:
- Caracteres aislados: cada carácter se escribe por separado en cuadros de texto y la segmentación de los caracteres consecutivos es explícita. Suele utilizarse en procesamiento de formularios, donde se requiere una alta precisión en el reconocimiento.
- Caracteres de imprenta: las letras no se tocan entre sí y el bolígrafo se levanta entre dos caracteres consecutivos: La segmentación es implícita y debe ser informatizada por el software.
- Escritura cursiva: es el tipo más difícil de reconocer. Requiere el uso adicional de DataFormats, vocabularios y modelos lingüísticos para que el reconocimiento sea fiable y preciso.
La escritura manuscrita natural es una mezcla de caracteres de imprenta y cursivos, ya que algunas letras están unidas entre sí y otras están aisladas.
En algunos idiomas, como el chino, la escritura natural tiene un aspecto completamente distinto que la escritura normalizada. Solucionar con éxito estas variaciones en los estilos de escritura es todo un desafío para el sistema de reconocimiento de MyScript:

Caracteres chinos en escritura semicursiva: a la izquierda,
escritura normal y a la derecha, escritura semicursiva.
Especificidades de cada idioma
El sistema de reconocimiento tiene en cuenta muchas especificidades de cada idioma:
- caracteres: algunos idiomas se basan en alfabetos (inglés, griego, cirílico) mientras que otros utilizan ideogramas (chino o japonés),
- direcciones de escritura: los idiomas se escriben en distintas direcciones (de izquierda a derecha, de derecha a izquierda).
Variación en los estilos de escritura
La principal dificultad a la hora de reconocer la escritura es procesar los distintos estilos de escritura individuales, como las inclinaciones y las formas.
Asimismo, la escritura varía en los distintos países; por ejemplo, el inglés se habla en muchos países (Reino Unido, EE.UU., Canadá etc.), pero el vocabulario y los estilos de escritura varían en cada lugar.
Análisis del texto manuscrito
Para abordar la naturaleza compleja de un idioma, MyScript tiene en cuenta gran cantidad de datos lingüísticos:
- Vocabularios: acotan las posibilidades de reconocimiento, incrementando así la precisión.
- DataFormats: describen el formato esperado de información específica (como números de teléfono, direcciones de e-mail, etc).
- Modelos lingüísticos: dotan al motor de reconocimiento de "inteligencia artificial". Describen estadísticamente cómo se forma el lenguaje corriente y la probabilidad de que determinadas palabras aparezcan juntas.
Oferta de idiomas de MyScript
Para cubrir la enorme variedad de estilos de escritura, Vision Objects recopila, para cada idioma y país, muestras manuscritas de miles de personas. Estas muestras sirven para instruir al motor de reconocimiento de escritura de MyScript.
Con el fin de asegurar el reconocimiento más eficaz para cada aplicación, Vision Objects ofrece dos gamas de recursos lingüísticos:
- MyScript Lingo: es una colección de 30 paquetes de idiomas que permite reconocer la escritura natural e incluso la cursiva y que integra modelos lingüísticos y DataFormats para realizar el reconocimiento de texto libre. MyScript Lingo es perfecto para procesar formularios, tomar notas o para cualquier otro uso que implique la introducción de datos.
- MyScript Letra: MyScript Letra ofrece recursos de más de 80 idiomas y permite el reconocimiento de caracteres aislados y posiblemente de imprenta. No ofrece ningún recurso lingüístico avanzado ni modelo lingüístico que utilice menos memoria que MyScript Lingo. MyScript Letra es especialmente idóneo para los dispositivos integrados.
Cada paquete de idioma contiene su propio grupo de recursos, utilizados por los distintos componentes de los Kits de Desarrollo de Software MyScript Builder para el proceso de reconocimiento.
















