Les langues
Plus de 6 800 langues et dialectes sont parlés à travers le monde : parmi ceux-ci, seuls 600 sont écrits.
Vision Objects développe sans cesse de nouvelles langues en suivant un processus industriel parfaitement maîtrisé, basé sur la collecte d’échantillons d’écriture complets. Ce processus a prouvé son efficacité car, aujourd’hui, ses taux de fiabilité battent tous les records.
Vision Objects supporte plus de 97 languages en reconnaissance d’écriture caractère par caratère et plus de 54 en reconnaissance d’écriture naturelle, y compris les langues parlées les plus utilisées dans le monde :
Au cœur de la technologie de reconnaissance d’écriture MyScript
Différents types d’écriture
La technologie de Vision Objects reconnaît tous les styles d’écriture avec les alphabets les plus utilisés dans le monde: l’arabe, le chinois, le cyrillique, la devanagari, le grec, l’hébreu, le japonais, le coréen, le latin, le tamoul et le thaï.
Pour être reconnue, l’écriture doit d’abord être segmentée en caractères, mots et phrases. Cette segmentation diffère selon le style d’écriture. Il est possible d’identifier trois types d’écriture différents :
- Les caractères isolés : chaque caractère est écrit séparément dans des cases et la segmentation de la suite de caractères est explicite. Cette méthode est souvent utilisée dans le traitement de formulaires où une fiabilité de reconnaissance élevée est nécessaire.
- Les caractères d’imprimerie : les lettres ne se touchent pas et le stylo est levé entre deux caractères consécutifs. La segmentation est implicite et doit être effectuée par le logiciel.
- L’écriture cursive : c’est le type d’écriture le plus difficile à reconnaître. Il nécessite l’utilisation de DataFormats, de lexiques et de modèles de langage pour une reconnaissance d’écriture précise et fiable.
L’écriture naturelle est un mélange de caractères d’imprimerie et d’écriture cursive car certaines lettres sont reliées entre elles et d’autres sont séparées :
Dans certaines langues, comme le chinois, l’écriture naturelle a un aspect complètement différent de l’écriture standardisée. La gestion de ces variations de styles d’écriture est un réel défi pour le moteur de reconnaissance MyScript :

Caractères chinois de « l’écriture semi-cursive »
en style standard (gauche) et en style semi-cursif (droite)
Spécificités des langues
Le moteur de reconnaissance tient compte d’un grand nombre de spécificités des langues :
- les caractères : certaines langues s’écrivent à l’aide d’un alphabet (anglais, grec, cyrillique, par ex.) et d’autres à l’aide d’idéogrammes (chinois, japonais, par ex.).
- le sens d’écriture : les langues peuvent s’écrire dans différents sens (de gauche à droite et de droite à gauche).
Variations des styles d’écriture
Le principal défi de la reconnaissance d’écriture est de reconnaître le style d’écriture de chacun, y compris la forme ou l’inclinaison des lettres.
En outre, l’écriture varie d’un pays à l’autre. L’anglais, par exemple, est parlé dans de nombreux pays (Royaume-Uni, États-Unis, Canada, etc.), mais le vocabulaire et le style d’écriture peut différer d’un endroit à un autre.
Analyse du texte manuscrit
Pour gérer la nature complexe d’une langue, MyScript prend en compte une grande quantité d’informations linguistiques :
- Les lexiques réduisent les possibilités de reconnaissance et augmentent par conséquent la fiabilité.
- Les DataFormats décrivent le format attendu de certaines informations spécifiques (numéros de téléphone, adresses e-mails, etc.).
- Les modèles de langage fournissent au moteur de reconnaissance une "intelligence linguistique". Ils décrivent de manière statistique comment la langue courante est formée et la probabilité que certains mots apparaissent ensemble.
Offre de langues de MyScript
Pour tenir compte des variations du style d’écriture, Vision Objects collecte des échantillons d’écriture écrits par des milliers de personnes pour chaque langue et chaque pays différent. Ces échantillons d’écriture sont utilisés pour adapter le moteur de reconnaissance d’écriture MyScript.
Pour garantir la reconnaissance la plus efficace dans chaque application, Vision Objects propose deux lignes de ressources linguistiques :
- MyScript Lingo : est un ensemble de 54 packs de langues disponible pour les SDK MyScript Builder.
MyScript Lingo comprend des modèles de langage et prend en compte les variations de styles d’écriture ainsi que le contexte linguistique afin de fournir une reconnaissance très précise de tous les types d’écriture: des caractères isolés à l’écriture naturelle.
- MyScript Letra : MyScript Letra fournit des ressources pour plus de 95 langues et permet de reconnaître des caractères isolés et éventuellement des caractères d’imprimerie. Il ne fournit pas de ressources linguistiques ou de modèles de langues avancés, c’est pourquoi il utilise moins de mémoire que MyScript Lingo. MyScript Letra convient tout particulièrement aux appareils embarqués.
Chaque kit de langue contient son propre groupe de ressources uniques. Celles-ci sont utilisées par différentes parties des SDK MyScript Builder lors du processus de reconnaissance.
Vision Objects supports more than 95 languages in charcater by chracter recognition and 54 languages in cursive handwriting including the world’s most widely used spoken languages:
















