Les langues
Plus de 6 800 langues et dialectes sont parlés à travers le monde : parmi ceux-ci, seuls 600 sont écrits.
Vision Objects développe sans cesse de nouvelles langues en suivant un processus industriel parfaitement maîtrisé, basé sur la collecte d’échantillons d’écriture complets. Ce processus a prouvé son efficacité car, aujourd’hui, ses taux de fiabilité battent tous les records.
Vision Objects supporte plus de 85 language en reconnaissance d’écriture caractère par caratère et plus de 30 en reconnaissance d’écriture naturelle, y compris les langues parlées les plus utilisées dans le monde :
Au cœur de la technologie de reconnaissance d’écriture MyScript
Différents types d’écriture
La technologie de Vision Objects reconnaît tous les styles d’écriture avec les alphabets les plus utilisés dans le monde: l’arabe, le chinois, le cyrillique, la devanagari, le grec, l’hébreu, le japonais, le coréen, le latin, le tamoul et le thaï.
Pour être reconnue, l’écriture doit d’abord être segmentée en caractères, mots et phrases. Cette segmentation diffère selon le style d’écriture. Il est possible d’identifier trois types d’écriture différents :
- Les caractères isolés : chaque caractère est écrit séparément dans des cases et la segmentation de la suite de caractères est explicite. Cette méthode est souvent utilisée dans le traitement de formulaires où une fiabilité de reconnaissance élevée est nécessaire.
- Les caractères d’imprimerie : les lettres ne se touchent pas et le stylo est levé entre deux caractères consécutifs. La segmentation est implicite et doit être effectuée par le logiciel.
- L’écriture cursive : c’est le type d’écriture le plus difficile à reconnaître. Il nécessite l’utilisation de DataFormats, de lexiques et de modèles de langage pour une reconnaissance d’écriture précise et fiable.
L’écriture naturelle est un mélange de caractères d’imprimerie et d’écriture cursive car certaines lettres sont reliées entre elles et d’autres sont séparées :
Dans certaines langues, comme le chinois, l’écriture naturelle a un aspect complètement différent de l’écriture standardisée. La gestion de ces variations de styles d’écriture est un réel défi pour le moteur de reconnaissance MyScript :

Caractères chinois de « l’écriture semi-cursive »
en style standard (gauche) et en style semi-cursif (droite)
Spécificités des langues
Le moteur de reconnaissance tient compte d’un grand nombre de spécificités des langues :
- les caractères : certaines langues s’écrivent à l’aide d’un alphabet (anglais, grec, cyrillique, par ex.) et d’autres à l’aide d’idéogrammes (chinois, japonais, par ex.).
- le sens d’écriture : les langues peuvent s’écrire dans différents sens (de gauche à droite et de droite à gauche).
Variations des styles d’écriture
Le principal défi de la reconnaissance d’écriture est de reconnaître le style d’écriture de chacun, y compris la forme ou l’inclinaison des lettres.
En outre, l’écriture varie d’un pays à l’autre. L’anglais, par exemple, est parlé dans de nombreux pays (Royaume-Uni, États-Unis, Canada, etc.), mais le vocabulaire et le style d’écriture peut différer d’un endroit à un autre.
Analyse du texte manuscrit
Pour gérer la nature complexe d’une langue, MyScript prend en compte une grande quantité d’informations linguistiques :
- Les lexiques réduisent les possibilités de reconnaissance et augmentent par conséquent la fiabilité.
- Les DataFormats décrivent le format attendu de certaines informations spécifiques (numéros de téléphone, adresses e-mails, etc.).
- Les modèles de langage fournissent au moteur de reconnaissance une "intelligence linguistique". Ils décrivent de manière statistique comment la langue courante est formée et la probabilité que certains mots apparaissent ensemble.
Offre de langues de MyScript
Pour tenir compte des variations du style d’écriture, Vision Objects collecte des échantillons d’écriture écrits par des milliers de personnes pour chaque langue et chaque pays différent. Ces échantillons d’écriture sont utilisés pour adapter le moteur de reconnaissance d’écriture MyScript.
Pour garantir la reconnaissance la plus efficace dans chaque application, Vision Objects propose deux lignes de ressources linguistiques :
- MyScript Lingo : est un ensemble de "à packs de langues permettant de reconnaître l’écriture naturelle et même cursive et qui comprennent des modèles de langues et des DataFormats permettant de reconnaître du texte écrit librement. MyScript Lingo est idéal pour les applications de traitement de formulaires, de prise de notes, etc. nécessitant la saisie de texte.
- MyScript Letra : MyScript Letra fournit des ressources pour plus de 80 langues et permet de reconnaître des caractères isolés et éventuellement des caractères d’imprimerie. Il ne fournit pas de ressources linguistiques ou de modèles de langues avancés, c’est pourquoi il utilise moins de mémoire que MyScript Lingo. MyScript Letra convient tout particulièrement aux appareils embarqués.
Chaque kit de langue contient son propre groupe de ressources uniques. Celles-ci sont utilisées par différentes parties des SDK MyScript Builder lors du processus de reconnaissance.
Vision Objects supports more than 85 languages in charcater by chracter recognition and 30 languages in cursive handwriting including the world’s most widely used spoken languages:
















