Sprachangebote
Mehr als 6800 Sprachen und Dialekte werden weltweit gesprochen: davon werden nur 600 geschrieben.
Vision Objects entwickelt in einem perfekt beherrschten industriellen Prozess, der darauf basiert, komplette Schreibbeispiele zu sammeln, ständig neue Sprachen. Dieser Vorgang hat sich bewährt, denn die Genauigkeitsraten brechen heute alle Rekorde.
Vision Objects unterstützt die am weitesten verbreiteten Sprachen der Welt:
Der Kern der MyScript-Technologie zur Handschrifterkennung
Verschiedene Handschriftarten
Die Technologie von Vision Objects erkennt alle Schreibstilarten, die in den weltweit am häufigsten verwendeten Alphabeten benutzt werden. Arabisch, Chinesisch, Kyrillisch, Dewanagari, Griechisch, Hebräisch, Japanisch, Koreanisch, Latein, Tamil und Thai.
Damit die Handschrift erkannt werden kann, muss sie zunächst in Zeichen bzw. Buchstaben, Wörter und Sätze segmentiert werden. Diese Segmentierung unterscheidet sich je nach Schreibstil. Wir können drei unterschiedliche Handschriftarten festlegen:
- Einzelne Zeichen bzw. Buchstaben: Jedes Zeichen bzw. jeder Buchstabe wird separat in Kästchen geschrieben und die Segmentierung der folgenden Zeichen bzw. Buchstaben ist eindeutig. Diese Art wird oft in der Formularverarbeitung verwendet, so eine hohe Erkennungsgenauigkeit erforderlich ist.
- Handgeschriebene Zeichen bzw. Buchstaben: Zeichen bzw. Buchstaben berühren einander nicht und der Stift wird zwischen zwei aufeinander folgenden Zeichen bzw. Buchstaben abgesetzt. Die Segmentierung ist nicht eindeutig und muss von der Software errechnet werden.
- Schreibschrift: Diese Art ist am schwierigsten zu erkennen. Für eine verlässliche, genaue Erkennung müssen zusätzlich DataFormats, Lexika und Sprachmodelle hinzugezogen werden.
Natürliche Handschrift ist eine Mischung von handgeschriebenen Zeichen bzw. Buchstaben und Schreibschrift, da einige Zeichen bzw. Buchstaben miteinander verbunden und andere voneinander getrennt sind.
In einigen Sprachen, wie z. B. Chinesisch, sieht die natürliche Handschrift völlig anders aus, als die standardisierte Handschrift. Der Umgang mit diesen Unterschiedlichkeiten in den Schreibstilen ist eine echte Herausforderung für die MyScript-Erkennungssoftware:

Chinesische Zeichen in „halbkursiver Schrift“ in
normaler Schrift (links) und in halbkursiver Schrift (rechts)
Besonderheiten der Sprache
Die Erkennungssoftware berücksichtigt eine Vielzahl an Besonderheiten der Sprache:
- Zeichen: Einige Sprachen basieren auf einem Alphabet (z. B. Englisch, Griechisch, Kyrillisch), andere verwenden Ideogramme (z. B. Chinesisch oder Japanisch).
- Schreibrichtungen: Sprache kann in verschiedene Richtungen geschrieben werden (links nach rechts, rechts nach links).
Variationen in den Schreibstilen
Die Hauptherausforderung in der Handschrifterkennung ist der Umgang mit individuellen Handschriftstilen, dazu zählen die Schiefstellung und Formen.
Zudem unterscheidet sich die Handschrift von Land zu Land. Englisch wird beispielsweise in vielen Ländern gesprochen (GB, USA, Kanada, usw.), aber das Vokabular und die Schreibstile können in den verschiedenen Orten variieren.
Analyse von handgeschriebenem Text
Um mit der komplexen Natur einer Sprache umgehen zu können, berücksichtigt MyScript eine Vielzahl an linguistischen Informationen:
- Lexika: Grenzen die Erkennungsmöglichkeiten ein und erhöhen damit die Genauigkeit.
- DataFormats: beschreiben das zu erwartende Format für bestimmte Informationen (z. B. Telefonnummern, E-Mail-Adressen, etc.)
- Sprachmodelle: statten die Erkennungs-Engine mit „linguistischer Intelligenz" aus. Sie beschreiben statistisch wie normale Sprache gebildet wird und wie hoch die Wahrscheinlichkeit ist, dass geschriebene Wörter zusammen auftauchen.
MyScript Sprachangebote
Um die Variationen im Handschriftstil berücksichtigen zu können, sammelt Vision Objects Handschrift-Beispiele von tausenden von Einzelpersonen für jede einzelne Sprache und jedes Land. Diese Handschrift-Beispiele werden verwendet, um die MyScript-Handschrifterkennungs-Engine zu trainieren.
Damit für jede Anwendung auf jeden Fall die effizienteste Erkennung angewendet wird, bietet Vision Objects zwei linguistische Ressourcenlinien:
- MyScript Lingo: ist eine Sammlung von 54 Sprachpaketen, die für MyScript Builder Software Development Kits erhältlich sind. MyScript Lingo umfasst Sprachmodelle und berücksichtigt Unterschiede in Schreibweisen und sprachlichen Kontext, um sehr genaue Erfassung aller Arten von Handschrift: von der isolierten Zeichen auf natürliche Handschrift.
- MyScript Letra: MyScript Letra bietet Ressourcen für mehr als 97 Sprachen und ermöglicht die Erkennung einzelner und vermutlich handgeschriebener Zeichen bzw. Buchstaben. Es bietet keine erweiterten linguistischen Ressourcen oder Sprachmodelle und verwendet einen niedrigeren Speicher-Footprint als MyScript Lingo. MyScript Letra eignet sich besonders für eingebettete Geräte.
Jedes Sprachpaket enthält seine eigene einzigartige Ressourcengruppe. Sie werden von verschiedenen Teilen des MyScript Builder Software Development Kits für den Erkennungsprozess verwendet.
















