世界中では 6800 以上もの言語や方言が話されています。このうち、書かれることがあるのは 600 言語のみです。

Vision Objects では、完璧にマスターした産業プロセスを通じ、完全な手書きサンプルのコレクションに基づいて常に新しい言語を開発しています。今日その価値は、すべての記録を破る精度によって証明されています。

Vision Objects では、次にあげる世界でもっとも使用されている言語をサポートしています。

MyScript 手書き認識テクノロジの核心

異なる種類の手書き

Vision Objects のテクノロジは、世界でもっとも幅広く使われている文字 (アラビア文字、中国語文字、キリル文字、デバナージャリ文字、ギリシャ文字、ヘブライ文字、日本語文字、ハングル文字、ラテン文字、タミール文字、タイ文字) を用いるすべての種類の書体を認識します。

手書きを認識するには、まず文字、単語、文にセグメント化しなければなりません。このセグメント化は、書体によって異なります。当社では手書きを次の 3 つの書体に分類しています。

MyScript supported handwriting styles

  • 孤立文字:各文字がボックスで仕切られたフィールドに 1 つずつ書かれ、連続する文字を明確にセグメント化できます。これは多くの場合、高い精度が要求されるフォーム処理で使用されます。
  • ブロック体の文字:文字が独立しており、連続する 2 文字の間でペンがいったん持ち上げられます。セグメント化は暗示的なもので、ソフトウェアによって計算する必要があります。
  • 手書きの続け書き:認識がもっとも難しいタイプです。この種類の手書きを確実かつ正確に認識するには、DataFormats、辞書、言語モデルを併用する必要があります。

自然な手書きにはブロック体と続け書きが混在しており、一部の文字は続けて書かれ、一部の文字は独立しています。

中国語などの一部の言語では、自然な手書きと標準化された手書きがまったく異なって見えます。

Natural handwriting

このようにさまざまな書体の手書きを処理することは、MyScript の認識機能にとって大きな課題となっています。

Chinese cursive_ Vision Objects_MyScript

中国語の標準化された「半続け書き」(左)と
手書きの半続け書き (右)

 

言語の特異性

認識機能では、次に示すように、さまざまな言語の特異性が考慮されます。

  • 文字:英語、ギリシャ語、キリル語など、一部の言語はアルファベットを使用しますが、中国語や日本語など、その他の言語では表意文字が使用されます。
  • 書く方向:左から右、右から左など、言語によって書く方向が変わります。


書体のバリエーション

手書き認識におけるもっとも大きな課題は、文字の傾きや形状を含め、人によって異なる書体の手書きを処理しなければならないことです。

また、手書きは国によって異なります。たとえば英語は多くの国 (英国、米国、カナダなど) で話されていますが、語彙や書体はそれぞれの国で異なることがあります。

手書きテキストの分析

複雑な言語の本質を処理するために、MyScript では次のように広範囲の言語情報が考慮されます。

  • 辞書:認識の候補を絞り込むことで精度を向上します。
  • DataFormats:特定の情報 (電話番号、電子メール アドレスなど) に予想される形式を記述します。
  • 言語モデル:認識エンジンに「言語知能」を提供します。このモデルは統計的に一般的な言語がどのように構築されるかと、一連の単語がまとめて使用される可能性を記述します。

MyScript でサポートされている言語

手書きの書体におけるバリエーションに対応するために、Vision Objects では各言語と国に対し、何千人分もの手書きのサンプルを収集しています。これらの手書きサンプルを使用して、MyScript 手書き認識エンジンの調整が行われます。

各アプリケーションに対してもっとも効率よく認識を行えるように、Vision Objects では次の 2 種類の言語リソースを提供しています。

  • MyScript Lingo: 30 言語を集めた言語パックで、自然な手書きと続け書きの認識を可能にします。また、フリーテキストを認識するために、言語モデルやDataFormatsと統合できます。MyScript Lingo はフォーム処理やメモなど、テキストの入力を必要とするあらゆるアプリケーションに理想的です。
  • MyScript Letra: MyScript Letra は 80 以上の言語リソースを提供し、孤立文字、および場合によってはブロック体の認識を可能にします。MyScript Lingo よりも高度な言語リソースや、メモリ フットプリントが少ない言語モデルを提供するものではありません。MyScript Letra は特に埋め込みデバイスに適しています。

各言語パックには、独自のユニークなリソースのセットが含まれています。これらのリソースは、認識プロセスのために MyScript Builder ソフトウェア開発キットのさまざまな部分で使用されます。