OCRの認識精度を高める『10のポイント』
OCRの認識精度は、アプリケーションの満足度に大きく関わる部分です。
そこで、20年以上OCR製品の開発に携わっているパナソニック ソリューションテクノロジーの技術者が明かす、OCRで認識精度を上げる10のポイントと、認識速度を上げる2つのポイントを紹介します。OCRによる活字認識処理を実装する際は、ぜひ参考にしてください。
認識精度を上げるための10のポイント
- 文字色と背景色のコントラストがはっきりしているものは精度が高い
- 文字のポイント数は6~60ポイント
- 解像度は300dpiまたは400dpi
- 画像が傾いている場合は、傾き補正機能を利用する
- 画像が歪んでいる場合は、台形補正機能を利用する
- カメラで撮影した画像を認識する場合は、接写モードを利用する
- カメラで撮影した画像を認識する場合は、影の写り込みがないように撮影する
- カメラで撮影した画像を認識する場合は、画素数が300万画素以上のカメラを利用する
- 画像にゴミがある場合は、ノイズ除去機能を利用する
- 数字のみ認識したい場合などは、文字種を限定して認識させる
認識速度を上げるポイント
- 認識する用紙サイズを小さくする
- 認識する文字量を少なめに調整する
高精度OCRエンジン「カラーOCRライブラリー」製品群の特長
今回利用したパナソニック ソリューションテクノロジーの日本語活字認識エンジンは、20年以上に渡る研究成果に基づき、独自の「文字特性解析技術」や「パターンマッチング」といった複数の文字認識ロジックを搭載することで、高精度な文字認識を実現した製品です。
一番の特長は、日本語の活字認識において難易度が高い「ひらがな・カタカナ・漢字・数字・英語の混在文書」「縦書き」にも対応している点です。解像度の低い画像の認識精度にも優れており、画質が低くなりがちなスマートフォンのカメラでも、活字を認識することが可能です。また、台形補正にも対応しているため、カメラで撮影した歪んだ画像の補正も簡単に行えます。
OCRソフトウェア用開発キット「カラーOCRライブラリー」製品群としては、既にPC向けに活字認識、帳票認識(活字+手書き文字+バーコード+チェックマーク)、免許証認識、名刺認識、QRコード認識の5種類が提供されており、今回紹介した「活字認識ライブラリー for iOS」「活字認識ライブラリー for Android」は活字認識エンジンの部分をスマートフォンに対応させた製品となっています(2011年12月リリース)。
パナソニック ソリューションテクノロジーでは、開発キット以外にも、「読取革命シリーズ」を始めとするパッケージ製品、OEM製品、プリンターとのバンドル製品と、さまざまなOCR製品を提供している。
製品群の名称「カラーOCRライブラリー」についている「カラー」は、以前、白黒画像しか認識できなかったOCRで、カラーでも認識できるようにした際の名残り。カラーに対応したのは、パナソニックが初だと言われている。
製品のライセンス体系
開発キットの価格は、「活字認識ライブラリー for iOS」「活字認識ライブラリー for Android」が各55万0,000円(税抜)で、下記のスタートアップサポートが付属します。
また、成果物の配布数に応じて別途ランタイムライセンスが必要です。購入本数に応じて単価テーブルが変わるため、詳細については製品ページの「お問い合わせ」よりご相談ください。
スタートアップサポート | プレミアムサポート | |
サポート内容 | メールによるQ&Aサービス、マイナーバージョンアップ時のメディア無償提供サービス | メールによるQ&Aサービス、メジャーバージョンアップ時のメディア無償提供サービス |
サポート期間 | 3か月 | 12か月 |
希望小売価格 | 7万5,000円(税抜) | 25万0,000円(税抜) |
仕様、動作環境、関数一覧といった詳細情報は「活字認識ライブラリー for iOS」および「活字認識ライブラリー for Android」の製品ページを参照してください。
体験版の入手方法
製品ページ上には掲載されていませんが、今回紹介したサンプルプロジェクトを含む「活字認識ライブラリー for iOS」「活字認識ライブラリー for Android」の体験版も用意されています。こちらも営業担当経由の対応になりますので、製品ページの「お問い合わせ」よりご相談ください。
なお、製品の販売は法人向けに限られていますので、個人の方が体験版を入手することはできません。あらかじめご了承ください。
スマートデバイスの普及によるOCR技術の新しい可能性
前述したとおり、スマートフォンやタブレットといった、個人で所有できるモバイル端末が普及してきました。これまで、業務システムでの利用が主だったOCR技術も、今後はBtoCのスマートフォンや、BtoBのタブレットでの需要が増えてくると考えられます。
ぜひOCR技術を使って、新しいモバイル端末ならではの活用方法を模索し、新しいアプリケーションの価値を提案していただきたいと思います。