Shoeisha Technology Media

CodeZine(コードジン)

特集ページ一覧

スマホ×OCRで新しいモバイルアプリを実現しよう
~ 活字認識の基礎と精度向上テクニック

スムーズなデータ管理を実現するOCRの概要と、上手に利用するための10のコツ

  • ブックマーク
  • LINEで送る
  • このエントリーをはてなブックマークに追加
2012/06/18 14:00

目次

OCRの認識精度を高める『10のポイント』

 OCRの認識精度は、アプリケーションの満足度に大きく関わる部分です。 

 そこで、20年以上OCR製品の開発に携わっているパナソニック ソリューションテクノロジーの技術者が明かす、OCRで認識精度を上げる10のポイントと、認識速度を上げる2つのポイントを紹介します。OCRによる活字認識処理を実装する際は、ぜひ参考にしてください。

認識精度を上げるための10のポイント

  • 文字色と背景色のコントラストがはっきりしているものは精度が高い
  • 文字のポイント数は6~60ポイント
  • 解像度は300dpiまたは400dpi
  • 画像が傾いている場合は、傾き補正機能を利用する
  • 画像が歪んでいる場合は、台形補正機能を利用する
  • カメラで撮影した画像を認識する場合は、接写モードを利用する
  • カメラで撮影した画像を認識する場合は、影の写り込みがないように撮影する
  • カメラで撮影した画像を認識する場合は、画素数が300万画素以上のカメラを利用する
  • 画像にゴミがある場合は、ノイズ除去機能を利用する
  • 数字のみ認識したい場合などは、文字種を限定して認識させる

認識速度を上げるポイント

  • 認識する用紙サイズを小さくする
  • 認識する文字量を少なめに調整する

高精度OCRエンジン「カラーOCRライブラリー」製品群の特長

 今回利用したパナソニック ソリューションテクノロジーの日本語活字認識エンジンは、20年以上に渡る研究成果に基づき、独自の「文字特性解析技術」や「パターンマッチング」といった複数の文字認識ロジックを搭載することで、高精度な文字認識を実現した製品です。

 一番の特長は、日本語の活字認識において難易度が高い「ひらがな・カタカナ・漢字・数字・英語の混在文書」「縦書き」にも対応している点です。解像度の低い画像の認識精度にも優れており、画質が低くなりがちなスマートフォンのカメラでも、活字を認識することが可能です。また、台形補正にも対応しているため、カメラで撮影した歪んだ画像の補正も簡単に行えます。

 OCRソフトウェア用開発キット「カラーOCRライブラリー」製品群としては、既にPC向けに活字認識、帳票認識(活字+手書き文字+バーコード+チェックマーク)、免許証認識、名刺認識、QRコード認識の5種類が提供されており、今回紹介した「活字認識ライブラリー for iOS」「活字認識ライブラリー for Android」は活字認識エンジンの部分をスマートフォンに対応させた製品となっています(2011年12月リリース)。

開発キット以外の製品

 パナソニック ソリューションテクノロジーでは、開発キット以外にも、「読取革命シリーズ」を始めとするパッケージ製品、OEM製品、プリンターとのバンドル製品と、さまざまなOCR製品を提供している。

カラーOCR

 製品群の名称「カラーOCRライブラリー」についている「カラー」は、以前、白黒画像しか認識できなかったOCRで、カラーでも認識できるようにした際の名残り。カラーに対応したのは、パナソニックが初だと言われている。

製品のライセンス体系

 開発キットの価格は、「活字認識ライブラリー for iOS」「活字認識ライブラリー for Android」が各55万0,000円(税抜)で、下記のスタートアップサポートが付属します。

 また、成果物の配布数に応じて別途ランタイムライセンスが必要です。購入本数に応じて単価テーブルが変わるため、詳細については製品ページの「お問い合わせ」よりご相談ください。

2つの保守サービス
  スタートアップサポート プレミアムサポート
サポート内容 メールによるQ&Aサービス、マイナーバージョンアップ時のメディア無償提供サービス メールによるQ&Aサービス、メジャーバージョンアップ時のメディア無償提供サービス
サポート期間 3か月 12か月
希望小売価格 7万5,000円(税抜) 25万0,000円(税抜)

 仕様、動作環境、関数一覧といった詳細情報は「活字認識ライブラリー for iOS」および「活字認識ライブラリー for Android」の製品ページを参照してください。

体験版の入手方法

 製品ページ上には掲載されていませんが、今回紹介したサンプルプロジェクトを含む「活字認識ライブラリー for iOS」「活字認識ライブラリー for Android」の体験版も用意されています。こちらも営業担当経由の対応になりますので、製品ページの「お問い合わせ」よりご相談ください。

 なお、製品の販売は法人向けに限られていますので、個人の方が体験版を入手することはできません。あらかじめご了承ください。

スマートデバイスの普及によるOCR技術の新しい可能性

 前述したとおり、スマートフォンやタブレットといった、個人で所有できるモバイル端末が普及してきました。これまで、業務システムでの利用が主だったOCR技術も、今後はBtoCのスマートフォンや、BtoBのタブレットでの需要が増えてくると考えられます。

 ぜひOCR技術を使って、新しいモバイル端末ならではの活用方法を模索し、新しいアプリケーションの価値を提案していただきたいと思います。

  • ブックマーク
  • LINEで送る
  • このエントリーをはてなブックマークに追加

修正履歴

  • 2014/06/23 18:24 一部情報を更新。

著者プロフィール

All contents copyright © 2005-2019 Shoeisha Co., Ltd. All rights reserved. ver.1.5