iOS/Androidの双方をサポートする日本語活字認識エンジン
ここで、前述した「レストランのメニューを撮影し、OCRでテキストデータにしたものを英語や中国語に翻訳する」海外の旅行者向けアプリケーションの実装を考えてみましょう。
ここでは、パナソニック ソリューションテクノロジーの「活字認識ライブラリー for iOS」「活字認識ライブラリー for Android」を使って、スマートフォンアプリにOCR機能を実装する様子を紹介します。
カメラで撮影しテキストデータを抽出するリファレンス実装
「活字認識ライブラリー for iOS」の体験版に収録されているサンプルプロジェクトを使って、作成できるアプリケーションのイメージをお見せします。なお、Android版にも同様のサンプルプロジェクトが収録されています。
1. sampleフォルダの「iOCRAppSample.zip」を適当なディレクトリに解凍します。解凍すると次のようなソースファイルが格納されているので、そのままのファイル構成で利用します。
iOCRAppSample
build
MCR_iPhone.build
Classes ……ソースファイルフォルダー
ocr
include ……ヘッダーフォルダー
idrcdef.h ……関数宣言ヘッダーファイル
panaidr.h ……各種定義がされているヘッダーファイル
bitmap.h ……ビットマップ定義ヘッダーファイル
bin ……ライブラリーフォルダー
libStatsiOCR.a ……ライブラリーファイル
jocr1.dic ……辞書ファイル
MCR_iOCRRecogEngine.h
MCR_iOCRRecogengine.mm
data ……ソースファイルフォルダー
help ……ソースファイルフォルダー
main ……ソースファイルフォルダー
preview ……ソースファイルフォルダー
result ……ソースファイルフォルダー
setting ……ソースファイルフォルダー
MCR_iPhoneAppDelegate.h
MCR_iPhoneAppDelegate.m
iOCRApp.png
main.m
MainWindow.xib
MCR_iPhone_Prefix.pch
MCR_iPhone-info.plist
MCR_iPHone.xcodeproj ……プロジェクトファイル
2. 別途入手したライセンスファイル「LicenseInfo.polf」を辞書ファイルと同じiOCRAppSample/Classes/ocr/binディレクトリにコピーします。
3. 「MCR_iPHone.xcodeproj」をダブルクリックしてXcodeでプロジェクトを開き、ビルドするとアプリケーションが起動します。
4. プロビジョニングの設定などを適宜行って実機に転送すると、実際にカメラ撮影による活字認識を試すことができます。例えば、次のようなフルコースのメニューをOCRで読み込んでみます。
5. iPhoneに転送したiOCRAppSampleアプリを起動し、メイン画面(下図左)の「カメラ」をクリックするとカメラが起動するので、対象を撮影します。Move and Scale画面(下図右)で対象範囲を指定して「Use」ボタンをクリックします。
6. OCR機能で活字解析が行われ、認識結果がテキストデータとして表示されます(下図)。
あとはテキスト翻訳の機能や、認識精度を上げるような工夫(後述)を適宜行えば、目的のアプリケーションが作成できることでしょう。
このように「活字認識ライブラリー」を使うと、高い精度を持つOCR機能をスマートフォンアプリに簡単に実装できます。体験版も提供されていますので、興味を持った方は後述の入手方法に従って、ぜひ一度お試しください。




