iOS/Androidの双方をサポートする日本語活字認識エンジン
ここで、前述した「レストランのメニューを撮影し、OCRでテキストデータにしたものを英語や中国語に翻訳する」海外の旅行者向けアプリケーションの実装を考えてみましょう。
ここでは、パナソニック ソリューションテクノロジーの「活字認識ライブラリー for iOS」「活字認識ライブラリー for Android」を使って、スマートフォンアプリにOCR機能を実装する様子を紹介します。
カメラで撮影しテキストデータを抽出するリファレンス実装
「活字認識ライブラリー for iOS」の体験版に収録されているサンプルプロジェクトを使って、作成できるアプリケーションのイメージをお見せします。なお、Android版にも同様のサンプルプロジェクトが収録されています。
1. sampleフォルダの「iOCRAppSample.zip」を適当なディレクトリに解凍します。解凍すると次のようなソースファイルが格納されているので、そのままのファイル構成で利用します。
iOCRAppSample build MCR_iPhone.build Classes ……ソースファイルフォルダー ocr include ……ヘッダーフォルダー idrcdef.h ……関数宣言ヘッダーファイル panaidr.h ……各種定義がされているヘッダーファイル bitmap.h ……ビットマップ定義ヘッダーファイル bin ……ライブラリーフォルダー libStatsiOCR.a ……ライブラリーファイル jocr1.dic ……辞書ファイル MCR_iOCRRecogEngine.h MCR_iOCRRecogengine.mm data ……ソースファイルフォルダー help ……ソースファイルフォルダー main ……ソースファイルフォルダー preview ……ソースファイルフォルダー result ……ソースファイルフォルダー setting ……ソースファイルフォルダー MCR_iPhoneAppDelegate.h MCR_iPhoneAppDelegate.m iOCRApp.png main.m MainWindow.xib MCR_iPhone_Prefix.pch MCR_iPhone-info.plist MCR_iPHone.xcodeproj ……プロジェクトファイル
2. 別途入手したライセンスファイル「LicenseInfo.polf」を辞書ファイルと同じiOCRAppSample/Classes/ocr/binディレクトリにコピーします。
3. 「MCR_iPHone.xcodeproj」をダブルクリックしてXcodeでプロジェクトを開き、ビルドするとアプリケーションが起動します。
4. プロビジョニングの設定などを適宜行って実機に転送すると、実際にカメラ撮影による活字認識を試すことができます。例えば、次のようなフルコースのメニューをOCRで読み込んでみます。
5. iPhoneに転送したiOCRAppSampleアプリを起動し、メイン画面(下図左)の「カメラ」をクリックするとカメラが起動するので、対象を撮影します。Move and Scale画面(下図右)で対象範囲を指定して「Use」ボタンをクリックします。
6. OCR機能で活字解析が行われ、認識結果がテキストデータとして表示されます(下図)。
あとはテキスト翻訳の機能や、認識精度を上げるような工夫(後述)を適宜行えば、目的のアプリケーションが作成できることでしょう。
このように「活字認識ライブラリー」を使うと、高い精度を持つOCR機能をスマートフォンアプリに簡単に実装できます。体験版も提供されていますので、興味を持った方は後述の入手方法に従って、ぜひ一度お試しください。