特集記事（AD）

スマホ×OCRで新しいモバイルアプリを実現しよう
～活字認識の基礎と精度向上テクニック

スムーズなデータ管理を実現するOCRの概要と、上手に利用するための10のコツ

CodeZine編集部[著]

2012/06/18 14:00

ポスト

iOS／Androidの双方をサポートする日本語活字認識エンジン

　ここで、前述した「レストランのメニューを撮影し、OCRでテキストデータにしたものを英語や中国語に翻訳する」海外の旅行者向けアプリケーションの実装を考えてみましょう。

　ここでは、パナソニックソリューションテクノロジーの「活字認識ライブラリー for iOS」「活字認識ライブラリー for Android」を使って、スマートフォンアプリにOCR機能を実装する様子を紹介します。

カメラで撮影しテキストデータを抽出するリファレンス実装

　「活字認識ライブラリー for iOS」の体験版に収録されているサンプルプロジェクトを使って、作成できるアプリケーションのイメージをお見せします。なお、Android版にも同様のサンプルプロジェクトが収録されています。

　1. sampleフォルダの「iOCRAppSample.zip」を適当なディレクトリに解凍します。解凍すると次のようなソースファイルが格納されているので、そのままのファイル構成で利用します。

サンプルプロジェクトのファイル構成

iOCRAppSample        
    build
        MCR_iPhone.build

    Classes  ……ソースファイルフォルダー
        ocr
            include  ……ヘッダーフォルダー
                idrcdef.h  ……関数宣言ヘッダーファイル
                panaidr.h  ……各種定義がされているヘッダーファイル
                bitmap.h   ……ビットマップ定義ヘッダーファイル
            bin  ……ライブラリーフォルダー
                libStatsiOCR.a  ……ライブラリーファイル
                jocr1.dic       ……辞書ファイル
            MCR_iOCRRecogEngine.h
            MCR_iOCRRecogengine.mm
        data     ……ソースファイルフォルダー
        help     ……ソースファイルフォルダー
        main     ……ソースファイルフォルダー
        preview  ……ソースファイルフォルダー
        result   ……ソースファイルフォルダー
        setting  ……ソースファイルフォルダー
        MCR_iPhoneAppDelegate.h
        MCR_iPhoneAppDelegate.m

    iOCRApp.png
    main.m
    MainWindow.xib
    MCR_iPhone_Prefix.pch
    MCR_iPhone-info.plist
    MCR_iPHone.xcodeproj  ……プロジェクトファイル

　2. 別途入手したライセンスファイル「LicenseInfo.polf」を辞書ファイルと同じiOCRAppSample/Classes/ocr/binディレクトリにコピーします。

　3. 「MCR_iPHone.xcodeproj」をダブルクリックしてXcodeでプロジェクトを開き、ビルドするとアプリケーションが起動します。

エミュレーターでの実行画面

　4. プロビジョニングの設定などを適宜行って実機に転送すると、実際にカメラ撮影による活字認識を試すことができます。例えば、次のようなフルコースのメニューをOCRで読み込んでみます。

撮影対象のメニュー

　5. iPhoneに転送したiOCRAppSampleアプリを起動し、メイン画面（下図左）の「カメラ」をクリックするとカメラが起動するので、対象を撮影します。Move and Scale画面（下図右）で対象範囲を指定して「Use」ボタンをクリックします。

メイン画面（左）、Move and Scale画面（右）

　6. OCR機能で活字解析が行われ、認識結果がテキストデータとして表示されます（下図）。

認識結果画面

　あとはテキスト翻訳の機能や、認識精度を上げるような工夫（後述）を適宜行えば、目的のアプリケーションが作成できることでしょう。

　このように「活字認識ライブラリー」を使うと、高い精度を持つOCR機能をスマートフォンアプリに簡単に実装できます。体験版も提供されていますので、興味を持った方は後述の入手方法に従って、ぜひ一度お試しください。

次のページ
OCRの認識精度を高める『10のポイント』

修正履歴: 2014/06/23 18:24 一部情報を更新。

この記事は参考になりましたか？

印刷用を表示

ポスト

特集記事連載記事一覧: 【随時更新・まとめ読み】開発者のための「AWS re:Invent 2024」関連記事

開発者のための「WWDC 2024」関連発表まとめ

LeSSやSAFeなど、大規模アジャイルにおけるソフトウェア品質の課題とは？

もっと読む

この記事の著者: CodeZine編集部（コードジンヘンシュウブ）

CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この著者の最近の執筆記事