Shoeisha Technology Media

CodeZine(コードジン)

特集ページ一覧

スマホ×OCRで新しいモバイルアプリを実現しよう
~ 活字認識の基礎と精度向上テクニック

スムーズなデータ管理を実現するOCRの概要と、上手に利用するための10のコツ

  • ブックマーク
  • LINEで送る
  • このエントリーをはてなブックマークに追加
2012/06/18 14:00

目次

iOS/Androidの双方をサポートする日本語活字認識エンジン

 ここで、前述した「レストランのメニューを撮影し、OCRでテキストデータにしたものを英語や中国語に翻訳する」海外の旅行者向けアプリケーションの実装を考えてみましょう。

 ここでは、パナソニック ソリューションテクノロジーの「活字認識ライブラリー for iOS」「活字認識ライブラリー for Android」を使って、スマートフォンアプリにOCR機能を実装する様子を紹介します。

カメラで撮影しテキストデータを抽出するリファレンス実装

 「活字認識ライブラリー for iOS」の体験版に収録されているサンプルプロジェクトを使って、作成できるアプリケーションのイメージをお見せします。なお、Android版にも同様のサンプルプロジェクトが収録されています。

 1. sampleフォルダの「iOCRAppSample.zip」を適当なディレクトリに解凍します。解凍すると次のようなソースファイルが格納されているので、そのままのファイル構成で利用します。

サンプルプロジェクトのファイル構成
iOCRAppSample        
    build
        MCR_iPhone.build

    Classes  ……ソースファイルフォルダー
        ocr
            include  ……ヘッダーフォルダー
                idrcdef.h  ……関数宣言ヘッダーファイル
                panaidr.h  ……各種定義がされているヘッダーファイル
                bitmap.h   ……ビットマップ定義ヘッダーファイル
            bin  ……ライブラリーフォルダー
                libStatsiOCR.a  ……ライブラリーファイル
                jocr1.dic       ……辞書ファイル
            MCR_iOCRRecogEngine.h
            MCR_iOCRRecogengine.mm
        data     ……ソースファイルフォルダー
        help     ……ソースファイルフォルダー
        main     ……ソースファイルフォルダー
        preview  ……ソースファイルフォルダー
        result   ……ソースファイルフォルダー
        setting  ……ソースファイルフォルダー
        MCR_iPhoneAppDelegate.h
        MCR_iPhoneAppDelegate.m

    iOCRApp.png
    main.m
    MainWindow.xib
    MCR_iPhone_Prefix.pch
    MCR_iPhone-info.plist
    MCR_iPHone.xcodeproj  ……プロジェクトファイル

 2. 別途入手したライセンスファイル「LicenseInfo.polf」を辞書ファイルと同じiOCRAppSample/Classes/ocr/binディレクトリにコピーします。

 3. 「MCR_iPHone.xcodeproj」をダブルクリックしてXcodeでプロジェクトを開き、ビルドするとアプリケーションが起動します。

エミュレーターでの実行画面
エミュレーターでの実行画面

 4. プロビジョニングの設定などを適宜行って実機に転送すると、実際にカメラ撮影による活字認識を試すことができます。例えば、次のようなフルコースのメニューをOCRで読み込んでみます。

撮影対象のメニュー
撮影対象のメニュー

 5. iPhoneに転送したiOCRAppSampleアプリを起動し、メイン画面(下図左)の「カメラ」をクリックするとカメラが起動するので、対象を撮影します。Move and Scale画面(下図右)で対象範囲を指定して「Use」ボタンをクリックします。

メイン画面(左)、Move and Scale画面(右)
メイン画面(左)、Move and Scale画面(右)

 6. OCR機能で活字解析が行われ、認識結果がテキストデータとして表示されます(下図)。

認識結果画面
認識結果画面

 あとはテキスト翻訳の機能や、認識精度を上げるような工夫(後述)を適宜行えば、目的のアプリケーションが作成できることでしょう。

 このように「活字認識ライブラリー」を使うと、高い精度を持つOCR機能をスマートフォンアプリに簡単に実装できます。体験版も提供されていますので、興味を持った方は後述の入手方法に従って、ぜひ一度お試しください。


  • ブックマーク
  • LINEで送る
  • このエントリーをはてなブックマークに追加

修正履歴

  • 2014/06/23 18:24 一部情報を更新。

著者プロフィール

All contents copyright © 2005-2019 Shoeisha Co., Ltd. All rights reserved. ver.1.5