SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

特集記事(AD)

スマホ×OCRで新しいモバイルアプリを実現しよう
~ 活字認識の基礎と精度向上テクニック

スムーズなデータ管理を実現するOCRの概要と、上手に利用するための10のコツ

  • X ポスト
  • このエントリーをはてなブックマークに追加

iOS/Androidの双方をサポートする日本語活字認識エンジン

 ここで、前述した「レストランのメニューを撮影し、OCRでテキストデータにしたものを英語や中国語に翻訳する」海外の旅行者向けアプリケーションの実装を考えてみましょう。

 ここでは、パナソニック ソリューションテクノロジーの「活字認識ライブラリー for iOS」「活字認識ライブラリー for Android」を使って、スマートフォンアプリにOCR機能を実装する様子を紹介します。

カメラで撮影しテキストデータを抽出するリファレンス実装

 「活字認識ライブラリー for iOS」の体験版に収録されているサンプルプロジェクトを使って、作成できるアプリケーションのイメージをお見せします。なお、Android版にも同様のサンプルプロジェクトが収録されています。

 1. sampleフォルダの「iOCRAppSample.zip」を適当なディレクトリに解凍します。解凍すると次のようなソースファイルが格納されているので、そのままのファイル構成で利用します。

サンプルプロジェクトのファイル構成
iOCRAppSample        
    build
        MCR_iPhone.build

    Classes  ……ソースファイルフォルダー
        ocr
            include  ……ヘッダーフォルダー
                idrcdef.h  ……関数宣言ヘッダーファイル
                panaidr.h  ……各種定義がされているヘッダーファイル
                bitmap.h   ……ビットマップ定義ヘッダーファイル
            bin  ……ライブラリーフォルダー
                libStatsiOCR.a  ……ライブラリーファイル
                jocr1.dic       ……辞書ファイル
            MCR_iOCRRecogEngine.h
            MCR_iOCRRecogengine.mm
        data     ……ソースファイルフォルダー
        help     ……ソースファイルフォルダー
        main     ……ソースファイルフォルダー
        preview  ……ソースファイルフォルダー
        result   ……ソースファイルフォルダー
        setting  ……ソースファイルフォルダー
        MCR_iPhoneAppDelegate.h
        MCR_iPhoneAppDelegate.m

    iOCRApp.png
    main.m
    MainWindow.xib
    MCR_iPhone_Prefix.pch
    MCR_iPhone-info.plist
    MCR_iPHone.xcodeproj  ……プロジェクトファイル

 2. 別途入手したライセンスファイル「LicenseInfo.polf」を辞書ファイルと同じiOCRAppSample/Classes/ocr/binディレクトリにコピーします。

 3. 「MCR_iPHone.xcodeproj」をダブルクリックしてXcodeでプロジェクトを開き、ビルドするとアプリケーションが起動します。

エミュレーターでの実行画面
エミュレーターでの実行画面

 4. プロビジョニングの設定などを適宜行って実機に転送すると、実際にカメラ撮影による活字認識を試すことができます。例えば、次のようなフルコースのメニューをOCRで読み込んでみます。

撮影対象のメニュー
撮影対象のメニュー

 5. iPhoneに転送したiOCRAppSampleアプリを起動し、メイン画面(下図左)の「カメラ」をクリックするとカメラが起動するので、対象を撮影します。Move and Scale画面(下図右)で対象範囲を指定して「Use」ボタンをクリックします。

メイン画面(左)、Move and Scale画面(右)
メイン画面(左)、Move and Scale画面(右)

 6. OCR機能で活字解析が行われ、認識結果がテキストデータとして表示されます(下図)。

認識結果画面
認識結果画面

 あとはテキスト翻訳の機能や、認識精度を上げるような工夫(後述)を適宜行えば、目的のアプリケーションが作成できることでしょう。

 このように「活字認識ライブラリー」を使うと、高い精度を持つOCR機能をスマートフォンアプリに簡単に実装できます。体験版も提供されていますので、興味を持った方は後述の入手方法に従って、ぜひ一度お試しください。

次のページ
OCRの認識精度を高める『10のポイント』

修正履歴

この記事は参考になりましたか?

  • X ポスト
  • このエントリーをはてなブックマークに追加
特集記事連載記事一覧

もっと読む

この記事の著者

CodeZine編集部(コードジンヘンシュウブ)

CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社

この記事は参考になりましたか?

この記事をシェア

  • X ポスト
  • このエントリーをはてなブックマークに追加
CodeZine(コードジン)
https://codezine.jp/article/detail/6607 2014/06/23 18:24

おすすめ

アクセスランキング

アクセスランキング

イベント

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング