起業 事務所開設 独立の方に朗報!業務用コピー機・複合機ならコピー機.com!

東証一部上場(証券コード:9416)株式会社ビジョン

コピー機・複合機のお役立ち情報

東証一部上場(証券コード:9416)株式会社ビジョン | 会社概要

2015/01/12(月)17:47

OCR認識がうまくいかないときの対処法

カテゴリー
関連ワード

2015/01/12(月)17:47

OCR認識がうまくいかないときの対処法

カテゴリー
関連ワード

Worker-makes-the-copies-coloring-page

 

キャノンの複合機には、OCRと呼ばれる光学式文字認識の処理を行うことで、サーチャブルPDFなどのファイルを作成できる機能がついています。サーチャブルPDFとは、スキャン時に読み込んだ文書内のテキストを検索できるものです。今回は、このサーチャブルPDFなどのファイルを作成する方法をご紹介します。

そして、このOCR処理を行う際に、うまくいかなかった場合の対処法についても見てみましょう。

 

■サーチャブルPDF/XPS/OOXMLを作成する方法

読み込んだデータをテキスト検索できるサーチャブルPDFやXPS、00XMLファイルを生成する場合、まずはOCR設定を行う必要があります。設定項目としては、原稿向きの自動検知を行うかどうか、ファイル名に抽出する文字数指定があります。原稿の向きを自動検知するようにすると、原稿の向きを自動的に回転して送信するなどしてくれます。

これらの設定が済んだら、早速OCR処理を行って、ファイル生成をかけてみましょう。

 

■ファイル形式によっては正しく処理されないことも

サーチャブルPDFを作成するときに、地色や字体、文字の大きさ、文字の傾きなどによっては、OCR処理が正しく行われない場合もあるといわれています。

誤認識が行われる理由としては、一般的に属性の設定、設定範囲の誤りだと考えられています。このような場合には、OCR処理の精度が向上するレイアウト編集や属性変更の行えるソフトを使うといいでしょう。

また、認識率は、コントラストの調整やエッジを強調させること、ゴミのような孤立店を除去することなどで向上するともいわれています。

自分で読み込むデータを調整して再度OCRにかけてみるというのもいいでしょう。

 

また、サーチャブルPDF化の際の設定時には、図形と認識するレベルを調整する項目があります。この辺りを調整して再度試してみるのもいいでしょう。

 

サーチャブルPDFなどのファイルは、アナログのデータをデジタル化しても文字検索ができるので、新しい文書管理の方法としても有益です。コツを覚えてOCR認識率を高めさせられるといいですね。

気軽にカンタンお見積もり・お問い合わせ!

お見積り
お電話

業界最安値に挑戦!納得の価格でご提案!アフターサポートやメンテナンスもお任せください!

お電話でのお問い合わせ
お電話でのお問い合わせ
お見積り・お問い合わせ
  • シェア
  • ツイート
【使い方】の新規記事
コピー機ドットコムでの契約方法No.1 コピー機・複合機のリースの相場や仕組みなどを徹底解説!知らなきゃ損!?リースについて詳しく知る

お急ぎの方、まずはお問い合せください!

他社より1円でも高ければご相談を!

フリーダイヤル 0120-601-579
Copyright© 2012 Vision Inc.All Rights Reserved.