OCR(文字認識)の?基本的な仕組みと導入メリット
OCRとは、紙に印刷された文字や手書き文字、画像に書かれた文字をデジタル化し、パソコンなどのデバイスで使えるテキストデータに変換する技術です。
文字を手入力でデータ化する手間を省けるため、業務効率化や電子化・ペーパーレス化にも効果的なOCRは、企業にとって様々なメリットがあります。
今回は、OCRの基本的な仕組みと導入メリットを解説します。OCRの導入を検討中の場合は、参考にしてください。
OCR
OCR(Optical Character RecognitionまたはReader)は、「光学的文字認識」技術のことです。
その仕組みは、紙に印刷された文字などを、コンピュータがカメラやスキャナで読み取り、認識・解析して電子データ化します。読みにくい手書きの文字でも解析可能です。
パソコンなどの画面上で文字を扱えるようになります。他のシステムでの利用やデータベースへの保存が可能になるなど、様々なシーンでの活用が可能です。
OCRがないと、例えば、スキャナで読み取った書類をPDF化しても、画像として保存されているため、文字の編集や検索ができません。紙に書かれた内容を人が手で打ち込んでテキストにする作業は、時間と手間がかかってしまいます。
OCRを導入すると、このような仕事上の課題を解決でき、企業や組織は様々なメリットを受けられます。そのため、紙上の文字をパソコンで使えるようにしたいという需要は多いです。テレワークの増加やペーパーレス化の推進もあり、OCRは今後も必要度の高い技術になるでしょう。
OCRの歴史
OCRの歴史を、始まりから現在まで、順に紹介します。
年代 | できごと |
---|---|
1900年頃 | 文字認識技術の開発が世界で本格的にスタートしました。 |
1920年頃 | 数字・アルファベットを認識するOCRの特許が海外で出願されました。 |
1968年 | 手書きの郵便番号を読み取る処理を東芝が実現しました。初の一般向けOCRは、日立の製品でした。 |
1978年 | 世界初、マイクロプロセッサ制御機能のOCRを富士通が製造し、ソフトウェア化がスタートします。 |
1988年 | 自由フォーマットの手書き文字を読み取れるようになり、文書の種類を問わず様々な書類の読み取りが可能になりました。 |
1989年 | 世界初、漢字の住所を認識する東芝のOCRが製品化されました。 |
1991年 | カラー処理が可能になり、技術はさらに発展していきます。 |
1998年 | デスクスタンド型OCRが登場し、パソコンの普及とともに、銀行窓口など様々な場面で使われるようになります。 |
2010年頃 | スマートフォンやタブレットとの連動、スマートフォンでの撮影画像をそのまま処理できる機能など、小型のOCR端末が普及し始めます。 |
2020年~ 現在 | 高速インターネットが普及し、オンラインでOCRを使えるようになりました。 また、AI(人工知能)を組み合わせたAI-OCRが登場し、より高精度な手書き文字や非定型文書の読み取りが可能になりました。 |
このように、OCRは約120年以上もの昔から技術が発展し、インターネット時代に適用する現在の形になったのです。
OCRの基本的な仕組み
OCRは、次のようなメカニズムを経て、紙の文字をパソコンなどで扱えるデジタルの文字コードに変換します。取り込みからデータ化まで、順番に説明します。
【画像の取り込み】
まずは、紙に書かれた文字を画像データ化するため、カメラやスキャナを使って紙上の文字を画像として取り込みます。
画像内の文字がある位置を解析してブロックを決め、読み取る範囲を手動、または高精度のOCRでは自動で検出します。
【画像のレイアウト解析】
文書には、図表入りの資料や書き込み欄の大きさが様々な書類、見出しやブロック分けのある雑誌・新聞など、文字が均一に配置されていないものもあります。
そのため、これらを読み取るために、構成を検出し、文字と画像を分けます。次に、文字の配置を解析し、文字として認識する箇所を判別します。
【文字の認識】
文字の箇所を判別できたら、その文字群を1行ごとに分解し、さらに1文字ずつ分解して、文字の特徴を抽出します。
この特徴を、データベースにある規定の文字型と比べてマッチングし、どの文字なのかを認識します。
【文字の訂正】
認識した文字が合っているかを判断するため、AIによる前後文脈の確認・判断や、辞書データとの照合を行います。
規定の文字型と比べるとき、似ている文字(例:「入」「人」など)は誤認識されることがあります。そのため、間違っていた場合は訂正し、文字を確定します。
この訂正の性能は、年々上がり続けています。最新の高性能製品を使うと、誤認識が少なく、データ化後の目視での確認に時間を取られません。
【フォーマット出力】
確定した文字を、パソコンなどで使えるデジタルの文字コードとしてデジタルファイルに出力し、電子化が完了です。
多くのOCR製品は、WordやExcel、CSV、PDF、テキストなど、様々な形式に対応しています。元の書類の見た目と同じようにできる製品もあります。
OCRの導入メリット
OCRは、あらゆる業界の企業や組織にとって大きな導入効果があります。主に、次の4つのメリットがあります。自社に今ある課題と照らし合わせてみてください。
【データ入力の時間短縮】
紙面の文字を人間が目で確認しながら1つずつ手入力する作業は、多くの時間がかかってしまい非効率です。
この文字認識・入力の作業をOCRが行うことで、業務時間を削減できます。確認漏れや疲労によるミスも防止できるでしょう。扱う書類の量が多いほど、メリットは大きくなります。
さらに、RPA(Robotic Process Automation)と組み合わせることで、読み取った情報を自動で他のシステムへの送信が可能です。例えば、経理システムへの自動入力など、業務を効率的に行うことができます。
【データの検索性の向上】
文字が書かれた書類をスキャナで取り込んでも、画像化されただけなので、内容を検索することはできません。
そこで、OCRでテキストデータ化すると、パソコンなどのデバイスで必要な内容を、様々な条件も組み合わせてすぐに検索できるようになります。そのため、書類を見るためだけに出社し、1つずつ内容を探す必要はありません。
欲しい内容がすぐ手に入れば、その後の業務もスムーズに進めることができます。
【データの共有・活用が容易になる】
スキャナで書類を画像化するだけでは、閲覧しかできず、共有や活用がしにくいです。
OCRでテキストデータにすることで、内容の編集やコピー&ペーストができるようになります。データを一元管理し、様々な情報を場所やデバイスを問わず扱えるため、業務効率が上がります。
例えば、顧客からもらった資料や名刺をチーム内で共有すれば、提案資料の作成や営業に活用できます。書類の情報をデータ化し、Webツールで分析できれば課題解決につながる可能性があるなど、OCRは業務全般で役立ちます。
【業務コストの削減】
OCRで電子化・ペーパーレス化を実現すると、手入力でのデータ化にかかっていた人件費や残業代、外注代、また書類の印刷や郵送にかかる費用などを削減できます。
また、削減した時間は他の仕事にあてられるため、生産性が向上。さらに、浮いた費用は新たな事業や設備などの予算に回すことができ、将来的に企業の成長にもつながる可能性があります。
OCRが注目される理由
次々と進む技術や働き方の変化の中で、OCRは次の3つの点で注目を集めています。
【テレワークの普及】
働き方改革や新型コロナウイルス流行の影響により、OCR導入を検討する企業が増えました。アドビ株式会社が行った調査「テレワーク勤務のメリットや課題に関する調査結果」によると、テレワークの課題の1位は「会社にある紙の書類を確認できない」となっています。
この結果からわかるように、まだまだ紙のデジタル化は進んでいません。テレワークを効果的に行うには、ペーパーレス化や情報共有のしやすさが重要なので、OCRの導入が注目されています。
【AI技術の発展】
AIの技術が進み、従来のOCRにAIを組み合わせたAI-OCRが登場し、認識率99%など精度が上がったことで、さらなる業務効率化につながると注目されています。
AI-OCRでは、大量の文字データを機械学習し、より高精度な技術を実現しました。
●今まで認識率が低かった手書き文字の認識
●テンプレートの自動判別
●複雑なテーブルの読み取り
●帳票の自動仕分け
AI-OCRには上記のような便利機能もあり、事務処理の時間短縮に期待がされています。
【RPAツールの普及】
RPAとは、定形作業を自動化するツールです。RPAとOCRを組み合わせて使うと、さらなる自動化につながります。
例えば、OCRでテキストデータ化した内容を、経理や顧客管理といったシステムに自動で入力できます。OCRによるデータ化は、その先の様々な業務にも好影響を与えるというわけです。
まとめ
OCR(文字認識)の基本的な仕組みと導入メリットについて紹介しました。
請求書や納品書など、紙の書類が使われる場面はまだまだ多いです。一方、テレワーク普及の波は止まらず、OCRへの注目度は益々高まっていくでしょう。