画像認識AIが拡げるOCRの可能性

CACは、AIなどの最新のテクノロジーを活用して、社会やお客様が抱える課題を先取りして解決することを目指しています。画像認識AIはそうした課題解決のために有効な技術の1つです。

こちらでは、CACの画像認識AIとOCRの活用の取り組みについてレポートします。

活用が進む画像認識技術

画像認識は、画像内の文字や人物、物体などをコンピュータが識別する技術です。近年、ディープラーニング(深層学習)と組み合わせることで認識精度が大幅に向上し、製品の外観検査、安全運転支援、医療画像解析など様々な分野で活用が進んでいます。

画像認識技術は、対象にする画像の種類などに応じていくつかに分類できます。例えば、以下のようなものがあります。

種類 内容
物体検出 画像から任意の物体の位置や個数を検出する技術
異常検知 多くの同じ種類のデータの中から、異なる部分があるデータを検出する技術
顔認識(顔認証) カメラなどのデジタル画像から人の顔の特徴を抽出して、人を自動的に識別する技術。この技術を利用した認証方式が「顔認証」
文字認識(OCR) 紙などに書かれている文字や数字などを認識する技術

主な画像認識の種類

CACの画像認識AIの取り組み

CACでは、画像認識(以下、画像認識AI)の研究開発を積極的に進め、画像認識AIを活用したサービスの開発やお客様の課題解決への活用に取り組んでいます。

製造業向けには、在庫管理や設備管理を省力化するAIを開発したり、AIをIoTと組み合わせてスマート工場化を支援するサービスを提供したりしています。また、物流現場での異常検知AIアプリケーションを活用した作業品質改善の事例などもあります。顔認識(顔認証)については、eKYC構築支援など顔認証技術を活用した金融機関向けのセキュリティ強化支援のサービスなどを提供しているほか、自社でも社内の無人コンビニにおける顔認証決済サービスの実証実験などの取り組みを進めています。

そして、こうした画像認識AIの中でCACが注力している分野の1つが文字認識(OCR)です。

CACのOCR技術

CACはAIに関する研究開発の一環でOCRへの取り組みも進めています。OCRの開発に取り組む直接的なきっかけは、本人確認業務の改善案件でWeb入力情報と身分証記載情報(ユーザーが任意の条件で撮影した身分証の画像)との照合に既製の身分証読取りツールを試したところ、実用的な精度が得られなかったことでした。そこで、すでに蓄積していたAI関連ノウハウを活用して開発に取り組んだ結果、独自開発のOCR技術に、やはり独自開発の領域検出AIなどを組み合わせることで、高い読取精度を実現できました。

CACのOCR技術は、PDFやスキャンされた文書などでノイズがあるものや、経年劣化のある文書なども高精度での読み取りが可能です。また、手書きの文字も、癖が強くないものならば、高い精度で読み取りできます。紙以外の対象についても読み取りができ、例えば、屋外の看板やカメラなどで撮影した画像(例.レシートやモニター画面など)も読み取ります。ほかに、刻印の文字のような特殊な形態の文字については、対象の形態に特化した専用モデルを構築することで読み取りを実現します。
このOCR技術はCAC独自のもののため、特化した領域に独自にチューニングすることで対応できる点に強みがあります。

CACのOCRのイメージ:PDF読み取りの例
CACのOCRのイメージ:PDF読み取りの例
CACのOCRのイメージ:手書き文字の読み取りの例
CACのOCRのイメージ:手書き文字の読み取りの例

CACのOCRのサービス

CACは、独自OCR技術の強みを活かし、各業種向けのAI-OCRサービスを展開しています。

金融業向けAI-OCR

CACでは、高度な画像処理技術とAIを組み合わせることにより、準定型や非定型帳票も読み取りが可能な金融業向けの独自AI-OCRを提供しています。

金融機関では、レイアウトが決まっている定型帳票へのAI-OCRの導入は進んでいますが、帳票などの種類ごとにレイアウトが異なる準定型帳票や、レイアウトが全く決まっていない非定型帳票へのAI-OCRの導入は、読取精度やコストが課題となり、進んでいないのが現状です。

CACでは、こうした金融機関における非定型帳票のAI-OCR導入の課題に対して、CAC独自のOCR技術を活用し、非定型帳票専用のAIモデルと組み合わせることで、非定型帳票も高い精度で読み取るAI-OCRを提供します。これにより、金融機関での以下のような書面等を読み取る場面での活用が期待できます。

金融機関におけるAI-OCR活用のユースケース
金融機関におけるAI-OCR活用のユースケース

金融業向けAI-OCR
の詳細はこちら

製造業向けAI-OCRソリューション

製造業の現場におけるデジタル化推進ために、AI-OCRを活用したソリューションも提供しています。

このソリューションは、製造現場で使われている作業指示書や日報等の紙の文書をAI-OCRにより自動で読み取り、電子データに変換します。これまで紙で保管・参照していた情報を、電子データで蓄積・参照できるようになり、デジタルな進捗管理や過去のデータ分析、システム連携などが実現できます。

製造業におけるAI-OCR活用のイメージ
製造業におけるAI-OCR活用のイメージ

また、CAC独自のOCR技術を活用したソリューションのため、紙の文書以外の読み取りも可能です。例えば、製品や梱包の印字や刻印、ホワイトボードや壁面の文字などの読み取りや電子化も可能なため、製造業の幅広い現場でAI-OCRによるデジタル化、効率化に活用できます。

製造業向けAI-OCRソリューション
の詳細はこちら

紙帳票データ化サービスのシャインに資本参加

2023年3月、CACは、納品書、検品書類、伝票等の紙帳票をデータ化するサービス「デジパス」を提供するシャイン株式会社に資本参加しました。

シャインの「デジパス」は、書類をデータ化することにより、物流現場で発生する大量の紙帳票の業務負荷を低コストで軽減するサービスです。これにより、紙にまつわる現場業務のコスト削減を進め、物流現場だけでなく様々な中小事業所のデジタル化を促進します。

この資本参加に加えて、CACでは、自社独自開発のAI-OCRや、画像処理などの先端AI技術をシャインに提供することにより、「デジパス」のより一層のサービス向上に貢献できるものと考えています。

今後の展望

CACのOCR技術は、自社で独自に開発した技術のため、利用シーンに沿ったきめの細かいチューニングが可能です。今回ご紹介した金融業や製造業に留まらず、他の様々な業界での活用も見込め、デジタル化や効率化に貢献できる可能性があるとCACでは考えています。

CACでは今後も、様々な業界や業種において、画像認識AIを始めとした最新のテクノロジーによる社会課題の解決やビジネス革新の取り組みへの支援を進めてまいります。

一覧に戻る

関連コンテンツ