AI-OCRが使えないといわれるのはなぜ?契約書の読み取りが難しい理由



目次[非表示]

  1. 1.そもそもAI-OCRとは
    1. 1.1.OCRとは光学的文字認識
    2. 1.2.OCR技術にAI技術をプラスしたものがAI-OCR
  2. 2.AI-OCRのメリット
    1. 2.1.識字率が高い
    2. 2.2.定型以外の書類も読み取りできる
    3. 2.3.外部システムと連携できる
  3. 3.AI-OCRが使えないといわれる理由
    1. 3.1.識字率は100%にならない
    2. 3.2.どんな形式でも読み取れるわけではない
    3. 3.3.操作の習得に時間がかかる
    4. 3.4.既に設置済みの外部システムと連携できない
    5. 3.5.セキュリティ面に不安がある
    6. 3.6.コストが見合わない
  4. 4.契約書はAI-OCRと相性がよくない
  5. 5.まとめ


契約書を電子化して管理するために、AI-OCRの導入を考えておられる方はいらっしゃるでしょうか。AI-OCRは、契約書の読み取りに向いていないとされる側面があります。
この記事では、AI-OCRのメリットや契約書に向かないとされる理由について紹介します。


そもそもAI-OCRとは

紙文書をデジタル化する際に役立つOCR技術にAI技術を追加し、より文字認識率を高めたものがAI-OCRです。
ここではAI-OCRがどのようなものかについて、より詳しく解説します。


OCRとは光学的文字認識

OCRは、「Optical Character Recognition」または「Optical Character Reader」の略です。
日本語に訳すと「光学的文字認識」で、紙文書をスキャナで読み込む、あるいはPDFの画像データから文字情報を抽出する技術を意味します。
紙文書を自動でデジタル文書化できるため、人が手打ちで入力する手間が不要です。デジタル化にかかる人件費削減や、時間削減につながるとして重宝されてきた技術です。


OCR技術にAI技術をプラスしたものがAI-OCR

従来のOCR技術は、手書き文字の識字率が低いというデメリットがありました。例えば「待」と「侍」や、「は」「ば」「ぱ」などを区別する技術が低く、自力で文字起こしする方が早いと思われていた時期もあったほどです。
また、従来は多様な文書フォーマットにOCRが対応できないデメリットもありました。思うように全ての文章を電子化できず、使い方が限定的であったといえるでしょう。
 
この問題を、解決に近づける技術がAIです。AIの1種であるディープラーニングを採用することで、OCRの識字率が高まり多様なレイアウトの文章に対応できます。


AI-OCRのメリット

従来のOCR技術をさらによいものにするため生まれたAI-OCR技術のメリットは、大きく分けて3つあります。


識字率が高い

従来のOCRと比べ、最大の特長は識字率の高さにあります。
従来のOCRでは、手書きの識字率が10〜70%というデータがあります。一方AI-OCRは一般に識字率が97〜98%といわれており、大きく進化しているといえるでしょう。
ディープラーニングによって、手書き文字の特徴を学習したり、前後の文章から正しいと思われる文字を考えたりできます。
これにより、AI-OCRの識字率は格段に上がっているのです。


定型以外の書類も読み取りできる

正確な読み取りを従来のOCRに求めるには、1つ1つの文書フォーマットを細かく事前に設定する必要がありました。請求書や契約書、仕様書などさまざまな書類フォーマットに関して、文書ごとに細かく読み取り位置を指定したり、項目を指定したりすることで初めて正確な読み取りにつながる仕組みでした。
 
この問題は、AIによってある程度は解消できています。読み取る書類やAI-OCRの種類によっては、AIが文書レイアウトを自動で解析し文字認識が可能です。
細かい設定を行う時間が不要であり、電子化にかかる時間の短縮につながります。


外部システムと連携できる

AI-OCRは、外部システムとの連携で作業がさらに効率化されます。
AI-OCRは、読み取った情報を項目ごとに抽出でき、業務に必要な情報の選別も可能です。
 
こうした「情報の意味付け」を得意とするAI-OCRは、RPA(Robotic Process Automation)との連携で、さらに業務効率が向上します。RPAとは、人に代わってソフトウェアロボットが業務を行うことです。RPAとの連携で、パソコン作業が自動化できるようになります。つまり、紙文書からのデータ抽出・データ入力・集計・出力などの業務を全て自動化できます。


AI-OCRが使えないといわれる理由

AI-OCRにはこれまでのOCRにないメリットがある一方で、AI-OCRは使えないという意見も散見されます。
ここでは、AI-OCRのデメリットについて紹介します。


識字率は100%にならない

従来のOCRと比べてAI-OCRは識字率が格段に向上しているとはいえ、100%ではないため、不便に感じる人が多いことは事実です。
 
人の書いた癖文字や、走り書きをAI-OCRが完璧に読み取ることは理論上不可能とされています。もちろん96〜98%の識字率を持つAI-OCRは書類の電子化に役立ちますが、最終的に人間の目で確認する必要があるシステムでもあるため、完全な自動化はできない状況にあります。


どんな形式でも読み取れるわけではない

現在普及している多くのAI-OCRは、書類の形式をあらかじめ指定することで初めて正確に文章を読み込めるシステムです。
自社が発行する書類は定型化されていますが、先方から送られてくる書類の形式はさまざまです。その書類ごとに読み取る箇所を指定しなければ正確に読み取れないため不便に感じる人は多くいます。
 
AI技術の進歩によって、最近は定型化せずとも書類を正確に読み取れるAI-OCRも出てきました。導入に至る前に、読み取りたい書類の形式にどの程度ばらつきがあるのかを調べ、商品を選ぶことが大切です。


操作の習得に時間がかかる

新しいシステムを導入する際に等しく起こる問題ではありますが、操作の習得に時間がかかる点もデメリットに挙げられるでしょう。
導入初期は、手入力の方が早く感じられる場合もあります。


既に設置済みの外部システムと連携できない

AI-OCRの前処理を行うシステムの構築は作業をスムーズに進めるために欠かせないものです。また、AI-OCRで認識したデータを外部システムと連携し活用しようと考える人も多いでしょう。
しかしAI-OCRごとに対応できるシステムは異なり、既に設置している外部システムが活用できない場合もあります。そのためAI-OCRを導入する際に、新たにシステム構築が求められることもあります。
 
新たなシステム構築に費用がかさんだり、システムが構築できる人材を用意する必要が発生したりする点を不便と感じる人もいるでしょう。


セキュリティ面に不安がある

AI-OCRで読み込む書類には個人情報や機密情報が含まれているものも多く、セキュリティ対策がきちんとなされているかは重要なポイントです。
AI-OCRはオンプレミス型とクラウド型のものがあります。特にクラウド型はオンラインにつなげる性質上、情報漏洩のリスクを負います。
扱う情報の内容を考え、オンプレミス型を選んだり、プライバシー認証された商品を選択したりすることがおすすめです。


コストが見合わない

AI-OCRは、月額制のものがほとんどです。導入にかかる費用の他、毎月定額費用がかかります。電子化する書類が少ない月でも料金が変わらないため、月ごとに処理する書類の量が大きく変動する会社の場合費用が見合わないと感じることもあるでしょう。
 
処理数が少ない月にも、同じ料金を支払うことに納得できる月額料金の商品を選ぶことが重要です。


契約書はAI-OCRと相性がよくない

自社が発行する契約書ではなく、相手方が発行する契約書の管理をAI-OCRで行う場合、契約書の形式は一定でないため、読み取りの手間がかかることもあります。契約書は、その性質上内容が複雑で、AIの学習効果が期待しにくい点も相性の悪さに挙げられるでしょう。
 
AI-OCRに正確な読み取りを望むには、書類に対する深い理解とAI-OCRシステムの習熟が必要であり、社内のみでの対応は難しいのが現状です。
AI-OCRで契約書の電子化をする際には、専門知識のある外部企業に任せることがおすすめです。


まとめ

AI-OCRは従来の OCRと比べて、識字率が上がり、多様なレイアウトにも対応できる商品も開発され、便利なものになりました。
 
一方で識字率を100%とすることは実現不可能だとされており、電子化にあたっては人の目で確認する必要があります。
また、全ての商品が多様なレイアウトに対応できるわけでなく、書類をあらかじめ定型化し、読み取る情報をAI-OCRに登録しなければならない商品も多くあります。
 
このような理由から、特に契約書の管理に際してAI-OCRは相性が悪いとされ、使えないと感じる人もいるでしょう。契約書を電子化する際には、専門知識のある企業への委託がおすすめです。




おすすめの資料

人気記事ランキング

カテゴリ一覧

タグ一覧