有限責任監査法人トーマツとデロイト トーマツ リスクサービスは2018年11月8日、見積書や請求書などの帳票内の文字をデータ化する光学文字認識(OCR)サービス「AI-OCRソリューション」を提供開始した。同社が開発した人工知能(AI)モデル「Deep ICR」に過去の帳票を学習させることで、従来のOCRソフトウェアに必要だった事前の帳票設計を不要にしたことが特徴だ。
AI-OCRソリューションは帳票に印刷された文字(活字)を読み取り、帳票の転記、集計、整理を自動化する。PDF形式の見積書の画像から文字データを抽出し、TSV形式でファイルに出力するなどの使い方が可能。企業や自治体の財務・経理部門が使う会計システムへの入力処理業務や、工場における修理保守の見積書類処理での利用を想定している。
Deep ICRは中核技術として、機械学習の一つであるディープラーニング(深層学習)を採用。帳票の読み取り不備や、それに対する人の修正内容を教師データとして学習し、帳票の識字能力を向上できるという。トーマツのリスクアドバイザリー事業本部で新規事業推進シニアマネージャーを務めるシェイク・シャハリアルホサイン氏は「請求書に書かれた住所など、書類によってレイアウトの違う文字列も認識して出力できる」と説明する。
動画の重要性 「増している」が85% 動画コンテンツの内製化率は前年比倍増――アライドアーキテクツ調査
アライドアーキテクツが「企業のDX推進における動画活用の実態調査 2021」を実施。デジタ...
これもアマゾンエフェクト? 米国で激減するあの人名の話
マーケターの頭の片隅を刺激するトピックをインフォグラフィックスで紹介。
電通「2020年 日本の広告費」 総広告費は大幅減でもインターネット広告費は成長を維持
2020年の日本の総広告費は6兆1594億円で前年比88.8%。東日本大震災があった2011年以来9...