さくら情報システム、生成AIとAI OCRで 非定型文書のデータ化を実現する「AI TextSifta」を 2024年6月から提供開始
さくら情報システム株式会社(本社:東京都港区、代表取締役社長:伊延 充正、以下:さくら情報システム)は、生成AIとAI OCRを組合せた新たなデータ化サービス「AI TextSifta」(エー・アイ・テキストシフタ)を2024年6月より提供開始することをお知らせします。
■サービス提供の背景
企業がDXを進める上で課題の一つとなる「アナログ情報のデジタル化」を解決するために、各種紙資料の電子化と並行しAI OCRの利用がビジネスの場面に広がっています。
一方、既存のAI OCRが得意とする日本語の請求書や領収書だけでなく、業務固有の特殊なレイアウトの帳票やPDF、写真などからテキストを抽出する作業もさまざまなビジネスシーンで求められています。
当社はこれらの需要に着目し、急速に進化するGPT(生成AI)を活用し、プロンプトを駆使することで速やかにデータ化を行う当サービスを開発しました。(特許出願中)
生成AI+AI OCRソリューション「AI TextSifta」
サービス詳細: https://www.sakura-is.co.jp/solution/ps-000-158.html
■サービスの特長
「AI TextSifta」は従来のAI OCRで必要とされた事前学習モデルや設定作業を不要とし、以下4つの特長を備えています。これにより業務で使用するデータの抽出効率を飛躍的に向上させます。
1. 生成AIの自然言語処理能力を活用し、文書全体の文字認識の結果から情報を特定。データ化すべき項目名はプロンプトで指示され、生成AIは「請求金額合計」「合計金額」といった異なる項目名でも同じ意味をもつ値として抽出することが可能。
2. これまで国内では対応が難しかった英字の請求書や各種画像イメージなどの取扱いも可能。
3. 生成AIの力で、単純なテキスト抽出の他、簡単な計算や文章の要約も可能。
4. 複雑な複数のフォーマットに対し一つのプロンプトで対応できない場合、事前にプロンプト(1)でグループ分けを行い、別のプロンプト(2-1、2-2)でグループに合った指示を行うことが可能。
注:ポスト処理については、2024年度後半リリース予定
■参考価格(一般的な請求書を用いた場合)
<日本語請求書の場合>
1ページ 20円~
<英字請求書の場合>
1ページ 30円~
注:
・特殊な帳票の場合は、サンプルイメージを数点お預かりし、検証後にお見積り
・本契約後のプロンプトのチューニングは有償
■お試しサイト
URL: https://portal.ai-textsifta.com/
(2024年6月時点)パソコンから利用可能です。利用の際には認証が必要なため、スマートフォンに認証アプリ※をインストールしてください。
※認証アプリ例:Microsoft Authenticator
https://www.microsoft.com/ja-jp/security/mobile-authenticator-app
■さくら情報システムについて
<会社概要>
商号 : さくら情報システム株式会社
(オージス総研・三井住友銀行のグループ企業)
本社 : 東京都港区白金1-17-3 NBFプラチナタワー
設立 : 1972年11月29日
URL : https://www.sakura-is.co.jp
業務内容: 三井住友銀行およびグループ会社の基幹システムを支え、幅広いお客様にハイレベルなサービスを提供してまいりました。豊かな経験から培ったノウハウ、技術、信頼を基に、会計・人事給与・金融・BPO・セキュリティ・システム運用の強みを軸に、今後もお客様の課題解決をトータルにサポートしていきます。
※ 本リリースに記載されている製品名、会社名は各社の商標または登録商標です。
- カテゴリ:
- サービス
記事掲載数No.1!「@Press(アットプレス)」は2001年に開設されたプレスリリース配信サービスです。専任スタッフのサポート&充実したSNS拡散機能により、効果的な情報発信をサポートします。(運営:ソーシャルワイヤー株式会社)