検索
ニュース

メタデータ、企業内の「眠れるテキスト資産」を有効活用できるデータ統合ツールNEWS

テキスト内のメタデータを抽出し、その結果をマッシュアップ用の素材として容易に加工・修正できる。

PC用表示 関連情報
Share
Tweet
LINE
Hatena

 メタデータは11月26日、企業内のテキスト資産や膨大なフロー情報を自動で構造化し連携・活用可能にするソフトウェア「Mextractr for Mashup」を発表した。2008年12月中旬に発売する予定。

 Mextractr for Mashupは、数百種類の意味属性の出現パターンチェックによって、プレーンテキストから「いつ・どこで・誰が・何を・いくら」といった5W1Hに関するメタデータ情報を抽出し、テキスト資産の活用を促進するツール。ファイルシステムやメールボックス、データベースグループウェア、ブログ/SNSの本文テキストなど、これまで全文検索程度の再利用しか見込めなかったリソースに対し、データ統合やコンテンツのWebAPI化を実現する。イントラネット上でメタデータ抽出を行うWebサーバ「Mextractrエンジン」と、抽出結果をユーザーが編集してWebサービスに配備する「Mextractrエディタ」で構成される。

 Mextractrエディタを利用することで、メタデータの一般的な表現から外れた任意の単語やフレーズ、本文中に存在しないフレーズを抽出し、その抽出結果を任意に修正・加工できる。また、WebAPIを利用したフィードの形式で出力するため、さまざまなシステムやソフトウェアとの接続も容易にできる。

 同社では、従来の手作業と比べて少ない労力で意図通りにマッシュアップ用の素材として活用したり、社内外向けのWebサービスやSNS/ブログなどに情報の掲載や配備したりできるとしている。また、同社の既存製品「Mextractr個人情報フィルタ」と組み合せることで、テキストデータから抽出された個人名、住所などの個人情報を伏字にして個人情報の保護と情報共有を両立できるという。

 システム要件として、OSはMicrosoft Windows XP/Server 2003以降、CPUはIntel Pentium 4(1.8GHz)以上、2Gバイト以上のRAM、20GバイトのHDD空き容量が推奨されている。初期ライセンス料金は、Mextractr for Mashupが35万円、Mextractrエディタが15万円から(いずれも最小構成の登録利用者数3人の場合)。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る