メタデータ、企業内の「眠れるテキスト資産」を有効活用できるデータ統合ツールNEWS

テキスト内のメタデータを抽出し、その結果をマッシュアップ用の素材として容易に加工・修正できる。

2008年11月27日 09時00分 公開
[TechTargetジャパン]

 メタデータは11月26日、企業内のテキスト資産や膨大なフロー情報を自動で構造化し連携・活用可能にするソフトウェア「Mextractr for Mashup」を発表した。2008年12月中旬に発売する予定。

 Mextractr for Mashupは、数百種類の意味属性の出現パターンチェックによって、プレーンテキストから「いつ・どこで・誰が・何を・いくら」といった5W1Hに関するメタデータ情報を抽出し、テキスト資産の活用を促進するツール。ファイルシステムやメールボックス、データベースグループウェア、ブログ/SNSの本文テキストなど、これまで全文検索程度の再利用しか見込めなかったリソースに対し、データ統合やコンテンツのWebAPI化を実現する。イントラネット上でメタデータ抽出を行うWebサーバ「Mextractrエンジン」と、抽出結果をユーザーが編集してWebサービスに配備する「Mextractrエディタ」で構成される。

 Mextractrエディタを利用することで、メタデータの一般的な表現から外れた任意の単語やフレーズ、本文中に存在しないフレーズを抽出し、その抽出結果を任意に修正・加工できる。また、WebAPIを利用したフィードの形式で出力するため、さまざまなシステムやソフトウェアとの接続も容易にできる。

 同社では、従来の手作業と比べて少ない労力で意図通りにマッシュアップ用の素材として活用したり、社内外向けのWebサービスやSNS/ブログなどに情報の掲載や配備したりできるとしている。また、同社の既存製品「Mextractr個人情報フィルタ」と組み合せることで、テキストデータから抽出された個人名、住所などの個人情報を伏字にして個人情報の保護と情報共有を両立できるという。

 システム要件として、OSはMicrosoft Windows XP/Server 2003以降、CPUはIntel Pentium 4(1.8GHz)以上、2Gバイト以上のRAM、20GバイトのHDD空き容量が推奨されている。初期ライセンス料金は、Mextractr for Mashupが35万円、Mextractrエディタが15万円から(いずれも最小構成の登録利用者数3人の場合)。

ITmedia マーケティング新着記事

news150.jpg

「AI」「遺伝子組み換え食品」「グリーンエネルギー」 イノベーションへの信頼度は?
PR会社Edelmanが実施した「信頼」に関する年次消費者意識調査の結果について紹介します。

news074.jpg

IBMが「巨大金魚鉢」で警告 生成AIがマーケターにもたらすリスクとは?
IBMが、ラスベガスの球体型アリーナ「Sphere」を、奇妙な魚が泳ぐ金魚鉢に変えた。テクノ...

news062.jpg

広告業界の平均年収上昇率ランキングトップ10
国内540万社の企業情報を網羅した日本最大級のデータベース「SalesNow DB」が、上場企業...