2008年11月27日 09時00分 公開
ニュース

メタデータ、企業内の「眠れるテキスト資産」を有効活用できるデータ統合ツールNEWS

テキスト内のメタデータを抽出し、その結果をマッシュアップ用の素材として容易に加工・修正できる。

[TechTargetジャパン]

 メタデータは11月26日、企業内のテキスト資産や膨大なフロー情報を自動で構造化し連携・活用可能にするソフトウェア「Mextractr for Mashup」を発表した。2008年12月中旬に発売する予定。

 Mextractr for Mashupは、数百種類の意味属性の出現パターンチェックによって、プレーンテキストから「いつ・どこで・誰が・何を・いくら」といった5W1Hに関するメタデータ情報を抽出し、テキスト資産の活用を促進するツール。ファイルシステムやメールボックス、データベースグループウェア、ブログ/SNSの本文テキストなど、これまで全文検索程度の再利用しか見込めなかったリソースに対し、データ統合やコンテンツのWebAPI化を実現する。イントラネット上でメタデータ抽出を行うWebサーバ「Mextractrエンジン」と、抽出結果をユーザーが編集してWebサービスに配備する「Mextractrエディタ」で構成される。

 Mextractrエディタを利用することで、メタデータの一般的な表現から外れた任意の単語やフレーズ、本文中に存在しないフレーズを抽出し、その抽出結果を任意に修正・加工できる。また、WebAPIを利用したフィードの形式で出力するため、さまざまなシステムやソフトウェアとの接続も容易にできる。

 同社では、従来の手作業と比べて少ない労力で意図通りにマッシュアップ用の素材として活用したり、社内外向けのWebサービスやSNS/ブログなどに情報の掲載や配備したりできるとしている。また、同社の既存製品「Mextractr個人情報フィルタ」と組み合せることで、テキストデータから抽出された個人名、住所などの個人情報を伏字にして個人情報の保護と情報共有を両立できるという。

 システム要件として、OSはMicrosoft Windows XP/Server 2003以降、CPUはIntel Pentium 4(1.8GHz)以上、2Gバイト以上のRAM、20GバイトのHDD空き容量が推奨されている。初期ライセンス料金は、Mextractr for Mashupが35万円、Mextractrエディタが15万円から(いずれも最小構成の登録利用者数3人の場合)。

ITmedia マーケティング新着記事

news154.jpg

孫消費急減、女性のLINE利用増――ソニー生命「シニアの生活意識調査2020」
毎年恒例の「シニアの生活意識調査」。2020年のシニアの傾向はどうなっているでしょう。

news137.jpg

米大統領選を巡る「アプリ対決」のゆくえ 「Trump 2020」 vs. 「Vote Joe」と「TikTok」 vs. 「Triller」
米国では2020年月の大統領選挙を前に選挙戦がますます活発化しています。関連するアプリ...

news143.jpg

店舗の滞在時間が減少、「20分未満」が約1.5倍に――凸版印刷とONE COMPATHが5万人買い物調査
電子チラシ「Shufoo!」を利用する全国の男女5万人を対象に実施した買い物に関する意識調...