テキスト内のメタデータを抽出し、その結果をマッシュアップ用の素材として容易に加工・修正できる。
メタデータは11月26日、企業内のテキスト資産や膨大なフロー情報を自動で構造化し連携・活用可能にするソフトウェア「Mextractr for Mashup」を発表した。2008年12月中旬に発売する予定。
Mextractr for Mashupは、数百種類の意味属性の出現パターンチェックによって、プレーンテキストから「いつ・どこで・誰が・何を・いくら」といった5W1Hに関するメタデータ情報を抽出し、テキスト資産の活用を促進するツール。ファイルシステムやメールボックス、データベース、グループウェア、ブログ/SNSの本文テキストなど、これまで全文検索程度の再利用しか見込めなかったリソースに対し、データ統合やコンテンツのWebAPI化を実現する。イントラネット上でメタデータ抽出を行うWebサーバ「Mextractrエンジン」と、抽出結果をユーザーが編集してWebサービスに配備する「Mextractrエディタ」で構成される。
Mextractrエディタを利用することで、メタデータの一般的な表現から外れた任意の単語やフレーズ、本文中に存在しないフレーズを抽出し、その抽出結果を任意に修正・加工できる。また、WebAPIを利用したフィードの形式で出力するため、さまざまなシステムやソフトウェアとの接続も容易にできる。
同社では、従来の手作業と比べて少ない労力で意図通りにマッシュアップ用の素材として活用したり、社内外向けのWebサービスやSNS/ブログなどに情報の掲載や配備したりできるとしている。また、同社の既存製品「Mextractr個人情報フィルタ」と組み合せることで、テキストデータから抽出された個人名、住所などの個人情報を伏字にして個人情報の保護と情報共有を両立できるという。
システム要件として、OSはMicrosoft Windows XP/Server 2003以降、CPUはIntel Pentium 4(1.8GHz)以上、2Gバイト以上のRAM、20GバイトのHDD空き容量が推奨されている。初期ライセンス料金は、Mextractr for Mashupが35万円、Mextractrエディタが15万円から(いずれも最小構成の登録利用者数3人の場合)。
Copyright © ITmedia, Inc. All Rights Reserved.
「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ
ネットワークの問題は「帯域幅を増やせば解決する」と考えてはいないだろうか。こうした誤解をしているIT担当者は珍しくない。ネットワークを快適に利用するために、持つべき視点とは。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。
「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...