テキスト内のメタデータを抽出し、その結果をマッシュアップ用の素材として容易に加工・修正できる。
メタデータは11月26日、企業内のテキスト資産や膨大なフロー情報を自動で構造化し連携・活用可能にするソフトウェア「Mextractr for Mashup」を発表した。2008年12月中旬に発売する予定。
Mextractr for Mashupは、数百種類の意味属性の出現パターンチェックによって、プレーンテキストから「いつ・どこで・誰が・何を・いくら」といった5W1Hに関するメタデータ情報を抽出し、テキスト資産の活用を促進するツール。ファイルシステムやメールボックス、データベース、グループウェア、ブログ/SNSの本文テキストなど、これまで全文検索程度の再利用しか見込めなかったリソースに対し、データ統合やコンテンツのWebAPI化を実現する。イントラネット上でメタデータ抽出を行うWebサーバ「Mextractrエンジン」と、抽出結果をユーザーが編集してWebサービスに配備する「Mextractrエディタ」で構成される。
Mextractrエディタを利用することで、メタデータの一般的な表現から外れた任意の単語やフレーズ、本文中に存在しないフレーズを抽出し、その抽出結果を任意に修正・加工できる。また、WebAPIを利用したフィードの形式で出力するため、さまざまなシステムやソフトウェアとの接続も容易にできる。
同社では、従来の手作業と比べて少ない労力で意図通りにマッシュアップ用の素材として活用したり、社内外向けのWebサービスやSNS/ブログなどに情報の掲載や配備したりできるとしている。また、同社の既存製品「Mextractr個人情報フィルタ」と組み合せることで、テキストデータから抽出された個人名、住所などの個人情報を伏字にして個人情報の保護と情報共有を両立できるという。
システム要件として、OSはMicrosoft Windows XP/Server 2003以降、CPUはIntel Pentium 4(1.8GHz)以上、2Gバイト以上のRAM、20GバイトのHDD空き容量が推奨されている。初期ライセンス料金は、Mextractr for Mashupが35万円、Mextractrエディタが15万円から(いずれも最小構成の登録利用者数3人の場合)。
Copyright © ITmedia, Inc. All Rights Reserved.
トランプ氏圧勝で気になる「TikTok禁止法」の行方
米大統領選で共和党のトランプ前大統領が勝利した。これにより、TikTokの米国での将来は...
インバウンド消費を左右する在日中国人の影響力
アライドアーキテクツは、独自に構築した在日中国人コミュニティーを対象に、在日中国人...
SEOは総合格闘技である――「SEOおたく」が語る普遍のマインド
SEOの最新情報を発信する「SEOおたく」の中の人として知られる著者が、SEO担当者が持つべ...