Microsoftが提供する「R」とは何か、HadoopはもちろんODBCにも対応競合企業はもう使っている?

当社でもAI導入を、と考えると一般的にはまず社内のデータ分析から始める。データ分析用のさまざまな製品やアプリケーションがあるが、今回は無償で開始できるMicrosoft Rを紹介する。

2017年11月07日 09時00分 公開
[Abie ReiferTechTarget]
画像 Microsoft Rのファミリー製品を把握

 Microsoftの「Microsoft R」は、統計分析用オープンソース開発言語「R」のMicrosoftによる拡張版だ。データサイエンティスト、統計学者、大学教授が主に利用している。MicrosoftのR製品群には他に「Microsoft R Open」「Microsoft R Client」「Microsoft R Server」がある。

Microsoft R Open

 Microsoft R Open(旧Revolution R Open)は、Rの拡張版だ。Microsoft R Openには「Reproducible R Toolkit」が付属する。このツールキットによって、Rコードの実行結果が何度でも再現可能になり、同じコードを実行すれば誰でも全く同じ結果が得られる。Microsoft R Openは無償でダウンロード、使用、共有できる。

 Microsoft R Openは、Cloudera、Hortonworks、MapRを始めとする各種Hadoopのディストリビューション(オープンソースをカスタマイズしたパッケージ製品)を含む実行環境で動作する。さらに、データ分析分野の大手企業TeradataやIBMなどが提供する業務用データウェアハウス基盤や、MicrosoftやIBMが提供する計算グリッド(計算処理を広域ネットワークに分散、実行する仕組み)でも動作する。

Microsoft R Client

 Microsoft R ClientとMicrosoft R ServerはいずれもMicrosoft R Openを基に構築しており、Microsoft独自の「ScaleR」テクノロジーを利用する。これは、演算処理とデータ分析の並列化をサポートするビッグデータ分析アルゴリズムの包括的なライブラリだ。

 Microsoft R Clientは無償で使える分析ツールで、データ分析を実行しても高パフォーマンスを維持する。ユーザーはScaleRテクノロジーによる並列処理を使用してデータ分析を実行できる。ただし幾つか制限もあり、データ処理の上限はローカル端末のメモリに依存する。また複数のScaleR関数を使用する場合は2つのスレッドしか処理することができない。

Microsoft R Server

 Microsoft R ServerはMicrosoft R Openをベースに構築されており、業務利用できるレベルのパフォーマンスと拡張性を持っている。Microsoft R Openと同様にRの拡張版になる。クラスタ並列処理によってRスクリプトとComprehensive R Archive Network(CRAN)パッケージを実行することが可能だ。また、ディスクの拡張性を利用しサーバのメモリ容量を上回るデータを使った分析を実行できるようにして、Microsoft R Clientよりも活用の幅が広がる。

 Microsoft R ServerがサポートするScaleRアルゴリズムは、最適化した並列外部メモリとして動作する。外部メモリとして動作するため、メモリの制限が少なくなる。このアルゴリズムは、使用可能なRAMとストレージをまとめて管理し、結果として分析処理の拡張性を向上する。ScaleRのツールがあれば、開発者は特別な開発方法や言語を用いなくてもインフラ環境を整えるだけで並列処理を実行できる。

ODBCなどのオプションで他システムとの連携も可能

会員登録(無料)が必要です

Copyright © ITmedia, Inc. All Rights Reserved.

隴�スー騾ケツ€郢晏ク厥。郢ァ�、郢晏現�ス郢晢スシ郢昜サ」�ス

事例 株式会社サムライズ

3社の事例に学ぶ、BIツールの枠を超えたデータ分析プラットフォームの実力とは

データ活用におけるさまざまな課題を解決するBIツール。近年は、その枠を超え、さらなるデータ活用を促進するデータ分析プラットフォームへの注目度が高まっている。3社の事例を基に、同製品の魅力と実力に迫る。

製品資料 株式会社ライトウェル

チャットBIの登場でさらに便利に 新時代のBIツールでデータ活用はどう変わる?

データの可視化/分析をサポートするツールとして定評のあるBIツールだが、導入したものの活用できていない企業は意外と多い。その理由を確認するとともに、解決策として注目したい「チャットBI」の機能やメリットを詳しく解説する。

事例 プリサイスリー・ソフトウェア株式会社

SAPデータの処理時間を4分の1に短縮、ロクシタンはどうやって実現した?

SAP ERPを活用して、事業部門のデータ作成/変更を行っているロクシタンでは、マスターデータ管理の煩雑さに伴う、処理時間の長さが課題となっていた。これを解消し、SAPデータの処理時間を4分の1に短縮した方法とは?

製品資料 テンスピン・マネジメント・コンサルタンツ合同会社

クラウドとBIツールで「情報の分断」を解消、2社に学ぶ分析基盤構築事例

多くの企業で「情報の分断」や「手作業によるデータ処理への依存」が課題となり、迅速な経営判断を阻害している。本資料では、クラウドとBIツールを活用した分析基盤を構築し、これらの課題を解決した2社の事例を紹介する。

市場調査・トレンド テンスピン・マネジメント・コンサルタンツ合同会社

グローバル拠点のデータ収集に半月もかかる? データドリブン経営を阻む課題

データドリブン経営の必要性が叫ばれる今も、グローバルに拠点を展開する企業は、決算データの収集に時間がかかり、整合性をとるのも難しいなど、多くの課題を抱えている。この状況を改善するには、どのようなアプローチが有効だろうか。

アイティメディアからのお知らせ

From Informa TechTarget

「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ

「テレワークでネットが遅い」の帯域幅じゃない“真犯人”はこれだ
ネットワークの問題は「帯域幅を増やせば解決する」と考えてはいないだろうか。こうした誤解をしているIT担当者は珍しくない。ネットワークを快適に利用するために、持つべき視点とは。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...