米Microsoftも魅了した「R」強化版、「Revolution R」の実力とは?:「Revolution R」の機能を解説
オープンソースの統計用ソフトウェア「R」を強化した「Revolution R」。その開発元である米Revolution Analyticsを米Microsoftが買収するなど、注目の同製品を解剖する。
米Microsoftの完全子会社である米Revolution Analyticsは、統計用ソフトウェア「Revolution R」を開発している。Revolution Rは、統計用のオープンソースソフトウェア(OSS)である「R」のエンタープライズ版で、データサイエンティスト、統計学者、大学教授によって使用されている。
Revolution Analyticsは、「Revolution R Open」「Revolution R Enterprise」という2つの製品を展開している。前者はオープンソースだが、後者は商用だ。
併せて読みたいお薦め記事
データサイエンティストに支持される「R」
機械学習が変えるデータ分析
Revolution Rとは何か
Revolution R OpenはRの拡張版であり、ハイパフォーマンスのR言語(R用のプログラミング原語)エンジンを搭載する。また同梱されている「Reproducible R Toolkit」というツールキットにより、R言語のソースコードの実行結果が何度でも再現可能になり、他の人でも同じソースコードを実行すると全く同じ結果が得られるようになる。Revolution R Openは、無償でダウンロードできる。
Revolution R EnterpriseもRの拡張版だ。ハイパフォーマンスのニーズに従って拡張することが可能で、クラスタ並列処理によってR言語のソースコードを実行できる。また米Cloudera、米Hortonworks、米MapRを始め、OSSの分散処理基板「Apache Hadoop」ベースの各種製品と連係して動作する。さらに、米Teradataや米IBMなどのエンタープライズ用データウェアハウスでも動作する。
またRevolution R Enterpriseは、Revolution Analyticsの分析アルゴリズムライブラリ「ScaleR」を利用する。このライブラリは、演算処理とデータ分析の並列化を可能にするビッグデータ分析アルゴリズムの包括的なライブラリだ。ScaleRがあれば、開発者は特別な開発方法や言語を用いなくても並列処理を実行できる。Revolution R Enterpriseでは、データ準備、記述統計関数、データの可視化、機械学習などの機能を利用可能だ。
ScaleRのアルゴリズムは、「並列外部メモリアルゴリズム」というアルゴリズムとして実装され、メモリの制限が緩和される。並列外部メモリアルゴリズムは、使用可能なRAMとストレージをまとめて管理し、分析処理の拡張性を向上させる。さらにScaleRには、Open Database Connectivity(ODBC)ドライバーやその他のコネクタ機能が含まれている。そのため、Hadoopの分散ファイルシステム「Hadoop Distributed File System(HDFS)」やIBMの統計ソフトウェア「IBM SPSS」など、多数のシステムとの連係が可能だ。
Revolution R Openは3.2.2、Revolution R Enterpriseは7.4.1で確認しましたが最新版だ。Revolution R Enterpriseバージョン7の特筆すべき強化点は次の通りである。
- ScaleRによってHadoop内処理が可能になり、Clouderaの「CDH3」「CDH4」、Hortonworksの「HDP 1.3」といったHadoopディストリビューションのサポートが追加
- 新しいビッグデータ分析手法を複数導入
- 米Alteryxのデータブレインディング製品「Alteryx」との連係(R以外のプログラムがRevolution R Enterpriseの機能へアクセス可能に)
Revolution R Openは「GNU General Public License v2.0」の下でOSSとしてのダウンロードと使用が認められている。Microsoftの「Windows」や米Appleの「OS X」、幾つかのバージョンの「Linux」で実行可能だ。
Revolution R Enterpriseにはワークステーション版(Revolution R Enterprise Workstation)とサーバ版(Revolution R Enterprise Server)がある。ワークステーション版には2つのエディションが存在する。最大4基のコアを搭載する1台のデスクトップPCまたはノートPCで使用する場合は「Entry Edition」、最大8基のコアに対応しているのが「Power Edition」だ。またサーバ版には「Premium」「Premium Plus」の2つのエディションがある。Premiumにはシステム連携機能「DeployR」以外のサーバモジュールが、Premium PlusにはDeployRを含めた全サーバモジュールが含まれる。
Revolution R Enterpriseは、Revolution Analyticsから直接、またはリセラーパートナーなどから購入可能だ。Enterprise版の現行価格についてはRevolution Analyticsに確認されたい。一部の教育機関や非営利団体のメンバーには、無償または割引価格で提供される場合がある。
Revolutions Rのサポートは、同社のサービス「AdviseR」で提供される。AdviseRでは、コンサルティングサービス、トレーニング、技術サポートを受けることができる。技術サポートサービスは、無償のRevolution R Openを含め、全エディションで購入可能だ。また、Revolution R Enterprise Premium Plusなど、特定のエディションでは、製品ライセンスにサポートが含まれている。
Copyright © ITmedia, Inc. All Rights Reserved.