SQL Server 2019の新機能 Hadoop、Sparkを内包して企業の「データポータル」に?:Azure Cosmos DBもバージョンアップ
SQL Server 2019プレビュー版にHadoopとSparkが組み込まれ、「多目的データポータル」に位置付けられることになった。同時にAzure Cosmos DBもアップデートされる。
Microsoftは2018年9月「SQL Server」がリレーショナルデータ以外のさまざまなデータモデルも扱えるようになると発表した。
同社は、データ分析フレームワークの「Apache Spark」(以下、Spark)と、分散処理フレームワーク「Apache Hadoop」(以下、Hadoop)用の「Hadoop分散ファイルシステム」(HDFS)が利用可能な「SQL Server 2019」プレビュー版を、さまざまな機械学習パッケージとともにリリースした。これにより、SQL Serverを導入している多くの店舗で、SQL Serverを大規模なデータ分析のテスト環境として利用できるようになる。
SQL Server 2019プレビュー版のデータベース管理システム(DBMS)には、オープンソースのHadoopコンポーネントが含まれている。追加されるのはHDFSとSparkデータ処理エンジンだけではない。Hadoopに接続するための認証システムである「Apache Knox Gateway」、セキュリティフレームワークの「Apache Ranger」、タスク管理サービス「Apache Livy」も利用可能だ。これらの機能はSQL Server 2019の一部であるKubernetesクラスタのLinuxで使用できる。
近年、Sparkは、ビッグデータ処理の最先端を行く組織のためのツールとなっている。Sparkを使うことで、大規模な分析、データ抽出、変換、コンバージョン、機械学習などの作業ができるためだ。
併せて読みたいお薦め記事
ビッグデータ分析を始めよう
- いまさら聞けない、「ビッグデータ分析」と“普通の分析”との違いとは
- 「NoSQL」「RDBMS」を比べて分かる、ビッグデータに適したDBとは?
- Hadoopの父、カッティング氏に聞く今後のビッグデータ活用法
Windows製品によるシステム構築を学ぶ
ビッグデータ処理の問題の解決
Copyright © ITmedia, Inc. All Rights Reserved.