企業の取得データが急増している近年では、情報を全て把握するためにもデータサイエンスツールが欠かせない。本稿では「Python」「R」「Jupyter Notebook」「Tableau」「Keras」について、データサイエンティストが愛用する理由を聞いた。
データと分析は、デジタルトランスフォーメーションやデジタルディスラプション(デジタル時代の創造的破壊)を引き起こすガソリンになる。そして、企業がこのガソリンをハイオクに変える方法は1つしかない。それは、統計学者、数学者、ビジネス分析専門家のチームに適切なデータサイエンスツールを提供し、増大し続ける企業データのプールから洞察を引き出すことだ。
純粋な統計分析、機械学習のモデリング、視覚化など、その用途が何であれ、データ駆動型のビジネス文化を発展させるには強力な一連のデータサイエンスツールが欠かせない。
さまざまな業界に身を置く多数の経験豊かなデータサイエンティストと情報交換を行い、各自が最も使用しているツールについてインタビューした。本稿では、その中で何度となく名前が挙がった上位5つの厳選されたツールを紹介する。
カスタムアルゴリズムを作成するプログラミング手法に比べて個々のソフトウェアはそれほど多くない。多くのデータサイエンティストに人気があるのは「Python」だ。データマイニング系情報サイトKDnuggetsが、2052人のユーザーを対象に最近実施した、分析とデータサイエンス用ソフトウェアの調査では、65.6%の回答者が最高評価を付けるツールとしてPythonを挙げた。
データ分析プラットフォームベンダーCindicatorでリードデータサイエンティストを務めるアレクサンダー・オスピアンコ氏は次のように語る。「データサイエンスとバックエンドの両方にPythonを使用している。そうすれば、迅速な開発と機械学習モデルの導入が可能になる。導入済みツールのセキュリティを確保する上でもPythonは非常に重要だ」
データ分析サービス企業Civis Analyticsのケイティ・マローン氏はもともと素粒子物理学者だったが、後に同社でデータサイエンスリサーチチームの共同責任者になった。ケイティ氏は「物理学者時代にお気に入りだったデータサイエンスツールのPythonをビジネスの世界でも引き続き使用している」と話す。同氏にとって特に魅力的なのは、Pythonを取り巻く強力なオープンソースエコシステムだ。多様なデータサイエンスライブラリが提供されおり、特定の分析問題を解決するのに役立っている。
「Pythonを使用してデータサイエンスの興味深い問題を解決しようとするオープンソース開発者のコミュニティーは、実に活気にあふれている」(マローン氏)
予測分析ソフトウェアベンダーWovenwareでイノベーションディレクター兼リードデータサイエンティストを務めるレスリー・デゼズス氏も同じ意見だ。同氏はPythonライブラリを非常に頼りにしている。
「オープンソース『Scrapy』などのPythonライブラリを使用している。Webスクレイピングを実行し、インターネットからデータを抽出してそれを分析用としてデータフレームにアップロードできるからだ。データ分析と行列演算にはPythonライブラリの『Pandas』と『NumPy』を使っている。どちらも素早くコードを作成するのに便利だ。NumPyでは複雑なブロードキャスト機能を実現できる」(デゼズス氏)
マーケティングや顧客分析ツールを提供するTiger Analyticsで、データサイエンスおよびイノベーション部門の責任者を務めるニランジャン・クリシュナ氏の説明によると、Pythonのユースケースは非常に多彩だという。
「Tiger AnalyticsではPythonデータサイエンスモデルの導入に成功しているが、それは消費者直結型マーケティングキャンペーンや生命保険業を最適化するのが目的だ。オンライン広告のリアルタイム入札を改善するためでもある」(クリシュナ氏)
Pythonには明確な欠点もある。Pythonがコードベースであり、使用するには高度なプログラミングスキルと分析スキルが必要になることだ。
「とはいえ『KNIME』や『Alteryx』という、メニュー方式でコードの少ない素晴らしい代替手段がある。これらはシチズンデータサイエンティストやビジネスアナリストでも使用できる」と同氏は語る。
Copyright © ITmedia, Inc. All Rights Reserved.
生成AIを活用して業務や顧客体験の再構築を進める動きが活性化しているが、その多くが、PoCやラボ環境の段階にとどまっている。なぜなら、生成AIの可能性を最大限に引き出すための、インフラのパフォーマンスが不十分だからだ。
昨今のソフトウェア開発では、AIコーディングアシスタントの活用が主流になっている。しかし、最適なコーディングアシストツールは、開発者や企業によって異なるという。導入の際は、どのようなポイントに注意すればよいのか。
生成AIの活用にはデータベースが重要となるが、従来のデータベースは最新テクノロジーに対応できないなどの課題がある。本資料では、データベースをモダナイズし、生成AIを用いてビジネスイノベーションを生み出すための方法を探る。
ビジネスにおいて、検索体験およびその結果の質の向上が重要なテーマとなっている。顧客はもちろん、自社の従業員に対しても、実用的な答えをより迅速に、手間なく入手できる環境の整備が求められている。
登場以来ビジネスへの活用方法が模索されてきた生成AI。近年では業務組み込みにおける具体的な成功例が数多く報告されている。本資料では、5件の生成AI活用事例を交えて、業務に組み込む上での具体的なアプローチを解説する。
いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。
「マーケティングオートメーション」 国内売れ筋TOP10(2025年5月)
今週は、マーケティングオートメーション(MA)ツールの売れ筋TOP10を紹介します。
「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。
「ECプラットフォーム」売れ筋TOP10(2025年4月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。