本当に役に立つ、希少なデータサイエンティストの見つけ方:単なるデータサイエンティストではダメ
あらゆる組織がデータサイエンティストを求めているようだ。だが適切なスキルを持った適切な人材を確保するのは難しい。データ分析能力があるだけでは役に立たないのだ。
分析のテクニックは比較的単純だ。「データの中から役に立つ何かを見つけることが出発点だ」。ロンドン大学高等空間分析センターで都市数学の准教授を務めるハナ・フライ氏はそう解説する。
既存のデータセットの分析に基づいて結果を予測し、隠された意味を引き出す能力故に、データサイエンスは現代の万能薬としてもてはやされている。
上場企業の決算をGartnerが分析した結果、「データ」という単語の使用と報告された事業の成長との間に強力な相関関係が示された。生成したデータを事業の意思決定に活用できる組織ほど、成功の可能性は大きくなる。
スキル上の課題
Gartnerの定義を引用すると、データサイエンティストの役割は組織の中でデータの活用方法について共通の見解を創出することにある。そうした人材は一般的に、数学の博士号と優秀なプログラミングスキルを併せ持つ。だがそのような人材を見つけることは困難で、採用は高くつく。Gartnerの推計では、データサイエンティストの平均的な在職期間は3年程度で、平均的な経験レベルは2年程度にすぎない。
SAS Instituteのデータサイエンス責任者イアン・ブラウン氏によると、組織は高いスキルを持った数学者や統計学者、コンピュータサイエンティストをデータサイエンスのために採用する傾向がある。だがそうしたアプローチは必ずしも成功していない。「スキルの高い人材は、ビジネスニーズを理解していないことがある。データサイエンスはビジネスからスタートすべきだと私は考える」(ブラウン氏)
必要なのはビジネスの文脈だとブラウン氏は言う。データサイエンスは高コストを伴うものであり、従って価値を引き出さなければならない。「データサイエンスとビジネスを密接に連携させれば成功を収める。そうすればプロジェクトを早いペースで回すことができる」と同氏は指摘する。
しかしデータサイエンティストが2年でその分野のエキスパートになるのは難しい。
DataRobotのEMEA(Europe, the Middle East and Africa)バイスプレジデント、サイモン・ブラン氏によると、組織がデータサイエンティストのスキルを有効活用できない場合もあるという。「データサイエンティストを採用しても、適切なステークホルダーを全て結び付けるのは難しい」
保険会社のLiverpool Victoria(LV=)は1年ほど前からDataRobotを使っている。同社のデータサイエンティストチームは、オープンソースソフトウェアを使って機械学習を構築しており、コーディングスキルやさまざまなプログラミング言語の理解が要求される。LV=のデータサイエンス責任者、パーディープ・バッシ氏によると、DataRobotを使えばコーディングが不要なので、ビジネスアナリストがデータモデルの構築に協力できる。「DataRobotによって分析が民主化され、データアナリストがコーディングのできる人材に限られる必要がなくなる。これでデータモデルを構築できる人材が増える」と同氏は説明する。
バッシ氏によると、LV=は社内での育成と外部との契約の両方を通じてデータチームを結成した。「(探し求めるのは)必要なスキルを全て持った人材ではなく、学習する能力のある人材だ。従業員にはデータサイエンスフォーラムを通じてスキルを身に付け、発展させる機会を与える。これによって従業員に関心を持ってもらう。分析ツールを試してみる人物を支援するメンターフォーラムもある」と同氏は語る。
関連記事
- AIの拡大で増大するカスタムハードウェア需要
- 機械学習を加速するGPU、TPU、FPGA、ASICの競争に「x86 CPU」が参戦
- 量子コンピュータで加速する機械学習の可能性を実証
- 分析と機械学習を加速するDataOps
- DataOps実践のヒント
データサイエンス機能の集中
LV=のデータサイエンスチームは中央集中型の機能であり、その役割は機械学習や高度な分析を応用できるビジネス分野を見極めることにある。同チームはLV=の全体的なビジネス戦略に関連付けて、例えば保険金請求の手続きを向上させる方法を探るなど、ビジネスの意思決定がもっと正確に、もっと効率的にできるようにすることを目指す。問題のある分野はワークショップを通じて見極める。「ビジネス機能やその領域の専門家とワークショップを開催し、やるべきことに優先順位を付けて、それがどれだけ簡単に実装できるかを検討する」とバッシ氏は説明する。
ベンチャー構築企業のBlenheim Chalcot LTF(Blenheim Chalcot)にも、データサイエンスのノウハウを構築するための中央組織がある。Blenheim Chalcotは、マーケティングインテリジェンスプラットフォーム「Fospha」をグループ全体のトレーニング基盤として使っている。
Blenheim Chalcotが採用しているアプローチについて、CEOのケート・ニューハウス氏は「この分野のキャリアを磨く優秀なデータサイエンティストに投資して育成するために、自ら成長してもらう制度を創設した」と語る。同氏によると、Blenheim Chalcotは修士課程と博士課程を含む大卒者やアナリスト、エンジニアなどの転職者をこのプログラムに参加させ、Fosphaを通じて中央集中型のトレーニングを行う。「われわれはインペリアル・カレッジ・ロンドンと提携している。さらに労働力の多様化と複雑な問題へのアプローチを目指し、幅広い学術機関から人材を募る」とニューハウス氏は話している。
社内か社外か
データサイエンスは高コストと高い専門性を必要とするものの、どのような結果を出すかという定義は確立されていないとリドリー氏は言う。そこで、外部と契約するのとフルタイムのデータサイエンティストに投資するのとでは、どちらの方がコスト効率が高いのかという疑問が生じる。同氏は、データサイエンスに期待するものの枠組みを決めるよう助言する。「もしも短期間のみ、あるいは不定期にしか専門性が必要とされないのであれば、フルタイム従業員の採用は合理的ではない」
リドリー氏の経験では、自分たちが何を必要としているのかを理解する前に、性急に人材を集めてフルタイムのデータサイエンスチームを結成している組織も多い。「実験的な段階で、そのデータサイエンティストが自分たちのビジネスにふさわしいとなぜ分かるのか。長期的な視野を持てば、実験的なプロジェクトのためにデータサイエンス業者と契約して何ができるのか、あるいはプロジェクトがいつ特定の専門知識を必要とするのかを見極めることができる」(リドリー氏)
Gartnerによれば、データサイエンティストの採用が難しい現実の中で、組織のデータ分析戦略を支援するサービス事業者の市場が成熟しつつある。Gartnerの上級ディレクターアナリスト、ジョルゲン・ハイゼンバーグ氏は、「ベンダー各社は、例えば価値を創出するためのデータ基盤の構築など、組織を支援するサービスを増やすことを計画している」と解説する。
従来のような時間制の料金から、サービス事業者がサービスとソフトウェアを提供する資産ベースのコンサルティングへとシフトする傾向も見られるという。一部のコンサルティング会社は、組織に提供することを目的とした独自のビッグデータプラットフォームと開発基盤を構築している。「こうしたソフトウェアとサービスの融合は非常に破壊力が大きい」とハイゼンバーグ氏は言い添えた。
理解の欠如
データサイエンティストもデータ保存もコストがかさむ。組織の理解が欠如していると、データプロジェクトに投資した資金は間違った方向に流れかねない。こう指摘するのはMoneysupermarket.comの分析責任者、ハービンダー・アトウォル氏だ。「経営陣はデータのことを理解していない。データを保存してデータサイエンティストを採用する必要性は理解しているものの、それで魔法が起きると思っている」
同氏は、データサイエンス戦略をプロジェクトとして扱うよりも、製品として扱って新しいデータ製品開発のためのデータサイエンス工場を創設するよう提言する。
枝分かれ
組織がオンプレミスのITシステムを越えてクラウドベースのシステムに到達し、APIを通じてビジネスパートナーのシステムとつながる中で、その重要性は一層高まる。「Workday」のようなSaaSベースの人事システムに従業員のデータを保存することもある時代にあって、組織は「Salesforce」や「Microsoft Dynamics」、SAP製品、Oracle製品などをクラウドで使い、サプライチェーンを横断してビジネスパートナーとつながる必要がある。例えばカスタマージャーニーのようなデータの流れを理解することは、そのジャーニーが複数の外部システムやクラウドを横断する場合、複雑性が高まる。
リドリー氏は、エンタープライズアーキテクトと似たエンタープライズデータアーキテクトという役職の台頭を指摘する。この人材は、分散したデータソース全てを統括するという意味において、データエコシステム全体の専門知識と幅広い視野を持つ。
SASのブラウン氏によれば、最高データ責任者は全データソースを把握する視野を持っているかもしれないが、どんな価値が創出され、どのようにデータサイエンス担当者がそのデータソースから事業価値を引き出せるようにするかの両方について検討する必要がある。「だが残念ながら、やり方はデータサイエンティスト任せになっているのが現状だ」とブラウン氏は話している。
Copyright © ITmedia, Inc. All Rights Reserved.