Facebook、IBMは「AI」の学習用データをどう作成しているのか：「AI」の学習用データ収集　その課題と解決策は【後編】

機械学習ベースのAIシステムが有益な判断を下せるようにするには、学習に利用するデータの質が重要だ。FacebookとIBMのAIシステム担当者の話から、データの質を高める方法を探る。

≫ 2019年07月26日 05時00分公開

[Kassidy Kelley，TechTarget]

併せて読みたいお薦め記事

AIの学習データについて考える

ITベンダーのAI関連事業の取り組み

　ヘーゼルウッド氏によると、Facebookは、

非構造化データを収集
AIモデルがそれらのデータを使って学習
学習済みのAIモデルを運用環境に導入

という3つの手順でAIシステムの導入に取り組んでいるという。

　最初の手順ではデータエンジニアが、機械学習用にデータをクリーニングして、自動テキスト翻訳や顔認識などの用途に合わせて最適化する必要がある。ヘーゼルウッド氏が率いるチームは、データセットの要件を絶えず変更している。なぜなら機械学習ベースのAIシステムの中核要素であるAIモデルは、継続的なトレーニングが必要な上、出力にさまざまな要件があるためだ。

　Facebookの技術者には巨大なデータのラベリング、クリーニング、最適化のための時間とリソースがある。そうではない企業が独自の機械学習ベースのAIシステムを構築しようとする場合、大きな障害に直面する。

学習を自動化するツールの登場

#CmsMembersControl .CmsMembersControlIn {width:100%;background:url(https://image.itmedia.co.jp/images/spacer.gif) #DDD;opacity:0.05;filter:progid:DXImageTransform.Microsoft.Alpha(Enabled=1,Style=0,Opacity=5);z-index:1;}

続きを閲覧するには、ブラウザの JavaScript の設定を有効にする必要があります。

TechTargetジャパントップエンタープライズAI