Facebook、IBMは「AI」の学習用データをどう作成しているのか「AI」の学習用データ収集 その課題と解決策は【後編】

機械学習ベースのAIシステムが有益な判断を下せるようにするには、学習に利用するデータの質が重要だ。FacebookとIBMのAIシステム担当者の話から、データの質を高める方法を探る。

2019年07月26日 05時00分 公開
[Kassidy KelleyTechTarget]
画像

 人工知能(AI)システムの誤った判断につながるバイアス。その軽減に必要なことは、機械学習の学習用データ(教師データとも)のクリーニングと、データ収集方法の見直しだ。

 前編「AIの学習用データをクリーンにするには“ゴミデータ”を排除すべし」に引き続き、O'Reilly が2019年4月に開催したAIカンファレンス「Artificial Intelligence Conference」の講演を基に、企業が学習用データを作成するときの課題と、その解決方法について説明する。

 FacebookでAIインフラ研究のシニアエンジニアリングマネジャーを務めるキム・ヘーゼルウッド氏は講演で、AIシステムの出力をプログラムの意図に合わせるために微調整するとき、同社が直面した問題について語った。

 「機械学習をあらゆるユーザーに拡大しようとする際の大きな課題の一つは、大規模なデータ活用だった」とヘーゼルウッド氏は話す。

 ヘーゼルウッド氏によると、Facebookは、

  1. 非構造化データを収集
  2. AIモデルがそれらのデータを使って学習
  3. 学習済みのAIモデルを運用環境に導入

という3つの手順でAIシステムの導入に取り組んでいるという。

 最初の手順ではデータエンジニアが、機械学習用にデータをクリーニングして、自動テキスト翻訳や顔認識などの用途に合わせて最適化する必要がある。ヘーゼルウッド氏が率いるチームは、データセットの要件を絶えず変更している。なぜなら機械学習ベースのAIシステムの中核要素であるAIモデルは、継続的なトレーニングが必要な上、出力にさまざまな要件があるためだ。

 Facebookの技術者には巨大なデータのラベリング、クリーニング、最適化のための時間とリソースがある。そうではない企業が独自の機械学習ベースのAIシステムを構築しようとする場合、大きな障害に直面する。

学習を自動化するツールの登場

会員登録(無料)が必要です

Copyright © ITmedia, Inc. All Rights Reserved.

譁ー逹€繝帙Ρ繧、繝医�繝シ繝代�

製品資料 ニュータニックス・ジャパン合同会社

AIの実装/管理を成功させる4つのポイント:データやコストの課題と解決策

AIは生産性や顧客満足度の向上などさまざまな効果をもたらすが、その導入時に、AIモデルの管理/監視、従業員のスキルギャップ、データの一貫性などの課題に悩まされる企業は多い。これらを解消するために必要な、AI戦略の進め方とは?

製品資料 ニュータニックス・ジャパン合同会社

PoC段階で30%の企業が導入を断念、生成AIプロジェクトを成功に導くためには?

企業にとって生成AIは、生産性向上や収益性増加をもたらす重要な技術だが、導入には多くの課題が存在する。PoC(概念実証)段階で約30%の企業が導入を断念するといわれる生成AIプロジェクトを成功に導くための方法を紹介する。

製品資料 日本マイクロソフト株式会社

“普通の社員”のPC活用が根底から変わる、Copilot+ PCがもたらすAI改革の姿

生成AIによって既存業務の生産性向上といった成果を上げる企業が増えている今、AIをより効果的に活用するための鍵になるといわれているのが、AI処理に特化した「Copilot+ PC」だ。AI PCが具体的にどのような変化をもたらすのかを解説する。

事例 アマゾン ウェブ サービス ジャパン 合同会社

先進的なIT企業に学ぶ、業務に必要なAIを現場で開発するための環境作りの極意

企業のDX支援などを手掛けるSpeeeでは、各チームの業務に最適化されたAIエージェントを、現場レベルで自律的に開発/活用するための環境を提供している。このようにAIとデータの活用を民主化した理由とシステム構成を解説する。

製品資料 株式会社SHIFT

AIシステムのアウトプット品質を担保するための方法とは?

ビジネスにおけるAIへの依存度が高まる一方、AIのアウトプット品質に関する懸念が広まっており、導入をためらう組織も増えている。本資料では、AIシステムの精度を高め、アウトプットの品質を担保するための具体的な方法を解説する。

アイティメディアからのお知らせ

From Informa TechTarget

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは

いまさら聞けない「仮想デスクトップ」と「VDI」の違いとは
遠隔のクライアント端末から、サーバにあるデスクトップ環境を利用できる仕組みである仮想デスクトップ(仮想PC画面)は便利だが、仕組みが複雑だ。仮想デスクトップの仕組みを基礎から確認しよう。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...