データの「偏見」を可視化するPythonライブラリの真の価値とは何かバイアスを排除することの重要性

機械学習に使うデータに年齢や人種、性別に関わるバイアスが含まれていると、AIは誤った推論を出力する。FairLensはこれらのバイアスを可視化し、公平性に寄与する。それによって得られる真の恩恵とは?

2021年12月02日 08時00分 公開
[Adrian BridgwaterComputer Weekly]

 データのバイアス(偏り、偏見)に対する保険が必要だ。特にAIにデータを提供する機械学習には欠かせない。機械学習の誤差は、データ内のある要素が他の要素よりも高く重み付けされ、非常に強く現れる場合に発生する。

 英国のスタートアップ企業SynthesizedのDataOpsプラットフォームは、データにあるバイアスを見つける手段を提供する。このバイアスが軽減されれば、例えば保険の見積もり、賠償請求、保険の掛け金が公平になる可能性がある。

オープンソースのPythonライブラリ

iStock.com/designer491

 Synthesizedはデータのバイアスを識別および計測するオープンソースのPythonライブラリ「FairLens」を発表した。

 Synthesizedのデニス・ボロビコフ氏(共同創設者でCTO:最高技術責任者)は、データサイエンスモデルの多くのデータには年齢や人種、性別などのバイアスがあると話す。

 「FairLensはデータのバイアスを見つけて可視化する数学的なフレームワークだ。FairLensによってデータをより深く理解することで、分析やデータサイエンスのタスクでそのデータを公平かつ倫理的に使えるようになることを願っている」(ボロビコフ氏)

 データのバイアスは多くの企業や業界にとって依然タブーになっている。FairLensはデータのバイアスを舞台裏で検出し、それを軽減する。

データ駆動の弊害

 自動車保険、健康保険、生命保険などの保険契約アプリケーションは、データに基づいて意思決定している。そのデータの品質が低かったりバイアスがあったりするとアプリケーションは本質的に偏るため、意図した目的を達成できない。

 データを点検することで、これまで過小評価されて十分なサービスを受けることができなかった顧客が公平な結果と権利を確保できるとSynthesizedは考えている。

 これは規制違反のリスクを大幅に削減し、企業ブランドを守るのに役立つ可能性もある。

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

From Informa TechTarget

なぜクラウド全盛の今「メインフレーム」が再び脚光を浴びるのか

なぜクラウド全盛の今「メインフレーム」が再び脚光を浴びるのか
メインフレームを支える人材の高齢化が進み、企業の基幹IT運用に大きなリスクが迫っている。一方で、メインフレームは再評価の時を迎えている。

ITmedia マーケティング新着記事

news017.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2025年5月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。

news027.png

「ECプラットフォーム」売れ筋TOP10(2025年5月)
今週は、ECプラットフォーム製品(ECサイト構築ツール)の国内売れ筋TOP10を紹介します。

news023.png

「パーソナライゼーション」&「A/Bテスト」ツール売れ筋TOP5(2025年5月)
今週は、パーソナライゼーション製品と「A/Bテスト」ツールの国内売れ筋各TOP5を紹介し...