【AI】機械学習の偏りを避ける3つの方法

Analytics News(アナリティクスニュース)

【AI】機械学習の偏りを避ける3つの方法

TOPICS 2018年11月8日 11:31

【AI】機械学習の偏りを避ける3つの方法

ビルダーやビジネスリーダーにとって、AIシステムの倫理的行動について監視するプロセスを確立することは重要とされる。

AIを構築する際のバイアスを管理する3つの鍵について解説。

①問題に対する正しい学習モデルを選択

「教師付き学習モデル」と「教師なし学習モデル」には、それぞれ長所と短所がある。

クラスタ化または次元削減を行う「教師なし学習モデル」は、データセットから偏りを知ることができる。管理されたモデルはデータ選択の偏りをよりコントロールできるが、その制御は人間の偏見がプロセスに導入されてしまう可能性がある。

特定状況に最適なモデル特定は、データサイエンティストに要求する必要がある。

②代表的なトレーニングデータセットを選択

トレーニングデータが多様であり、異なるグループを含むことを確認することは不可欠だが、実際のデータが同様にセグメント化されない限り、モデルのセグメンテーションは問題となる。

グループごとに異なるモデルを持つことはお勧めできない。1つのグループのデータが不十分な場合は、トレーニングの重要性を高めるために重み付けを使用できるが、予期せぬ新しい偏見につながる可能性があるため、これは慎重に行う必要がある。

③実データを使用してパフォーマンスを監視

アルゴリズムを構築する際には、実際のアプリケーションを可能な限りシミュレートする必要がある。

実稼働中のアルゴリズムでテストグループを使用するのは賢明ではない。代わりに、可能な限り実際のデータに対する統計的方法の実行が望ましい。

結果の平等性については簡単に証明できるが、スキルのあるデータを意図的に受け入れることも意味する。機会均等を証明することは困難だが、少なくとも道徳的には有効となる。両方のタイプの平等を保証することはしばしば実際には不可能だが、モデルの監督と現実のテストによって最良のショットが得られる状況につながる。

以上、下記URLからの要約
https://techcrunch.com/2018/11/06/3-ways-to-avoid-bias-in-machine-learning/

クリエイティブ・コモンズ・ライセンス
この作品は クリエイティブ・コモンズ 表示 - 非営利 4.0 国際 ライセンスの下に提供されています。

最新TOPICS

関連用語・タグ

家電()

  • タグ

営業()

  • タグ

重回帰分析()

  • 用語集

多変量解析のひとつであり、あるデータをほかの複数のデータによって予測する分析手法である。

NoSQL(ノーエスキューエル)

  • 用語集

「NoSQL(ノーエスキューエル)」とは、膨大なデータ量を高速かつ動的に整理し分析する、非リレーショナルな分散データベースシステムである。スケーラビリティ、可用性、耐障害性において、従来のRDB(リレーショナルデータベース)を凌駕するデータベースとしてNoSQLが、注目を集めている。

コレスポンデンス分析()

  • 用語集

「コレスポンデンス分析」(Correspondence Analysis)とは、類似した項目を明らかにするため、各項目を数値化する分析手法である。

  • KSKサイド001
  • OSSNEWSに広告を掲載しませんか?

facebook

twitter