【AI】機械学習の偏りを避ける3つの方法

Analytics News(アナリティクスニュース)

【AI】機械学習の偏りを避ける3つの方法

TOPICS 2018年11月8日 11:31

【AI】機械学習の偏りを避ける3つの方法

ビルダーやビジネスリーダーにとって、AIシステムの倫理的行動について監視するプロセスを確立することは重要とされる。

AIを構築する際のバイアスを管理する3つの鍵について解説。

①問題に対する正しい学習モデルを選択

「教師付き学習モデル」と「教師なし学習モデル」には、それぞれ長所と短所がある。

クラスタ化または次元削減を行う「教師なし学習モデル」は、データセットから偏りを知ることができる。管理されたモデルはデータ選択の偏りをよりコントロールできるが、その制御は人間の偏見がプロセスに導入されてしまう可能性がある。

特定状況に最適なモデル特定は、データサイエンティストに要求する必要がある。

②代表的なトレーニングデータセットを選択

トレーニングデータが多様であり、異なるグループを含むことを確認することは不可欠だが、実際のデータが同様にセグメント化されない限り、モデルのセグメンテーションは問題となる。

グループごとに異なるモデルを持つことはお勧めできない。1つのグループのデータが不十分な場合は、トレーニングの重要性を高めるために重み付けを使用できるが、予期せぬ新しい偏見につながる可能性があるため、これは慎重に行う必要がある。

③実データを使用してパフォーマンスを監視

アルゴリズムを構築する際には、実際のアプリケーションを可能な限りシミュレートする必要がある。

実稼働中のアルゴリズムでテストグループを使用するのは賢明ではない。代わりに、可能な限り実際のデータに対する統計的方法の実行が望ましい。

結果の平等性については簡単に証明できるが、スキルのあるデータを意図的に受け入れることも意味する。機会均等を証明することは困難だが、少なくとも道徳的には有効となる。両方のタイプの平等を保証することはしばしば実際には不可能だが、モデルの監督と現実のテストによって最良のショットが得られる状況につながる。

以上、下記URLからの要約
https://techcrunch.com/2018/11/06/3-ways-to-avoid-bias-in-machine-learning/

クリエイティブ・コモンズ・ライセンス
この作品は クリエイティブ・コモンズ 表示 - 非営利 4.0 国際 ライセンスの下に提供されています。

関連用語・タグ

通信()

  • タグ

ドローン(Drone)

  • 用語集

無人で遠隔操作や自動制御によって飛行できる航空機の総称。

Apache Spark(アパッチ スパーク)

  • 用語集

「Apache Spark(アパッチ スパーク)」は、ビッグデータを複数のマシンに分散して高速に処理できる、オープンソースの分散処理プラットフォームである。

ビッグデータ(Big Data)

ビッグデータの定義には、量的な側面と質的な側面が存在する。量的な側面としては、一般的なデータベースソフトウェアが把握し、蓄積し、運用し、分析できる能力を超えたサイズのデータを指す。全世界で1年間に発生するデータ量がゼタバイトの域に達している2015年現在は、テラバイトからペタバイトのデータ量に対してビッグデータと呼ぶ。

  • KSKサイド001
  • OSSNEWSに広告を掲載しませんか?

facebook

twitter