Tensorflowでなかなかディープラーニング | 第一線で活躍するオープンソースエキスパートが綴るスペシャルコラム。

Tensorflowでなかなかディープラーニング

Creative Applications of Deep Learning with TensorFlow at Kadenze 第3回目の課題

[2016年08月30日 ]

アートとテクノロジーのオンライン学習サイト「Kadenze Academy」のTensorflowでディープラーニングを学ぶコース「Creative Applications of Deep Learning with TensorFlow」第3回目の課題をやり終えました。こちらに提出したnotebookを保存してます。

今回はオートエンコーダと音声データ処理を学ぶ課題でした。まず、お馴染みのセレブ画像を用い、セレブ達の平均顔画像を表示しまして、セレブ画像をミニバッチでノーマライズして、オートエンコーダに掛けると、各セレブ画像と平均顔画像を合わせたような画像になるといった感じの処理を行いました。その後、テーマからそれますが、デコード前エンコード後の2次元のデータをプロットし、そのプロットを理想的なグリッドに最適化して画像を再配置するような感じのこともしました。2D Latent Manifoldという処理で、デコード前エンコード後の中間地点のデータとして、−1から1までの規則的な2Dグリッドを用意して、グラフのその地点からそのグリッドを適用して処理を行うと、人数分のほぼ平均顔画像が生成されることを確認しました。

続いてVariational Autoencoderという用意されていた処理をデフォルトパラメータで実行しました。20時間近く回して処理が終わらなかったので、強制終了しました。パラメータを変えて再度実行する気にはなりませんでした。20時間近い処理での最後に出力された画像がこの2枚です。1枚目Manifoldの方は、マネキンっぽい質感からよりリアルな表情になっているように思います。20時間近くかかっているので。2枚目Reconstructionの方は、最初は真っ暗な画像から、まだ不鮮明ではありますが、元の画像を再構築しています。 manifold reconstruction

続いてこの音声データで、音楽とスピーチを分類する問題で、10エポック以内に正解率97%以上を達成しないといけない条件付き課題でした。試行錯誤した結果、6エポックぐらいから97%を超え始め、Max98%も超え、なかなか上出来でした。これまでの課題の中ではかなり。

著者プロフィール

KSKアナリティクス 松尾

  • ブラジリアン柔術白帯
  • 最近イチオシpackt書籍:Large Scale Machine Learning with Python
  • 次に読みたいmanning書籍:Big Data、Spark GraphX in Action
  • 気になること:2月にプレオーダーしたpackt書籍Big Data Analytics with Spark and Hadoopが、リリース先延ばし先延ばしで半年経っても出版されない。

最新TOPICS

【IoT】IoTメガネ「JINS MEME」---かけた人の集中状態を捉え働き方改革へ(2017年01月20日 10:03)

眼鏡製造小売りのジェイアイエヌ(JINS)は、1月18日、 企業の生産性向上支援IoTソリューション「JINS MEME BUSINESS SOLUTIONS」を発表した。 センシング・アイウエア「JINS MEME(ジンズ・ミーム)」を使用する。 【JINS MEMEとは】 ・フレーム部分に「眼の動きを捉えるセンサー」「加速度センサー」を組み込んだメガネ ・「まばたき回数」「目の動...

関連タグ

ベイズ理論()

  • 用語集

18世紀のイギリスの数学者であるトーマス・ベイズによって示された条件付き確率に関して成り立つ定理に基づく理論。

営業()

  • タグ

回帰直線()

  • 用語集

「回帰直線」とは、最小二乗法によって求められる2組のデータにおける中心的な分布傾向を表す直線。

分散分析(Analysis of Variance: ANOVA)

  • 用語集

観測データにおける変動を誤差変動と各要因およびそれらの交互作用による変動に分解することによって、要因および交互作用の効果を判定する、統計的仮説検定の手法のひとつ。

ロボット(Robot)

組み込みシステムの一種。人間と同等、またはそれ以上の作業を自律的に行う装置、もしくは機械。

関連記事

  • KSKサイド002

facebook

twitter