Tensorflowでなかなかディープラーニング | 第一線で活躍するオープンソースエキスパートが綴るスペシャルコラム。

Tensorflowでなかなかディープラーニング

Creative Applications of Deep Learning with TensorFlow at Kadenze 第3回目の課題

[2016年08月30日 ]

アートとテクノロジーのオンライン学習サイト「Kadenze Academy」のTensorflowでディープラーニングを学ぶコース「Creative Applications of Deep Learning with TensorFlow」第3回目の課題をやり終えました。こちらに提出したnotebookを保存してます。

今回はオートエンコーダと音声データ処理を学ぶ課題でした。まず、お馴染みのセレブ画像を用い、セレブ達の平均顔画像を表示しまして、セレブ画像をミニバッチでノーマライズして、オートエンコーダに掛けると、各セレブ画像と平均顔画像を合わせたような画像になるといった感じの処理を行いました。その後、テーマからそれますが、デコード前エンコード後の2次元のデータをプロットし、そのプロットを理想的なグリッドに最適化して画像を再配置するような感じのこともしました。2D Latent Manifoldという処理で、デコード前エンコード後の中間地点のデータとして、−1から1までの規則的な2Dグリッドを用意して、グラフのその地点からそのグリッドを適用して処理を行うと、人数分のほぼ平均顔画像が生成されることを確認しました。

続いてVariational Autoencoderという用意されていた処理をデフォルトパラメータで実行しました。20時間近く回して処理が終わらなかったので、強制終了しました。パラメータを変えて再度実行する気にはなりませんでした。20時間近い処理での最後に出力された画像がこの2枚です。1枚目Manifoldの方は、マネキンっぽい質感からよりリアルな表情になっているように思います。20時間近くかかっているので。2枚目Reconstructionの方は、最初は真っ暗な画像から、まだ不鮮明ではありますが、元の画像を再構築しています。 manifold reconstruction

続いてこの音声データで、音楽とスピーチを分類する問題で、10エポック以内に正解率97%以上を達成しないといけない条件付き課題でした。試行錯誤した結果、6エポックぐらいから97%を超え始め、Max98%も超え、なかなか上出来でした。これまでの課題の中ではかなり。

著者プロフィール

KSKアナリティクス 松尾

  • ブラジリアン柔術白帯
  • 最近イチオシpackt書籍:Large Scale Machine Learning with Python
  • 次に読みたいmanning書籍:Big Data、Spark GraphX in Action
  • 気になること:2月にプレオーダーしたpackt書籍Big Data Analytics with Spark and Hadoopが、リリース先延ばし先延ばしで半年経っても出版されない。

最新TOPICS

【IoT】NEC PC、IoTオープンイノベーションプラットフォーム「plusbenlly」のベータ版無料公開を開始---提携52社で始動、業界横断した「真結合」が必要(2017年07月21日 10:03)

NECパーソナルコンピュータは、7月19日、 IoTオープンイノベーションプラットフォーム「plusbenlly」のベータ版無料公開を開始した。 【テーマ】 ・IoTからビジネスを生み出すためには、業界横断した「真結合」が必要 ・plusbenllyは何が画期的なのか? ・個人情報の取り扱いはどうなる? ・企業をまたいだオープンイノベーションの推進は簡単ではない

関連タグ

ボット(bot)

  • 用語集

「ボット (bot) 」とは、「ロボット」の略称であり、もともと人間がコンピュータを操作して行う処理を自動的に実行するアプリケーションを指す。

電力()

  • タグ

重回帰分析()

  • 用語集

多変量解析のひとつであり、あるデータをほかの複数のデータによって予測する分析手法である。

回帰直線()

  • 用語集

「回帰直線」とは、最小二乗法によって求められる2組のデータにおける中心的な分布傾向を表す直線。

教育()

  • タグ

関連記事

  • KSKサイド004

facebook

twitter