2016年12月26日
オープンソース活用研究所 所長 寺田雄一
ディープラーニングの一歩先を行くデータ解析手法として注目されている手法に、データの集合をトポロジーと呼ばれる幾何を使って解析する、位相的データ解析(TDA::Topological data analysis:トポロジカル・データ・アナリシス) がある。
ディープラーニングは、膨大なビッグデータから物体概念や音声や画像を自動的・自律的に獲得できる可能性をもった手法である。それに対して位相的データ解析は、人間が脳や五感で得た周囲や身体感覚の情報を、数学の一領域であるトポロジー(位相幾何学)の知見から応えるアプローチである。
人間の脳は、当たり前のように低次元のデータ対象から、高次元で、広域的なデータ構造体を形成する能力を持つ。
位相的データ解析が解明しようと取り組んでいるのは、たとえば、人間が 眼球(網膜)で得た2次元の視覚情報データから3次元の空間構造認識を形成する際に、「どのようにして低次元のデータ構造で表現される対象(物)から、高次元のデータ構造体を獲得するのか」といった問題である。
位相的データ解析では、データの集合をトポロジーと呼ばれる「柔らかい」幾何を用いて解析する。同様に幾何学を扱っていても、情報幾何学では微分幾何という「硬い」幾何学を用いているのとは対照的だ。位相的データ解析では、「柔らかい」幾何が高次元データを形成する。
Googleが機械学習システムTensorFlowをオープンソース化し、IBMも自社の機械学習コードSystemMLをオープンソース化した。また、Facebookは人工知能ソフトウェアを動かす強力なサーバーを無料開放している。このように大手IT企業は、ディープラーニングを自社製品に組み込むために巨額の投資をしている。これらの企業に共通しているのは、ソフトウェアフレームワークとライブラリを開放して業界全体の進化を目指している点だ。一方、スタートアップがもたらす新たな成果によって、人工知能は数年前には解決できなかった複雑な問題も解決できるようになっている。そんななか、シリコンバレーを拠点にビッグデータマッピング技術を提供するAyasdiが、位相的データ解析分野で100億円近い資金調達したことは、話題を集めた。
位相的データ解析は、画像認識、データ・マイニング や コンピュータ・ビジョン(CV)の分野での応用を念頭においた新しい研究領域として、今後、ますます注目が集まっていくことが期待されている。
1993年、株式会社野村総合研究所(NRI)入社。 インフラ系エンジニア、ITアーキテクトとして、証券会社基幹系システム、証券オンライントレードシステム、損保代理店システム、大手流通業基幹系システムなど、大規模システムのアーキテクチャ設計、基盤構築に従事。 2003年、NRI社内に、オープンソースの専門組織の設立を企画、10月に日本初となるオープンソース・ソリューションセンター設立。 2006年、社内ベンチャー制度にて、オープンソース・ワンストップサービス「OpenStandia(オープンスタンディア)」事業を開始。オープンソースを活用した、企業情報ポータル、情報分析、シングルサインオン、統合ID管理、ドキュメント管理、統合業務システム(ERP)などの事業を次々と展開。 オープンソースビジネス推進協議会(OBCI),OpenAMコンソーシアムなどの業界団体も設立。同会の理事、会長や、NPO法人日本ADempiereの理事などを歴任。 2013年、NRIを退社し、株式会社オープンソース活用研究所を設立。
2022-07-28(木)15:00 - 16:00 「【サービス事業者向け】中小企業が狙われた、サプライチェーン攻撃の手口を解説 ~サイバー攻撃の被害に遭う中小企業の3つの共通点と、その対策~」 と題したウェビナーが開催されました。 皆様のご参加、誠にありがとうございました。 当日の資料は以下から無料でご覧いただけます。 ご興味のある企業さま、ぜひご覧ください。
「サポートベクターマシン(SVM:Support Vector Machine)」は、 画像・音声などの情報データから、意味を持つ対象を選別して取り出すパターン認識手法のひとつ。
「主成分分析」とは、ビッグデータをはじめとした多変量データを統合し新たな総合指標を作り出し、多くの変数にウェイトをつけて少数の合成変数を作る統計手法である。ビッグデータ分析の現場などにおいて、多変量の情報をできるだけ損なわずに低次元空間に縮約する。多変量データを二次元や三次元データに縮約することで、データ全体の視覚化が可能となり、データのもつ情報を解釈しやすくなる。
Web サイトやオンライン・ショップにおける訪問者のアクセス・ログである。Web サイトやオンライン・ショップにアクセスした訪問者が、どのような順番に従ってWebサイト内を移動したのかという一連の履歴がわかる。来訪者はリンクをクリックしてサイト内を移動するため、「クリックの流れ」とも呼ばれる。
「NoSQL(ノーエスキューエル)」とは、膨大なデータ量を高速かつ動的に整理し分析する、非リレーショナルな分散データベースシステムである。スケーラビリティ、可用性、耐障害性において、従来のRDB(リレーショナルデータベース)を凌駕するデータベースとしてNoSQLが、注目を集めている。
Analytics News ACCESS RANKING