データマイニング用主要クラウドサービスを紹介。
AWSでは、分析用データレイクを構築して分析するための統合されたサービス一式を提供している。
データレイクを使用することで、従来のデータサイロとデータウェアハウスが実現できない方法を利用可能となり、異なるタイプのデータを組み合わせることで、より深い洞察を得られる。
AWSではデータの「移動」「保存」「分析」のための包括的な一連のサービスを提供している。
データレイクを構築する場合、オンプレミスからAWSクラウドにデータを移動することが必要となるケースがある。
AWSではクラウドにデータを転送するための幅広いオプションを提供しており、簡単かつ柔軟なデータ転送を実現できる。
データレイクはエクサバイト規模まで対応でき、あらゆるタイプのデータを安全に保存できる。
データレイクでの分析の方法として、幅広い分析サービスが提供されている。
各分析サービスは、さまざまな分析ユースケース専用に構築されている。
・インタラクティブ分析
・リアルタイム分析
・運用分析
・ダッシュボード構築
・ビッグデータ分析---HadoopおよびSpark
・データウェアハウジング など
AWSでは、予測分析ユースケースのために「機械学習の広範なサービスセット」と「AWSデータレイクで使用できる各種ツール」を提供している。
「Azure Databricks」は、コラボレーション対応のApache Sparkベースの分析サービス。
あらゆるデータから分析情報を引き出してAIソリューションを構築し、セットアップされたApache Spark環境のインタラクティブワークスペースで共有プロジェクトの共同作業を実施できる。
Azure Databricksでは最新バージョンのApache Sparkが提供されており、豊富なオープンソースライブラリとのシームレス統合を可能としている。
共有プロジェクトにおいて、ワークスペースおよびノートブックを利用して、効率的な共同作業を実施できる。
統合された「Azure Machine Learning service」を使用することで、高度で自動化された機械学習機能を利用できる。
Cloud Datalabは、Google Cloudが提供するデータ分析サービス。
データに対する「探索機能」「分析機能」「変換機能」「可視化機能」を利用でき、機械学習モデルも構築できる。
Cloud Datalabは、「BigQuery」「Cloud Storage」「Python」などを利用して、インタラクティブにデータを処理し分析情報を引き出せる。
「Google Chart」や「matplotlib」を利用してデータをわかりやすく可視化できる。
Cloud Datalabは、データの大小に左右されずにテラバイト規模までのデータを処理できるため、大規模データに対する「クエリ」「ローカル分析」「トレーニングジョブ」などを実施できる。
「TensorFlow」や「Cloud Machine Learning Engine」を使用することで、機械学習モデルの「構築」「評価」「最適化」を実施でき、データから機械学習モデルを構築できる。
データ分析でビジネス課題をどのように解決できるか、業界・ケース別にニーズの高いものを例に紹介します。
Analytics News ACCESS RANKING