Azure Databricks(アジュールデータブリックス)は、Azureプラットフォームに最適化された「Apache Sparkベース」の分析プラットフォーム。
Azure Databricksは、Apache Sparkをベースとする分析サービス。
「高速」「使いやすい」「コラボレーション性」などの特徴があり、ビッグデータ分析ソリューションやAIソリューションを構築できる。
Azure Databricksは、コラボレーション対応可能な統合環境を提供し、「Sparkでのデータ探査」「プロトタイプ作成」「データドリブンアプリケーション実行プロセス構築」などを行える。
規模を問わずさまざまなデータを集約することで、「分析ベース」「分析ダッシュボード」「運用レポート」などを作成できる。
Azure Databricksアーキテクチャを利用すると、規模を問わずあらゆるデータを結合し、カスタム機械学習モデルを構築できる。
「各種ストリーミングソース」や「Webサイトクリックストリームログ」などから継続的にデータを取得して、ほぼリアルタイムの分析情報を得られる。
→Azure →Azure Databricks →Azure Databricks の価格
Azure Databricksは、オープンソースのApache Sparkテクノロジーをベースとしている。
Apache Spark創始者たちと共に設計されたもので、Azureに最適化統合している。
Azure Databricksは、クラスタを起動し、Apache Spark環境をすばやく組み込む。
クラスタは、高信頼性とハイパフォーマンスを維持するように、自動的に「設定」「構成」「微調整」が行われる。
Azure Databricksには、Spark機能として次のコンポーネントが含まれている。
・構造化データ処理「Spark SQL」+「DataFrame」
・リアルタイム処理「Streaming」
・マシンラーニングライブラリ「MLib」
・グラフ計算「GraphX」
・言語サポート「Spark Core API」
Azure Databricksでは、分析プロジェクトや機械学習プロジェクトを簡単に自動スケーリングできる。
Azure Databricksでは、言語やディープラーニングフレームワークを自由に選択して機械学習ソリューションを構築できる。
・Python
・Scala
・R言語
・SQL言語 など
・TensorFlow
・Keras
・XGBoost
・Pytorch
・Scikit-learn など
Azure Databricksは、エンタープライズレベルのセキュリティを提供する。
「シングルサインオン(Azure Active Directory統合)」と「ロールベースアクセス制御」により、詳細なユーザー権限設定を行える。
Azure Databricksは、Azureのデータベースやデータストアと深いレベルで統合できる。
・Azure SQL Data Warehouse
・Azure Cosmos DB
・Azure Data Lake Storage
・Azure Event Hubs
・Azure Data Factory
・Blob Storage など
参考元サイト
Analytics News ACCESS RANKING