さまざまなデータソースからデータを統合して、意思決定に必要となる情報を得るためのシステムプロセスとビジネスプロセスの組み合わせ。

  • データ・インテグレーション(Data Integration)とは

データ・インテグレーション(Data Integration)とは

さまざまなデータソースからデータを統合して、意思決定に必要となる情報を得るためのシステムプロセスとビジネスプロセスの組み合わせ。

■「データ・インテグレーション(データ統合)」とは
データ・インテグレーション(データ統合)」とは、「さまざまなデータソースからデータを統合して、意思決定に必要となる情報を得るためのシステムプロセスとビジネスプロセスの組み合わせ」を意味する。

■「データ・インテグレーション(データ統合)」が必要となる背景
企業の社内システムにおいて、必要となるデータは各システム(基幹系/分析系/部門系など)に、異なるデータフォーマットで、分散して保管されている現状がある。
これらの資産データを有効活用するためには、さまざまなデータソースを横断的に集約/統合し、「データウェアハウス」に格納する必要がある。

■「データウェアハウス」とは
データウェアハウスは、社内のさまざまなシステムに蓄積されているデータを集約して格納するための一種のデータベースである。
一定間隔でさまざまなデータソースからデータを収集し、データウェアハウス内に長期保存するのが一般的な利用方法である。
集約されたデータウェアハウス内のデータは、BIなどの情報分析に利用される。

■「ETL」とは
「ETL」とは、「分散して存在する大量データを1つにまとめるための一連のデータ処理」を意味する。
「Extract(抽出)」+「Transform(変換/加工)」+「Loading(格納)」の3つの頭文字を取ったワードである。
「ETL」はデータウェアハウス構築時に行われる処理において主要な役割を担う。

■「データ・インテグレーション(データ統合)」の主なプロセス

1.「データアセスメント(評価)」
実際の生のデータを確認し、対象データソースの内容/構造/品質などについて明確化を行う。
データ状態把握、データ品質の統計的検証、除外データの特定、品質目標設定などを行い、データ分析レポートを作成する。

2.「データクレンジング」
データ分析レポートをふまえ、よりビジネス精度の高いデータに変換するために、データ整合性補正、不要/重複データ削除などを行う。

3.「ETL(抽出・変換・ロード)」
ETLツールを使用して、対象データソースから必要となるデータのみをデータウェアハウス集約する。

■「意味的データ統合」とは
「意味的データ統合(セマンティックデータ統合)」とは、異なるフォーマットで管理されているデータ群を意味的に接合することにより、データ・インテグレーション(データ統合)を行う方法。
「情報の意味」や「関連性」を用いて接合していく手法であるため、従来のコンピュータプログラムだけでは実現は難しいとされている。メタデータや辞書などの標準化/登録/配布サービスが整備されつつある。

■データの仮想統合
データウェアハウスにデータを集約しないデータ・インテグレーション(データ統合)として「仮想統合(レプリケーション統合)」がある。
複数あるデータソースを接続して「仮想的データウェアハウス」を作成する手法である。
「仮想統合」の場合は、見かけ上統合されているデータ集合を作成する。データウェアハウスを作成する必要がないため、低コスト/短期間で構築できるメリットがある。

データ・インテグレーション(データ統合)のユースケース
データ移行、パフォーマンス向上、レポーティング、分析、DWH、アーカイブ など

https://ja.wikipedia.org/wiki/%E3%83%87%E3%83%BC%E3%82%BF%E7%A7%BB%E8%A1%8C
https://enterprisezine.jp/dbonline/detail/9128
http://dev.classmethod.jp/etc/di_division_expansion_now/
http://d.hatena.ne.jp/keyword/%B0%D5%CC%A3%C5%AA%A5%C7%A1%BC%A5%BF%C5%FD%B9%E7
http://enterprisezine.jp/dbonline/detail/4535
http://bdm.change-jp.com/?p=3150
https://www.ibm.com/analytics/jp/ja/technology/data-integration/
http://www.metro.co.jp/solution/information/etl/
http://www.landscape.co.jp/staff-blog/consulting/2780.html
https://www.dell.com/ja-jp/work/learn/big-data-data-integration
http://www.keyman.or.jp/at/30002663/

データ・インテグレーション最新TOPICS

最新情報はありません。

データ・インテグレーション最新CLOSEUPコラム

イベント情報

無料資料プレゼント

Amazon Redshiftは企業に利益をもたらしているのか?8社を対象にしたIDCの調査レポート

講演資料を見るには、 プライバシーポリシーに同意して、送付先メールアドレスをご入力しご請求ください。

またご入力いただきました情報は、当該資料の作成・提供企業とも共有させていただき、当社及び各社のサービス、製品、セミナー、イベントなどのご案内に使用させていただきます。

本資料を見るには次の画面でアンケートに回答していただく必要があります。



  • 20171130-netapp サイド
  • OSSNEWSに広告を掲載しませんか?

facebook

twitter