「ビッグデータ(Big Data)」とは、一般的なソフトウェアの能力を超えたサイズのデータ集合であり、従来のデータベース管理システムでは「記録」「保管」「管理」「解析」などの処理が難しいほどの巨大で複雑なデータ群。「インターネット普及」「コンピュータの処理速度」「クラウド技術向上」などに伴い、日々大量に生成され溢れている大容量デジタルデータを指す。

ビッグデータとは(その概要と、人工知能/AI、IoT、医療、観光、教育などの分野での事例)

「ビッグデータ(Big Data)」とは、一般的なソフトウェアの能力を超えたサイズのデータ集合であり、従来のデータベース管理システムでは「記録」「保管」「管理」「解析」などの処理が難しいほどの巨大で複雑なデータ群。「インターネット普及」「コンピュータの処理速度」「クラウド技術向上」などに伴い、日々大量に生成され溢れている大容量デジタルデータを指す。

概要

「ビッグデータ(Big Data)」とは、一般的なソフトウェアの能力を超えたサイズのデータ集合であり、従来のデータベース管理システムでは「記録」「保管」「管理」「解析」などの処理が難しいほどの巨大で複雑なデータ群。

「インターネット普及」「コンピュータの処理速度」「クラウド技術向上」などに伴い、日々大量に生成され溢れている大容量デジタルデータを指す。

ビッグデータとは単純に量が多いだけでなく、さまざまな「種類」「形式」「内容」が含まれる「構造化データ」や「非構造化データ(非定型的データ)」である。

「ビッグデータ」には明確な定義があるわけではなく、IT関連分野で多用されていた用語であったが、近年、一般企業でも一般的な用語として用いられはじめている。

ビッグデータの特徴

ビッグデータの特徴を示す項目として以下のものがある。

■データ量(Volume)

ビッグデータは、その名の通り、巨大なデータサイズを特徴としている。

データサイズの目安

ビッグデータとなるサイズ量については「数十テラバイトから数ペタバイト以上の範囲」という見方もある。

データ発生元

ビッグデータは以下のようにさまざまなデバイスやシステムから発生し続けている。

・ビジネストランザクション---オンラインショッピングの処理レコード
・ソーシャルメディア
・センサー類---スマートメーター
・モバイルデバイス---スマートフォン/タブレット
・RFIDタグ など

■処理速度(Velocity)

ビッグデータは大量に発生し続けているため、適切なタイミングで処理できるように、リアルタイムで処理できる必要性が高まっている。

■多様性(Variety)

ビッグデータの種類について特定の規定はなく、多くの種類や形式のデータが混在している。

そのため、企業や組織はあらゆるフォーマットのデータを取り扱える必要がある。

構造化データ

従来のデータベース(RDBMS)で管理されているような形式が確定しているデータ。

・ビジネストランザクションデータ
・ビジネスマスタデータ---顧客マスタ、製品マスタ など

非構造化データ

非構造的に記録され、形式が確定していないため、「検索」「整理」「変更」などの一括した処理が難しい。

・文字---テキスト文書、Eメール
・画像
・音声
・動画 など

■変動性(Variability)

ビッグデータはTwitterのトレンドのように「数日単位」「季節単位」「特定イベント」で、データ傾向が変動する場合がある。

■複雑性(Complexity)

ビッグデータは、数多くの複数のデータソースから収集するため複雑性が高いデータ群となる。

そのため、「データクレンジング」「データ変換」「データ相関設定」などのコストが高まる傾向にある。

活用例

データ管理技術の発展と低価格化により、ビッグデータの効率的かつ効果的活用が可能となってきている。

ビッグデータ解析により得られた知見により、社会動向や経済動向について事象分析や将来予測などさまざまな領域で活用できる可能性があるため、「新たなビジネス創造」や「新たなマーケット創出」が期待されている。

課題

ビッグデータは膨大な個人情報を含んでいるため、活用する場合において、プライバシー保護が大きな課題となっている。

 

参考元サイト

※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。

ビッグデータ最新TOPICS

【AI】AIとビッグデータが及ぼすリスクに対処する12の方法---ビジネスへの有害な影響に対抗(2020年08月19日 11:22)

ビッグデータとAIによる有害な影響に対抗するためのポイントを紹介。 ①予測システムで構築されたモデルを理解 リーダーは「予測システムで構築されたモデルは、不公平なポリシーや偏ったポリシーから導き出されたもの」であることを理解することが重要。 ②...

イベント情報

無料資料プレゼント

ポストコロナ時代にデータセンターはどう活用すべきか

講演資料を見るには、 プライバシーポリシーに同意して、送付先メールアドレスをご入力しご請求ください。

またご入力いただきました情報は、当該資料の作成・提供企業とも共有させていただき、当社及び各社のサービス、製品、セミナー、イベントなどのご案内に使用させていただきます。

本資料を見るには次の画面でアンケートに回答していただく必要があります。



セミナー講演資料公開中

Slackに添付した重要資料を、第三者にメールされても後から消す方法 ~漏洩リスク、文書移行リスクなど、Slackのリスクを解説~

脱・その場しのぎのテレワーク~今こそ考えるべき定着化を実現する仕組みとは~ 主要な仕組みのメリ/デメと共に考える、セキュリティ対策や可視化の重要性

増えるクラウドサービスの、認証統合、統合ID管理はどうすればよいのか? ~ADのクラウド化と、ADを中心とした統合認証、統合ID管理~

  • 書籍
  • OSSNEWSに広告を掲載しませんか?

facebook

twitter