CLOSE UP コラム | いまいち分からない、ビッグデータの定義。

いまいち分からない、ビッグデータの定義。

CLOSE UP 事例

2017年03月27日
オープンソース活用研究所 所長 寺田雄一

「ビッグデータ」という言葉自体はすっかりビジネスの現場に浸透したが、実は、その定義はあいまいのままだ。世界のデータの90%は過去2年間で生成されたとも言われ、これまでの常識を超えたビッグデータは、その定義も想定外にある。現状では、ビッグデータの基本とも言われるVolume(量が多い)、Variety(多様である)、Velocity(スピードが速い)を兼ね備えた、いわば、未知なるデータの世界に対する総称を「ビッグデータ」と呼んでいる印象が強い。いまこの瞬間も加速度的に増え続けるビッグデータの定義について、本稿では、さまざまな側面から考察する。

総務省によるビッグデータの定義は「事業に役立つ知見」

総務省による2012年度版「情報通信白書」では、ビッグデータを「事業に役立つ知見を導き出すためのデータ」としている。しかしこの説明では、指し示す対象が広すぎて定義と呼ぶにはほど遠い。

なぜ「ビッグデータ」を定義づけることが難しいのか? 「ビッグデータビジネスの時代」(翔泳社)など、ビッグデータ関連の著作がある野村総合研究所 ICT/メディア産業コンサルティング部の鈴木良介氏によると、ビッグデータという言葉は「明確な定義をする必要性が薄い」のだと言う。

鈴木氏によると、注目が集まった当初、「ビッグデータ」はITベンダーが注目するトレンドだった。すなわち、RDB(Relational Database:リレーショナルデータベース)やDWH(Data Warehouse:データウェアハウス)といった既存システムで扱うことが困難である量と種類と速さをもつビッグデータを、「どのような方法で処理するのか」という部分に焦点が置かれたのである。しかし2017年現在では、ビッグデータは経営者が注目する存在となっている。すなわち、「自社ビジネスにどのように活用できるのか?」という部分がビッグデータの刮目に値する部分なのだという。企業ごとに活用方法が異なるビッグデータを、ひとくくりに定義するのは難しいというわけである。

ビッグデータは、定義づけの前に、IoT、モバイルと組んで急速に発展した。

そもそもビッグデータという言葉がはじめに登場したのは、1998年に遡る。その後、2008年に科学誌「ネイチャー」で“Big Data"の特集が組まれたり、2010年に英国の経済誌「エコノミスト」が“Data, data everywhere"という特集を組んだことなどが大きなきっかけになった。

このトレンドを加速させたのは、クラウド、モバイル、ソーシャル、IoTである。ビッグデータは、これら21世紀のITを牽引するトレンドと密接に絡み合いながら急成長している。クラウドは“ビッグデータのゆりかご"として膨大なデータを抱える場所となり、モバイルやソーシャルはビッグデータの生成される場所と頻度を増やした。センサーデータ中心のIoTはそうした流れの延長線上で現在、大きく飛躍している。

経営者が注目するようになってからは、ビッグデータの定義もより広範に。

また既存の大量データとビッグデータの違いは、Variety、データの多様性にある。RDBに保存される構造化データは文字列や数値だけで構成されているが、ビッグデータでは画像や動画、テキスト、PDF、音声、メール、ログ、XMLなどの非構造化データや半構造化データも含む。さらに前述のように経営者が注目するようになってからというもの、構造化、非構造化に関わらず、ビジネス活用の幅を拡げることにつながるあらゆるデータを“ビッグデータ"と呼ぶ傾向もある。

その企業ならではのビッグデータ活用が、定義を塗り替える。

IT業界のみならず、ビジネス業界全般に広まったビッグデータという言葉は、既存のビジネスの置き換えではなく、「これまでは不可能だった新規ビジネスに挑戦できる可能性を秘めたデータ」と、ゆるく定義することもできる。ビッグデータ活用という視点に立てば、「自分たちが本当にやりたいことは何なのか?」、「そのためにデータというリソースをどう使えばいいのか?」という戦略こそが重要になる。言い換えれば、その企業ならではのビッグデータ活用が、ビッグデータの定義を塗り替えるのかもしれない。

下記サイトからの要約。
http://e-words.jp/w/%E3%83%93%E3%83%83%E3%82%B0%E3%83%87%E3%83%BC%E3%82%BF.html
http://bizmakoto.jp/makoto/articles/1406/09/news016.html
https://japan.zdnet.com/article/35061220/


著者プロフィール

オープンソース活用研究所 所長 寺田雄一

1993年、株式会社野村総合研究所(NRI)入社。 インフラ系エンジニア、ITアーキテクトとして、証券会社基幹系システム、証券オンライントレードシステム、損保代理店システム、大手流通業基幹系システムなど、大規模システムのアーキテクチャ設計、基盤構築に従事。 2003年、NRI社内に、オープンソースの専門組織の設立を企画、10月に日本初となるオープンソース・ソリューションセンター設立。 2006年、社内ベンチャー制度にて、オープンソース・ワンストップサービス 「OpenStandia(オープンスタンディア)」事業を開始。オープンソースを活用した、企業情報ポータル、情報分析、シングルサインオン、統合ID管理、ドキュメント管理、統合業務システム(ERP)などの事業を次々と展開。 オープンソースビジネス推進協議会(OBCI),OpenAMコンソーシアムなどの業界団体も設立。同会の理事、会長や、NPO法人日本ADempiereの理事などを歴任。 2013年、NRIを退社し、株式会社オープンソース活用研究所を設立。

最新TOPICS

【IoT】AT&T×Microsoft、Azure Sphere統合IoTソリューションの提供開始---包括的IoTセキュリティ(2020年09月23日 09:38)

AT&TとMicrosoftは、世界中の企業が高度に安全なネットワーク接続を使用してマシンやデバイスをクラウドにシームレス接続できるようにするために提携した。 Azure Sphere統合IoTソリューション 取り組みの一環として、AT&TはMicrosoftと協力して、Azure Sphereと統合されたIo...

関連タグ

分散分析(Analysis of Variance: ANOVA)

  • 用語集

観測データにおける変動を誤差変動と各要因およびそれらの交互作用による変動に分解することによって、要因および交互作用の効果を判定する、統計的仮説検定の手法のひとつ。

ERP(イーアールピー)

  • 用語集

「ERP(Enterprise Resource Planning)」とは、企業における資源(人材、資金、設備、資材、情報など)を一元的に管理し、経営を支援するための手法。その手法のために利用される業務横断型ソフトウェアパッケージは、「ERPパッケージ」「統合基幹業務システム」「統合業務パッケージ」などと呼ばれている。

NoSQL(ノーエスキューエル)

  • 用語集

「NoSQL(ノーエスキューエル)」とは、膨大なデータ量を高速かつ動的に整理し分析する、非リレーショナルな分散データベースシステムである。スケーラビリティ、可用性、耐障害性において、従来のRDB(リレーショナルデータベース)を凌駕するデータベースとしてNoSQLが、注目を集めている。

スマートシティ(Smart City)

  • 用語集

スマートシティとは、「ICTやIoTなどの先端技術を用いて、基礎インフラと生活インフラサービスを効率的に管理/運営し、環境に配慮しながら人々の生活の質を高め、継続的な経済発展を目的とした新しい都市」を指す。街全体の電力エネルギーの有効利用を図り、生活インフラなどを無駄なく効率的に管理できるもので、省資源化を徹底した環境配慮型都市もしくは地域を目指す。

バックナンバー

関連記事

無料資料プレゼント

2021/03/04 セキュリティDAYS Keyspider資料

講演資料を見るには、 プライバシーポリシーに同意して、送付先メールアドレスをご入力しご請求ください。

またご入力いただきました情報は、当該資料の作成・提供企業とも共有させていただき、当社及び各社のサービス、製品、セミナー、イベントなどのご案内に使用させていただきます。

本資料を見るには次の画面でアンケートに回答していただく必要があります。



セミナー講演資料公開中

アフターコロナの需要予測と外部データ活用マーケティング

今改めて考える、社内ネットワークからAWSへの接続方法 ~閉域接続サービスはどう選ぶべきか、AzureやOracleなどマルチクラウドの接続は?~

クラウド型コンタクトセンターサービス Amazon Connectとは ~在宅で、お客様向けの電話窓口を提供する~

  • 書籍

facebook

twitter