2017年04月10日
オープンソース活用研究所 所長 寺田雄一
ビッグデータからビジネスの知見を引き出すデータサイエンティスト(CCP)が、ビッグデータビジネスの花形職業と言われて久しい。データサイエンティストになるために資格は必須ではないが、2014年から米クラウデラ(Cloudera)が、データサイエンティストの認定プログラム「Cloudera Certified Professional: Data Scientist (CCP:DS)」の開始を発表するなど、ビッグデータ業界で活躍するに際にメリットとある資格はいくつか存在する。
データサイエンティストを中心に、ビッグデータに携わる上で有利な資格を紹介する。
データサイエンティストは、複雑で膨大なデータビッグデータを分析し、自社のビジネスに貢献することが、その役割となる。データサイエンティストに求められるスキルは、統計・確率、データ統計処理手法、データベースに関する専門的知識から、プログラミングスキル、ビジネスに関する知識、利益を生み出すための「予測モデル」の立案能力まで、実に幅広い。データサイエンティストが必要とされるスキルや分析手法は企業によって異なるため、「この資格を取れば良い」とは、一概に言い難い。データサイエンティストに関する学習のアプローチ方法はさまざまだが、自分の得意分野を起点として「できること」を少しずつ増やしていく方法が一般的だ。
データサイエンティストの広範な職務のなかでもコアとなる統計学・データベース・情報科学の学習に役立つ資格は、次のとおり。
ビッグデータ分析において、統計学は必須となる。近年、ソフトウェアの進歩によって分析自体は容易になってきているが、「得られたデータをどのような手法で分析するか」「分析結果から何が読み取れるか」を考える際には統計学的知識が求められる。
「統計検定」は総務省が後援している資格で、基礎的な知識が問われる4級から幅広い知識・応用力が要求される1級まで用意されている。データサイエンティストを目指す場合は、大学1・2年生程度の統計力が試される統計検定2級から始めると良い。
データサイエンティストが分析しようとするビッグデータは一般的にデータベースに蓄積されるため、データベースの操作によって必要なデータを抽出したり、負荷をかけずに分析するための知識が必要となる。 代表的なデータベース資格としては、ベンダー資格「オラクルマスター」(Oracle Master)や、特定の企業や製品に依存しない資格「OSS-DB技術者認定試験」がある。
情報処理技術者試験は、独立行政法人情報処理推進機構(IPA)が実施する国家試験であり、システムエンジニアを目指す場合には必須の試験となる。
高度なIT技術とその活用能力が求められる企業やビジネスでは、データサイエンティストにもこの資格同等のスキルが求められる。「応用情報技術者試験」レベルのスキルが必要なことも。
データサイエンティスト以外の職域での、ビッグデータ関連資格については次のとおり。
下記サイトからの要約。
http://kakakakakku.hatenablog.com/entry/2015/01/13/162645
https://www.internetacademy.jp/it/qualification-to-help-data-analysis.html
1993年、株式会社野村総合研究所(NRI)入社。 インフラ系エンジニア、ITアーキテクトとして、証券会社基幹系システム、証券オンライントレードシステム、損保代理店システム、大手流通業基幹系システムなど、大規模システムのアーキテクチャ設計、基盤構築に従事。 2003年、NRI社内に、オープンソースの専門組織の設立を企画、10月に日本初となるオープンソース・ソリューションセンター設立。 2006年、社内ベンチャー制度にて、オープンソース・ワンストップサービス「OpenStandia(オープンスタンディア)」事業を開始。オープンソースを活用した、企業情報ポータル、情報分析、シングルサインオン、統合ID管理、ドキュメント管理、統合業務システム(ERP)などの事業を次々と展開。 オープンソースビジネス推進協議会(OBCI),OpenAMコンソーシアムなどの業界団体も設立。同会の理事、会長や、NPO法人日本ADempiereの理事などを歴任。 2013年、NRIを退社し、株式会社オープンソース活用研究所を設立。
2022-07-28(木)15:00 - 16:00 「【サービス事業者向け】中小企業が狙われた、サプライチェーン攻撃の手口を解説 ~サイバー攻撃の被害に遭う中小企業の3つの共通点と、その対策~」 と題したウェビナーが開催されました。 皆様のご参加、誠にありがとうございました。 当日の資料は以下から無料でご覧いただけます。 ご興味のある企業さま、ぜひご覧ください。
「MapReduce(マップリデュース)」とは、大規模なデータを分散処理するためのプログラミングモデル。 分割されたデータの断片に加工を施し必要な情報を抽出するMap処理と、Mapで抽出した情報を束ねて処理結果を得るReduce処理の2段階に分けてデータ処理を行う。
「デシル分析(Decile Analytics)」とは、購買履歴データをもとに全顧客の購入金額を高い順に10等分し、各ランクの購入比率や売上高構成比などの有益な情報を得るための分析手法。
Analytics News ACCESS RANKING