CLOSE UP コラム | Hadoopの資格

Hadoopの資格

CLOSE UP 事例

2017年05月22日
オープンソース活用研究所 所長 寺田雄一

ビッグデータブームに後押しされ、一気に利用が拡大したオープンソースの分散処理基盤「Apache Hadoop」。2016年、公式に誕生してから10年目を迎えたHadoopは、最先端のIT企業だけではなく、幅広い業界、多様なビジネスからから注目を集めている。海外の基準でみると、世界的に普及しているHadoopが、国内ではやっと実用化が始まった段階に入り、その認定資格にも注目が集まっている。

Hadoopの商用ベンダーとしていち早く設立されたClouderaの日本法人から、Cloudera University Japan トレーニングマネージャー兼シニアインストラクター 川崎達夫氏に、Hadoopの現状や、同社が提供しているHadoopのトレーニング、認定資格について聞いた。

オンラインで取得できるHadoop認定資格

Cloudera 社は、Hadoopプロジェクトのリーディングカンパニーとして、コミュニティーを支え、Hadoopの普及にも貢献してきた。Clouderaの日本法人が設立されたのは2012年4月。そして、Hadoopのみならず、機械学習、Python、Rなど全世界の50以上の都市で累計40,000万人以上のエンジニアにオンラインでトレーニングを提供しているのが、Cloudera University ある。

現在、Cloudera Universityで提供しているトレーニングコースには「Hadoopエッセンシャル ~1日でHadoopやビッグデータを学ぶ~」という初級コースから、開発者向けトレーニングや管理者向けトレーニングまで幅広い。

Cloudera Universityが提供する認定資格は、難易度によって「Cloudera認定アソシエート(CCA)」と「Cloudera認定プロフェッショナル(CCP)」の2レベルに分かれる。CCAがベーシックレベル、CCPがプロフェッショナルレベルであり、認定資格の有効期限は、CCA認定が2年間、CCP認定が3年間となる。

CCAには3種類、CCPには2種類の資格がある。また、これらの資格は対象者・対象スキルにより管理者、データ分析者、開発者という3系統にも分かれていく。

管理者向け資格

CCAの「Cloudera Apache Hadoop 認定管理者(CCAH)」が該当する。Clouderaの認定資格でありながら、試験内容はClouderaディストリビューションに限定せずHadoopの運用管理について幅広く問うもの。なお、この資格は近く新資格「CCA 管理者」へ切り替わる予定。

データ分析者向け資格

「CCA データアナリスト」と「CCP データサイエンティスト」がある。データ分析が業務担当者向けとなり、データ可視化やデータをどう取得するかなどのスキルが問われる。

Hadoop 認定資格のなかでも難易度が高いのが、「CCP データサイエンティスト」である。統計学や機械学習などの知識とともに、資格取得には3種類の試験が用意されている。ほかの資格は全て1試験であるのに対して、試験数も違い、英語による試験となるため語学力も問われる。

開発者向け資格

「CCA Spark & Hadoop 開発者」と「CCP データエンジニア」がある。データをアプリケーションで用いるためにデータの移動や変換などのスキルが問われる。こちらも現在は英語試験のみだが、今後は日本語試験を提供する予定。

なお認定試験は、オンラインで受講できる。

下記サイトからの要約。
http://shikakuzine.jp/article/detail/369
http://www.cloudera.co.jp/university/certification.html


著者プロフィール

オープンソース活用研究所 所長 寺田雄一

1993年、株式会社野村総合研究所(NRI)入社。 インフラ系エンジニア、ITアーキテクトとして、証券会社基幹系システム、証券オンライントレードシステム、損保代理店システム、大手流通業基幹系システムなど、大規模システムのアーキテクチャ設計、基盤構築に従事。 2003年、NRI社内に、オープンソースの専門組織の設立を企画、10月に日本初となるオープンソース・ソリューションセンター設立。 2006年、社内ベンチャー制度にて、オープンソース・ワンストップサービス 「OpenStandia(オープンスタンディア)」事業を開始。オープンソースを活用した、企業情報ポータル、情報分析、シングルサインオン、統合ID管理、ドキュメント管理、統合業務システム(ERP)などの事業を次々と展開。 オープンソースビジネス推進協議会(OBCI),OpenAMコンソーシアムなどの業界団体も設立。同会の理事、会長や、NPO法人日本ADempiereの理事などを歴任。 2013年、NRIを退社し、株式会社オープンソース活用研究所を設立。

最新TOPICS

【BI】Google、「BigQuery用Sheetsデータコネクタ」のベータ版開始を発表---最大100億行のデータにスプレッドシートからアクセス(2019年04月11日 11:58)

Googleはサンフランシスコで開催された「Google Cloud Next '19」にて、「BigQuery用Sheetsデータコネクタ」のベータ版開始を発表した。 「BigQuery」とは BigQueryは、Googleが提供するサーバーレスでスケーラビリティに優れたエンタープライズ向けデータウェアハウ...

関連タグ

サイバーフィジカルシステム(Cyber-Physical System)

  • 用語集

「サイバーフィジカルシステム」とは、現実世界(フィジカル空間)での膨大な観測データなどの情報をサイバー空間で数値化し定量的に分析することで、より高度な社会を実現するために「社会システム効率化」「新産業創出」「知的生産性向上」などを目指すサービスおよびシステム。

リアルタイムデータ処理()

  • 用語集

「リアルタイムデータ処理」とは、すべてのデータをストレージに格納して処理していた従来手法に代わり、ビッグデータをリアルタイムで処理するための手法。「ストリームデータ処理技術」「複合イベント処理技術」「インメモリデータ処理技術」などの技術を利用することで、データをリアルタイム分析できる処理基盤が普及してきている。

Jedox(ジェドックス)

  • BI

Jedox(ジェドックス)とは、オープンソースのビジネスインテリジェンスソフトウェア。予算実績管理/計画/分析/レポートに特化しており、Excelベースで簡単に分かりやすくデータ操作を行える点を特徴としている。

マーケティングオートメーション(Marketing Automation)

  • 用語集

「マーケティングオートメーション(Marketing Automation:MA)」とは、デジタルマーケティングのプロセスの一部を自動化するソリューションプラットフォームである。

ビッグデータ(Big Data)

「ビッグデータ(Big Data)」とは、一般的なソフトウェアの能力を超えたサイズのデータ集合であり、従来のデータベース管理システムでは「記録」「保管」「管理」「解析」などの処理が難しいほどの巨大で複雑なデータ群。「インターネット普及」「コンピュータの処理速度」「クラウド技術向上」などに伴い、日々大量に生成され溢れている大容量デジタルデータを指す。

バックナンバー

関連記事

  • KSKサイド006

Analytics News ACCESS RANKING

facebook

twitter