最終更新日:
データマネジメント講座体験記:DXに必要なデータ基盤の整備方法が学べる4時間
1.はじめに
こんにちは、スキルアップAIの渡部です。最近、新聞やビジネス書を読んでいると、データ活用やビッグデータ、データドリブンマーケティング、データ経営など、データに関する単語や概念を多く見かけます。総務省の情報通信白書(令和2年版)でも「この5年でデータ分析による企業経営の高度化が進められていることがうかがえる」と記述もあり、ビジネスにおいてデータを活用していくことがトレンドになりつつあります。
総務省は、日本企業におけるデジタルデータの活用に関する実態を把握するため、2020年に企業の従業員を対象にアンケートを実施しました。下記の図は、企業のデータの活用状況について調査した結果です(2020年3月時点)。横軸はデータの種類を、縦軸はそのデータを活用できている企業の割合を表しています。
出典:総務省「令和2年版 情報通信白書」
比較対象の5年前(2015年当時)の調査結果(ビッグデータの流通量の推計及びビッグデータの活用実態に関する調査研究)と比較すると、POSやeコマースによる販売記録データや、アクセスログの活用が増加していることが分かります。5年間でデータ分析による企業経営の高度化の進展が見て取れます。
これからますます社会にIoTが普及すると、多くのデータが行き交うようになります。そして、そのデータの活用が社会やビジネスの発展に大きく関わってきます。ただ、ここで一つ大事なことがあります。データを活用するためには、データが使いやすいように保存されていなければなりません。「売上データってどこに保存されているの?」といった状況では、分析ツールが揃っていてもデータの活用はできません。
データの活用を進めていくためには、まずはデータの管理が必要です。これをデータマネジメントと呼びます。データマネジメントは「あらゆるデータ活用を実現するための土台」です。例えば、色々な場所に散らばっているデータを統合するデータ基盤という考え方を導入することで、データ活用が円滑になります。しかし、データ基盤とはそもそも何であるかや、データ基盤の開発に必要な体制について体系的に学ぶことは難しい状況です。
本ブログでは、データマネジメントについて総合的に学べる「データマネジメント講座」について、実際に受講した感想を交えて講座の魅力をお伝えしていきます。
2.受講のきっかけ
私は普段、法学部で「独占禁止法」という法律を学んでいます。独占禁止法とは、会社同士の競争における不正を取り締まることで自由かつ公正な市場を確保するための法律で、その独占禁止法を運用しているのが、公正取引委員会という独立行政法人です。
法律とデータマネジメントは関係がないように思う方も多いかもしれませんが、実は大いに関係があるのです。2021年6月、公正取引委員会は「データ市場に係る競争政策に関する検討会」の報告書を発表しました。報告書には、デジタル時代においてデータは競争力の源泉となることが指摘されるとともに、「新たな形でのデータの流通・活用が現れ始めている」と記述されています。
「データ市場に係る競争政策に関する検討会」を読んでいると、データは各企業の競争力強化において必要不可欠であり、データの扱い方、データマネジメントについての理解はこれからの社会人にとって必須スキルだと思いました。データマネジメント講座の案内には「前提知識」が不要とあったため、自分でもできると思い受講を決断しました。
本講座を受講したことで、AI開発やデータ分析をするために必要なデータ基盤やデータの収集方法に関する基礎的な知識が身につきました。本講座の一番の魅力はなんといっても前提知識がなくても学べるということです。「データアーキテクチャやデータレイクという言葉を聞いたことがない」、「オンプレミスやクラウドといった知識がない」という方でも一から丁寧に解説してくれるので安心して受講できます。私も前提知識ゼロから受講して、データマネジメントに関してエンジニアと対等に話し合う自信がつくまでのスキルが身につきました。
3.カリキュラム
本講座は第1章から第5章まであり、受講時間は4時間です。具体的なカリキュラムは以下の通りです。
- 第1章:データマネジメントの概要
- 第2章:データエンジニアリングの具体的機能
- 第3章:データ基盤の事例
- 第4章:データ基盤開発の進め⽅
- 第5章:データガバナンスの具体的機能
第1章でデータマネジメントの全体像を掴み、第2章以降でデータマネジメントやデータ基盤に関して、それらの詳細や具体的な方法を学んでいきます。データマネジメントのスキルが体系的に学べるカリキュラム構成になっています。
また、第2章と第4章では実務で役に立つワークもあります。講座でインプットした知識をすぐに実践してアウトプットすることで、実務で活かす際のイメージがしやすくなります。付録としてワークの解答例も付属しているため、確実なスキルの習得につながります。
4.データ活用のための土台を築けるようになる
データマネジメントは、データ分析やAI開発を行うための土台のことです。土台を築くためには、「データエンジニアリング」と「データガバナンス」の2つの要素を満たす必要があります。
本講座では、「事業価値創出」と「開発効率向上」の2つの観点でデータマネジメントの必要性を説明します。ただデータを集めればいいというわけではなく、集めたデータを活用することを見据えて、データをマネジメントすることが重要だということを学びました。
データをマネジメントする際に必要となる観点が「データエンジニアリング」と「データガバナンス」です。
データエンジニアリングとは、データ活用のための仕組みを作ることです。データアーキテクチャ、データ基盤、データ収集、データの整形と統合といったキーワードがあります。
「どのようにデータを収集するのか」「どのようにデータを整備するのか」「データ基盤はどのようなものか」など、データマネジメントを行う上での疑問が解決されました。第2章を理解することによって、第3章以降の理解も深めることにつながるので、何度も復習することをおすすめします。
データ基盤の設計の方針として「3層構造」という考え方があります。
データレイクはひとまずデータを蓄積しておく場所です。データウェアハウスやデータマートは分析者のために用意されたデータの保存場所です。データウェアハウスやデータマートはデータベースなどで実装されることが多いです。データ基盤に、3層構造を導入することで、データ分析やAI開発が円滑になります。
その他、データエンジニアリングに関しては、データを蓄積する設備にかかる費用やセキュリティ面に関しても基礎的な知識を学んでいきます。
データガバナンスとは、データ活用の利便性向上と安心担保のための管理を行うことです。マスターデータやメタデータの管理、データ品質の管理、セキュリティーといったキーワードがあります。例えば、マスターデータの管理を行うことで、システムを跨いで共通利用するデータが定義されデータ利活用の利便性が向上します。
メタデータとは、データの意味を説明するためのデータです。メタデータをきちんと記録、管理していくことで、社内の誰もがデータの活用に参入できます。一部の技術者でないとデータの意味が分からない、という状況では社内のデータ活用は進みません。
5.まとめ
講座を通じて得た1番の学びは、先述したとおり「ただデータを集めればいいというわけではない」ということです。当たり前だと思うかもしれませんが、データを収集してからそれらを活用するまでには予想以上の長いプロセスがあり、考慮すべきポイントがたくさんがあります。
これからの時代において、デジタルデータの活用体制を整備しておくことは必要不可欠です。実務活用に向けた情報源が少ない中、スキルアップAIのデータマネジメント講座は体系的に学べる数少ない講座の1つだと思います。
皆さんも本講座を通して、データ分析に必要なデータマネジメントのスキルを身につけてみませんか。現在、講座のカリキュラムの一部が無料で視聴できるトライアル版もございます。まずは無料動画を見て、分かりやすさやレベル感を確認してみてください。
配信を希望される方はこちら
また、SNSでも様々なコンテンツをお届けしています。興味を持った方は是非チェックしてください♪
公開日: