多くの企業でデータ利活用の取り組みが進み、データによる新たな価値の創出への期待が高まっています。 データ利活用によるDXが進む一方で、「蓋を開けてみたら有用なデータが取得できていなかった」「データがどこにあるかわからない」「データが整備できておらず、すぐに分析に活用できない」といった問題を度々耳にします。 本記事では、これからデータ利活用に取り組む方に向けて、データマネジメントの基礎的な考え方に焦点を当て、その構成要素やロードマップ、取り組まない場合のリスクについて解説します。
目次
データマネジメントとは
ビジネスでは経営判断にデータを利用することが多く、即座に正しいデータを参照し、分析できることが求められます。必要なデータをいつでも適切な状態で参照、活用できるようにすることを目的とした取り組みをデータマネジメントと呼びます。 一般的には企業の規模が大きくなればなるほど、取り扱うデータの種類やボリュームが増え、すぐに必要なデータを取り出すことや、どのようなデータがどのような状態で保存されているかを知ることが難しくなります。
蓄積されたデータが多くなっても正しいデータをセキュアに利用できることが重要となり、その為の管理方法を整備することがビジネスの現場では求められています。
データマネジメントにおけるよくあるビジネス課題
企業内のデータに関わる課題をいくつか挙げてみます。
例えば、「活用すべきデータが企業内の様々なシステムで保持、分散されており、一元的にデータを集約している組織や管理方針がない」場合、システムだけでなく個人のPCに重要なデータが存在していることもあり、貴重なデータがばらばらに管理されていることもよくあります。 このようなデータ管理のサイロ化により同じようなデータが様々な場所で管理されたり、特定の利用者しかデータを参照できない偏りが発生したり、データを経営に活用する上で非効率な状況が発生してしまいます。
データマネジメントの要素
このような、様々なデータにまつわるビジネス課題に対応していくには、データマネジメントの考え方を理解することが有効です。非営利団体Data Management Association International (DAMA-I)はデータマネジメント知識体系ガイド(DAMA DMBOK)をまとめています。これはデータ管理に関連するプラクティス、原則、定義を体系的にまとめたものになります。
出典:一般社団法人 データマネジメント協会 日本支部
データマネジメントの要素(データマネジメント知識領域)
2. データ取扱倫理 | データを取り扱う上で法規制や個人情報保護などの原則を遵守し、データ利活用の信頼性を維持する |
---|---|
3. データガバナンス | データの管理の責任者や組織体制を明確にし、決められたデータ管理基準を関係者に浸透させる |
4. アーキテクチャ | データの取得、管理、活用方法を明確にし、利用価値を最大化する |
5. モデリングとデザイン | データのビジネス活用などを考慮して、利用者とコミュニケーションしやすいようにデータを文書化、関係性の可視化などを行う |
6. ストレージとオペレーション | 正しいデータをいつでも迅速に取り出せるようにデータベースなどの技術的な構成を最適化し、実装、運用していく |
7. データセキュリティ | データ資産のアクセス制御、監査に関するポリシーを構築する |
8. データ統合と相互運用性 | データ管理仕様を標準化し、システム間の連携方式、データフォーマットの作成方針を一元化することによりデータ連携を効率化する |
9. ドキュメントとコンテンツ管理 | 業務上で発生する資料のような非構造なデータのライフサイクルを定義し、バージョン管理や廃棄ルールを徹底し、組織内でいつでも活用できるようにしておく |
10. 参照データとマスタデータ | データに意味合いを持たせるデータとなる為、参照方法や更新方法に関する管理方針と関係者へのガバナンスの浸透が重要となる |
11. データウェアハウス | BIツールなどから容易に参照できるようにデータが整備され、重複などの不要データが排除され、変更履歴などが正確に確認できるようにデータが蓄積される |
12. メタデータ | 利用者がデータの持つ意味を理解しやすくする為の説明データであり、カタログ化して管理されることが推奨される |
13. データ品質 | データ利用者の要求に応じて品質基準を定義し、データ状態を定期的に確認する |
14. ビッグデータとデータサイエンス | 多様性のあるデータが最適なアーキテクチャで必要な利用者に公開され、分析から得られる結果を課題解決などに役立てる |
15. 成熟度アセスメント | 定期的にデータの管理状態を収集し、改善が必要なポリシー、プロセスなどを特定し、必要なアクションを検討する |
16. 組織と役割期待 | データを管理する関係者を組織化し、それぞれの役割を明確化して合意を得る |
17. 組織変革管理 | データ利活用の環境の変化に応じてデータに基づく戦略を見直し、新しい手法や考え方をデータに関わる組織に定着させる |
データマネジメントの取り組みロードマップ
本章では、前述の構成要素を活用し、データマネジメントの取り組みのロードマップを解説します。
【フェーズ1】目標設定
データマネジメントの取り組みでは、データ管理のゴールを組織として定め、そのゴールを目標に活動します。
そのため、フェーズ1ではこのビジネスにおいてどのようなゴールを目指して、それを達成する為にはどのようなデータが必要になるかを考えていくことになります。
【フェーズ2】要件整理
フェーズ2では、ビジネス要件とセキュリティ要件を整理し、必要なデータを蓄積するデータベースの設計と開発を行います。ここでデータごとのセキュリティレベルの設定と利用者のアクセス権限の整理が極めて重要となります。
これらはビジネスにおいては万が一のリスクを防ぐ為に重要な活動です。また、法規制などにより考え方が変わることもありますので、規制に合わせた管理基準へのタイムリーな変更も必要となります。
【フェーズ3】実現化
データベースに蓄積するデータは利活用の観点から使いやすい形式に変換し収集することになります。フェーズ3では、データ運用保守の観点でデータが多様化することを考慮し、データモデリングでドキュメント化し、データ同士の関連性などを確認できるようにしておきます。これらのドキュメントは開発時から形骸化しないようにオーナーや管理方針を決めておきます。似たようなデータが存在したりしないように運用ルールなどの取り決めも必要になります。
データ可視化の観点でもダッシュボードやレポートの管理が必要になります。似たようなレポートが複数存在したり、使われていないレポートが存在したりすると管理コストが大きくなり、意思決定を行う指標も複雑化します。データの可視化についても誰が何の為に利用するものかを明確にして、管理していく必要があります。
【フェーズ4】運用
データの品質を維持・管理する為には計画を策定し、実行することが重要となります。
フェーズ4では、データに求められる品質要求を整理し、目指すべき品質評価の基準を設定します。データの正確性などの状態を定期的に把握できるようにしておき、品質基準に満たないデータが発生する場合はデータクレンジングなどの対応を検討します。データ品質を高くすればするほど、管理コストも高くなる為、ビジネスニーズに合わせてバランスをとった品質基準を設定する必要があります。このような品質改善のプロセスを反復しながら、組織内へのデータ管理方針の理解度を深め、データ利活用を定着させることが重要です。
データマネジメントを取り組まない場合に起こりえるリスク
データマネジメントを考慮しなかった場合には、以下の例のようなリスクが発生する可能性があります。これらのリスクを未然に防ぐ為に、データマネジメントの考え方が重要となります。
状況 | リスク | データマネジメントでの考え方 |
---|---|---|
限られた担当者しかデータの仕様を把握していない | 属人的なデータ管理により、担当者の退職等でデータ利活用のナレッジが失われる | データはメタデータにより管理され、利用者は一元的にデータカタログから人を介することなくデータの仕様を確認できる |
同じ内容のデータが複数の場所で管理される | 例えば製品マスタが複数の場所で管理されている場合、それぞれのメンテナンス方法が統一されない為、参照するシステムによって異なった結果の製品情報を利用者に提供してしまう | データを統一的に管理する体制を作り、システム的にも同じ内容のデータは一か所で管理することでデータの品質を保つ |
ここまで、データにまつわる様々な課題、データマネジメントの構成要素、取り組みのロードマップ、リスクについて解説してきました。
適切にデータを収集、管理し、データ利活用による新たな価値の創出に取り組んでいきましょう。
TDSEでは、様々な企業様のデータ活用の実運用で一気通貫でご支援してきました。
機械学習やデータ利活用のためのシステムは、従来行われているソフトウェア開発やシステム運用ノウハウをそのまま適用できないケースもあり、その特性を生かした設計/開発を行うことが重要です。
ご興味のある方はぜひお問合せ下さい。