5.21 12:00-12:50 TDSE x datablicks 製造業向けオンラインウェビナー「技術継承のためのデータ活用戦略」
TDSE株式会社

レクハウス導入・活用支援サービス with Databricks

デジタル化の定着により多くの企業が大量のデータを活用する時代が到来しました。データの活用から新たな価値を生み出すには、データを適切にマネジメントすることが欠かせません。TDSEは最適なデータ利活用環境の構築と、適切な管理・運用をご支援します。

レイクハウスが求められる背景と課題

ビッグデータ、機械学習(AI)、クラウド、DXといった取り組みが多くの企業で加速する中、必要な時に、必要なデータを、適切な形で取り出せるようにデータの適切な管理や維持、運用は企業にとって必要不可欠な取り組みといえます。
一方で、データ利活用の元となるデータの管理、保管、運用には、以下の例のように多くの課題も発生しています。

データが複雑 ・乱立したシステムが生み出す相互連携が困難なデータ
・部署ごとにデータ形式が異なるため、データ活用が進まない
データ所在者不明 ・オーナーや管理者不在の整備されないままのデータ
・データの権限や利用規定が曖昧
・活用のための承認を得るのに時間がかかる
データ活用人材の不足 データ・AI活用を推進する人材が少なく進まない

レイクハウスが解決・実現できること

これまでデータ活用基盤として主流だったデータウェアハウス(DWH)では、ETL(Extract(抽出)、Transform(変換)、Load(格納))というプロセスを通じて、フォーマットが統一された構造化データを扱います。
データ形式が統一されているため、必要な時に迅速にデータの可視化や分析ができるというメリットがあります。

一方で、様々な形式の生データを格納することができないというデメリットがあり、それを補完するために、データレイク(生データの保管)+データウェアハウス(ETLで構造化データに変換)で様々な形式のデータを必要な時にタイムリーに可視化、分析できるようにしてきました。

しかしデータレイク+データウェアハウスのデータ活用基盤には、データレイク、データウェアハウスで同じデータを重複して保持することになるため、データを維持するためのコストが莫大になることや、長年の利用によるレスポンスの低下、データ品質の低下などの課題が顕在化してきています。

そこで、近年注目を集めているのがデータレイクハウスというアーキテクチャです。
データレイクハウスは、データウェアハウスとデータレイクのメリットを併せ持つ次世代のデータ管理システムです。
データウェアハウスと類似のデータ構造とデータ管理機能を、データレイクに使用される低コストのストレージに直接実装しているため、多種多様な構造化、非構造化データを必要な時に迅速に、適切なデータ管理のもと提供することができます。

Databricksの特長

このデータレイクハウスツールの中で、注目を集めているのが統合分析プラットフォーム Databricksです。
Databricksはシンプルかつ高速にデータ管理ができ、機械学習のライフサイクルを一元管理できます。マルチクラウド対応で、Microsoft Azure、Amazon Web Services(AWS)、Google Cloud Platformなどのクラウドサービスから選択することができます。

データインテリジェントプラットフォーム Databricksは、データ活用に関する幅広い機能をカバーしています。
スモールスタートで必要機能のみの従量課金での利用も可能です。

TDSEのレイクハウス導入・活用支援サービス

TDSEのレイクハウス導入活用支援サービスの特徴

これまでの経験やノウハウに基づき、ツールをただ導入するのではなく、適切なデータ管理、利活用のための最適なレイクハウスの構築・運用をご支援します。

  • ・データ活用に関する収集から活用・分析までの計画策定
  • ・目的・データ量・性能等の様々な要求から適切な基板を設計
  • ・構築から運用までのエンジニアリングサービスを提供
  • ・お客様の状況に合わせたスモールスタートやフェーズ分けをご提案

【導入編】レイクハウス導入アプローチと進め方

レイクハウスの企画/設計・開発から運用・教育まで一貫したサービスをご提供します。

Design(ビジネス企画・要件定義)フェーズ

Designフェーズでは、ビジネス目標を定義し、そのビジネス目標をデータ活用テーマに変換し、目標を定めます。また、現状のデータを収集検証してデータ活用テーマの実現性を確認します。

サービス サービス内容 成果物
レイクハウスアセスメントサービス 現状システム把握とレイクハウス化への課題整理 レイクハウスアセスメント結果報告書
レイクハウス計画策定サービス ・レイクハウスシステム構想立案
・機械学習プロセス定義
・レイクハウスツール選定
・PoC開発/学習環境整備準備・構築
レイクハウスアセスメント要件定義書
レイクハウスシステム構成図
プロジェクト計画書

Development(基盤開発)フェーズ

Developmentフェーズでは、データ活⽤テーマに対して適切な分析⼿法/アルゴリズムの選択や特徴量エンジニアリングを⾏い、機械学習プログラムを開発します。開発したプログラムを ⽤いて様々なパターンの実験(データ前処理〜学習〜評価)を繰返し⾏い、最適な機械学習モデルを作成します。

サービス サービス内容 成果物
レイク導入・開発サービス ・レイクハウス検証環境/本番環境の構築
・前処理~学習~評価結果のサイクルテスト
・単体テスト/結合テスト/運用テスト
・パフォーマンステスト
・本番移行/本番稼働支援
・レイクハウス概要設計書
・レイクハウス詳細設計書
・テスト計画書
・結果報告書
・移行計画
・結果報告書
・運用マニュアル

Operations(運用)フェーズ

Operationsフェーズでは、機械学習モデルを本番環境に展開し、実際のビジネスシーンで活⽤できるようにいたします。また適宜モニタリングを⾏い、必要に応じてモデルの再学習/再開発を促し、その結果がスムーズに再展開されるように整備します。

サービス サービス内容 成果物
レイクハウス保守・運用サービス ・監視/モニタリング/異常検知/通知
・モデルのパフォーマンス/
 データドリフト監視
・データパイプラインの運用
運用状況報告書
レイクハウス高度化サービス ・現行モデルの調査・分析
・チューニング
・改善提案
・モデル再構築・再学習
分析結果報告書
改善提案書

Knowledge Transfer(運用)フェーズ

Knowledge Transferフェーズでは、お客様のレイクハウス環境に即した教育・研修コンテンツ制作・研修実施や伴走型のOJTも実施いたします。

サービス サービス内容 成果物
レイクハウス 教育・研修 ・レイクハウス 基礎研修
・レイクハウス ハンズオン研修
  初級編:レイクハウス運用
  中級編:モデル監視・改善
研修教材
OJT レイクハウス運用担当者へのOJT スキルチェック・評価報告書

【活用編】データ活用アセスメントと分析サービス

「弊社のデータサイエンティストが分析する」「製品を使って分析する」、「お客様社内でデータサイエンス組織を立ち上げる」など、最新のテクノロジーとご要望を掛け合わせ、ご支援いたします。

データ活用アセスメントと分析サービス

テーマアセスメントの進め方は以下の通りです。
DX部門は、業務部門を始め全社横断し解決が必要な課題を収集整理し、DXで目指すべきゴールに向け優先度の検討が求められます。当社ではロングリストによるテーマ管理と優先度決定の仕組みを使い、DX推進を支援します。

ステップ 1.業務ヒアリング 2.ワークショップ 3.優先度検討 4.分析企画作成
想定
参加者
業務部門などの責任者及びご担当者 業務部門の責任者およびご担当者/IT部門/DX部門 DX部門 DX部門
活動概要 ・ヒアリング通じて業務を理解するとともデータに関係する活動の現状を把握
・データ利活用に関係するビジネス上の課題をヒアリング
・座学形式による、DXやAIに関する基礎的な考え方や進め方の共有
・実際のAIなどデータ活用の事例の紹介
・参加者で同士ディスカッションしながらビジネス課題を抽出
・各業務部門から抽出されたビジネス課題をデータ活用の観点から整理。
・ビジネス面および技術面から各テーマの評価、優先実施テーマ選定の支援
分析企画検討
主な
成果物
テーマ候補リスト テーマ候補リスト ロングリスト
優先度評価結果
分析プロジェクト企画書

テーマアセスメントにより抽出された優先度の高いテーマに関し、分析プロジェクト(POC)を実施致します。プロジェクト推進に当たっては、当社メンバーにて実施する方法や、貴社の分析担当者が主体となり当社メンバーが 伴走しながら支援する方法も可能です。
また、分析ツールや分析環境の整備もご支援いたします。

ステップ 1.分析設計 2.データ準備 3.データ分析 4.結果評価
想定
参加者
分析テーマ対象部門/分析担当者 分析担当者/分析テーマ対象部門/IT部門 分析テーマ対象部門/分析担当者 分析テーマ対象部門/分析担当者
活動概要 先行したテーマアセスメントの成果物である分析企画書に基づき、分析方法の詳細を検討し分析設計書を作成する。 分析に用いるデータを収集・蓄積し、データ量や品質が分析の目的に十分であるかを判定する。 モデル構築など実際のデータ解析を実施する。また、モデル精度を確認する。 分析の効果をビジネス観点から試算し、システム開発に進むことが可能かを判断する。
主な
成果物
分析設計書 利用データ一覧、データ定義書など モデル結果要約書など 最終報告書など

CONTACTお問合せ

お電話でも承ります。お気軽にご連絡ください。
TEL. 03-6383-3261 平日9:00 〜 18:00

ご相談・お問合せはこちら

お問合せ

上へ戻る