<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

教你如何區分數據倉庫oneID和主數據

jf_78858299 ? 來源:迪答數據 ? 作者:迪答數據 ? 2023-03-29 14:29 ? 次閱讀

在了解oneID前,先來看一下阿里的oneDate體系。其實OneID在整個數據服務體系中,也只是起點不是終點或者說是手段,我們最終的目的是為了建設統一的數據資產體系。

沒有建設統一的數據資產體系之前,我們的數據體系建設存在下面諸多問題

  1. 數據孤島:各產品、業務的數據相互隔離,難以通過共性ID打通
  2. 重復建設:重復的開發、計算、存儲,帶來高昂的數據成本
  3. 數據歧義:指標定義口徑不一致,造成計算偏差,應用困難

在阿里巴巴 OneData 體系中,OneID 指統一數據萃取,是一套解決數據孤島問題的思想和方法。數據孤島是企業發展到一定階段后普遍遇到的問題。各個部門、業務、產品,各自定義和存儲其數據,使得這些數據間難以關聯,變成孤島一般的存在。

OneID的做法是通過統一的實體識別和連接,打破數據孤島,實現數據通融。簡單來說,用戶、設備等業務實體,在對應的業務數據中,會被映射為唯一識別(UID)上,其各個維度的數據通過這個UID進行關聯。

各個部門、業務、產品對業務實體的UID的定義和實現不一樣,使得數據間無法直接關聯,成為了數據孤島?;?a target="_blank">手機號、身份證、郵箱、設備ID等信息,結合業務規則、機器學習、圖算法等算法,進行 ID-Mapping,將各種 UID 都映射到統一ID上。通過這個統一ID,便可關聯起各個數據孤島的數據,實現數據通融,以確保業務分析、用戶畫像等數據應用的準確和全面。下面就來介紹一下主數據和OneID。

— 01 —

OneID 和主數據到底是不是一回事?

在阿里巴巴 OneData 體系中,OneID 指統一數據萃取,是一套解決數據孤島問題的思想和方法。

如果單看這個定義,你一定也會和我一樣懵逼,啥是數據萃???解決數據孤島問題,主數據不也是干這個事情的嗎?

別急,我們慢慢分解,先來看 OneID 到底是干啥的。

OneID 也叫 ID-Mapping,就是將設備 ID(例如手機 MAC、IMEI、IMSI 等),手機號、身份證號、郵箱地址、PC 端的 Cookie,用戶名等信息,結合標簽體系、知識圖譜、機器學習等技術和算法,將各種 ID 都映射到統一的 ID 上。也就是說不論用戶用什么 ID 登陸,不論登陸的是 PC 端還是手機 APP,都能識別到他的一個唯一身份。

OneID 干的這個事情是不是和主數據有點類似?主數據也是給數據對象賦予一個唯一的編碼(身份)。

但是,不得不承認,OneID 和主數據還是有很大區別的,如下:

第一,解決問題的環境不同。OneID 主要是解決 ToC 業務,不同渠道、不同數據來源的用戶身份的統一映射和識別問題,例如:PC 端、移動 APP,微信小程序、相關應用系統等。而主數據是對相同數據對象進行標準化定義并賦予唯一編碼,更多的是用 ToB 業務中,解決企業內部異構系統之間數據不一致問題。

第二,解決問題的“地點”不同。OneID 是把各類 UID 信息匯聚在一起,在一個地方進行加工和處理,最后形成統一的 Mapping 關系,阿里管這個地方叫做“數據中臺”。而主數據強調的是從源頭統一標準,定義唯一編碼,各異構系統都依據統一的標準執行,映射關系是建立在各異構系統中的。

第三,解決問題的技術不同。OneID 是典型的 OLAP 技術,是在產生數據之后通過大數據分析、人工智能算法等技術將各種 UID 都映射到統一的 ID 上。而主數據是典型的 OLTP 技術,其本身是對數據的增刪改查操作,例如客戶主數據的定義和編碼。

— 02 —

數據中臺為什么需要 OneID?

接觸過企業數據平臺的人都會知道,數據孤島是企業發展到一定階段后普遍會遇到的問題。企業內部的各個部門、業務、產品,各自定義和存儲其數據,使得這些數據間都是相互割裂、難以關聯,從而真正變成“孤島”一般的存在,在業務價值上很難發揮出更多作用。

普遍存在的數據孤島現象,各部門用的平臺不同,且數據不相通

OneID的建立,就是為了打通這種數據孤島的現狀,通過打通分散在各個平臺的用戶數據,整合客戶全生命周期旅程,實現各平臺存儲的數據通融,從而提升業務效率和用戶體驗。

** ONEID的業務價值和數據管理價值**

業務價值:通過OneID貫穿客戶生命周期,精準識別客戶行為(瀏覽、留資、到店等行為軌跡),相當于為每一位用戶量身定制了屬于自己的完整的“身份和行為”的“名片”,為營銷場景的落地(廣告定投、精準推送、個性化推薦、增換購、流失預警等場景)和精益化運營的需要(精準客戶數據分析、精準人群定位、精準圈層運營、經銷商客戶信息溯源等)提供支持。

數據管理價值:業務價值主要傾向于OneID對外為企業帶來的營銷便利、利潤增長,數據管理價值主要傾向于對內形成的“互助”作用。OneID的構建有助于數據資產的沉淀,便于企業的數據管理、數據資產的可視化和可評估化等,同時,OneID還可滿足其他平臺的一些需求,如CDP平臺、數據中臺等,為其提供一定的支持。

總而言之,OneID的構建,是為了支撐各業務方管理決策及應用落地,從而達到提升業務效率及客戶體驗,且數據應用準確而全面的最終目的。

— 03 —

OneID 和主數據的實現原理

OneID 是對不同渠道、不同來源的的“ID”進行統一拉齊和打通,其實現原理如下:

圖片

為了方便理解,這里給出的例子是比較簡單的,但在實際實施過程中,其應用要復雜很多,例如:相同 ID 的值不一致怎么辦,重復的 ID 如何合并,ID 信息發生變化如何更新,Mapping 表的更新頻率如何設置等等,這些問題就需要結合具體場景解決了。

我們再來看看主數據管理(MDM)的工作原理

主數據管理強調在源頭治理,即:在數據源系統定義實現主數據的標準化,生成唯一主數據編碼,并通過主數據系統分發標準數據到相關消費系統進行使用,消費系統只有查詢和使用權不能對主數據進行“增刪改”。另外,不同主數據的來源系統不同,如在這個例子中的客戶主數據來源為 CRM,物料主數據的來源為 MDM,ERP 系統和數據倉庫是主數據的消費系統。

— 04 —

有了數據中臺,還需要主數據嗎?

在很多數據中臺的解決方案中,主數據是數據中臺的一個組成部分。例如在 SAP 的數字平臺解決方案中,數據中臺是由數據集成、數據存儲、數據倉庫、開發建模、數據資產管理、數據管控、人工智能與行業模版等多個部分組成。其中,數據管控模塊中就包含了主數據治理,如下圖:

很多人都有個疑問,數據中臺中既包含了數據采集/數據移動的能力,也包含數據服務共享的能力,同時還具備元數據、數據質量、數據安全等數據治理能力,有了數據中臺,為什么還需要主數據管理?

數據中臺通過數據采集、清洗、治理,再以標準接口服務的形式提供出去,供其他系統調用,這確實是數據中臺的核心能力。從功能的角度,主數據管理也的確有類似的功能,例如:主數據采集、主數據清洗、主數據服務等。

但是,我們之前也說過,主數據與數據中臺解決的問題并不相同。

數據中臺是在有了數據之后,在中臺進行數據治理,形成數據資產并提供數據服務。而主數據更強調在數據產生之前定義數據標準,建立數據管理流程,并在數據產生的過程中對數據質量進行校驗,從源頭進行數據治理。

因此,相對于數據中臺來講,主數據管理是一個后臺系統,它可以作為數據中臺的一個數據源為數據中臺供應高質量的數據。

設想一下:如果沒有主數據管理,從各個異構系統中采集到數據中臺的主數據(如:客戶、產品、供應商等)將有不同的定義和編碼,這就需要在數據中臺對這些不一致的數據進行統一治理,這將是一件非常痛苦的事情,而且不能從源頭上解決問題。因此在筆者看來,站在整體解決方案的角度,將主數據治理提前,對于傳統企業來講可能是不錯的解決方案。

— 05 —

有了數據中臺,還需要主數據嗎?

主數據的核心目的是在單一業務領域中,各系統進行核心數據的統一,兩個關鍵詞: 業務系統和統一 。

One ID的核心目的是跨業務領域的數據連通,兩個關鍵詞:跨業務領域、連通。

所以,OneID是放大版的主數據,主數據可以作為OneID的輸入。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據倉庫
    +關注

    關注

    0

    文章

    60

    瀏覽量

    10405
  • 阿里
    +關注

    關注

    6

    文章

    430

    瀏覽量

    32705
收藏 人收藏

    評論

    相關推薦

    數據倉庫的基本架構及架構圖介紹

    本文開始介紹了什么是數據倉庫以及數據倉庫的用途,其次介紹了數據倉庫分層的原因,最后介紹了數據倉庫的架構圖及理想的架構分析。
    的頭像 發表于 02-11 10:08 ?5.9w次閱讀
    <b class='flag-5'>數據倉庫</b>的基本架構及架構圖介紹

    什么是數據倉庫?數據倉庫的優勢分析

    數據倉庫,有一個被廣泛接受的定義:數據倉庫(Data Warehouse)是一個面向主題的(Subject Oriented)、集成的(Integrated)、相對穩定的(Non-Volatile)、反映歷史變化(Time Variant)的
    發表于 11-01 10:57 ?9436次閱讀

    數據倉庫解決方案的實施過程是什么?#數據倉庫 #光點科技

    數據倉庫
    光點科技
    發布于 :2023年06月19日 14:24:46

    數據之Hive數據倉庫

    數據 Hive數據倉庫
    發表于 03-19 11:10

    數據倉庫建模理論的詳細分析

    數據倉庫建模理論——實體關系(ER)建模理論
    發表于 07-12 08:41

    數據倉庫的概述以及創建步驟簡介

    數據倉庫(一)概述以及創建步驟簡介
    發表于 06-09 16:44

    多版本數據倉庫模型設計

    針對數據倉庫多維模式結構的進化問題提出一種多版本數據倉庫模型,給出模型結構、模型對象以及對象之間指派關系的定義。多版本數據倉庫基于“版本控制”策略管理數據倉庫
    發表于 04-21 09:39 ?0次下載

    電信數據倉庫設計

    本文針對佳木斯電信的業務需求,設計了佳木斯電信數據倉庫的總體架構,并以營業受理情況主題為例介紹了佳木斯電信數據倉庫數據模型的設計過程。
    發表于 12-18 17:01 ?14次下載

    OLAP在電信數據倉庫中的設計

    通過研究數據倉庫在電信業務中的應用,論述電信領域數據倉庫和部分聯機分析處理的設計開發過程。綜述數據倉庫模型、聯機分析處理(OLAP)模型、匯總表的設計以及開發中所要
    發表于 12-29 17:31 ?0次下載

    保護MySQL數據倉庫的最佳實踐

    數據倉庫中最常見的數據庫管理系統可能就是開源的MySQL數據庫。以下5個小技巧重點介紹了一些保護MySQL數據倉庫的最佳實踐。 1.限制訪問 確保MySQL
    發表于 09-27 14:10 ?0次下載

    數據倉庫是什么_數據倉庫的特點_數據倉庫數據庫區別

    本文開始介紹了數據倉庫是什么,其次詳細介紹了數據倉庫的特點、數據倉庫的基本架構與數據倉庫用途,最后介紹了數據倉庫的五大好處,闡述了
    的頭像 發表于 02-11 10:42 ?2.4w次閱讀
    <b class='flag-5'>數據倉庫</b>是什么_<b class='flag-5'>數據倉庫</b>的特點_<b class='flag-5'>數據倉庫</b>與<b class='flag-5'>數據</b>庫區別

    數據倉庫是什么_數據倉庫有什么特點_數據庫和數據倉庫區別分析

    數據倉庫是一個面向主題的、集成的、不可更新的、隨時間不斷變化的數據集合,它用于支持企業或組織的決策分析處理。數據倉庫是一個過程而不是一個項目。
    發表于 02-24 14:04 ?1.9w次閱讀
    <b class='flag-5'>數據倉庫</b>是什么_<b class='flag-5'>數據倉庫</b>有什么特點_<b class='flag-5'>數據</b>庫和<b class='flag-5'>數據倉庫</b>區別分析

    數據倉庫的模型設計

    本文詳細介紹了關于數據倉庫的模型設計,A. 數據建模方法論,B. 分層設計原則,C. 主題域設計方法。
    發表于 02-24 14:30 ?5728次閱讀
    <b class='flag-5'>數據倉庫</b>的模型設計

    如何搭建數據倉庫

    數據倉庫是所有產品的數據中心,公司體系下的所有產品產生的所有數據最終都流向數據倉庫,可以說數據倉庫不產生
    發表于 06-25 15:41 ?1985次閱讀

    數據數據倉庫應該如何建設

    互聯網行業,除了數據量大之外,業務時效性要求也很高,甚至很多是要求實時的,另外,互聯網行業的業務變化非???,不可能像傳統行業一樣,可以使用自頂向下的方法建立數據倉庫,一勞永逸,它要求新的業務很快能融入數據倉庫中來,老的下線的業務
    發表于 03-10 16:37 ?835次閱讀
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>