搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學(xué)習在線(xiàn)課程
觀(guān)看技術(shù)視頻
寫(xiě)文章/發(fā)帖/加入社區

會(huì )員中心

創(chuàng )作中心

發(fā)布

創(chuàng )作活動(dòng)

完善資料讓更多小伙伴認識你，還能領(lǐng)取20積分哦，立即完善>

3天內不再提示

數據庫發(fā)展史2--數據倉庫

回顧數據倉庫的發(fā)展歷程，大致可以將其分為幾個(gè)階段：萌芽探索到全企業(yè)集成時(shí)代、企業(yè)數據集成時(shí)代、混亂時(shí)代--"數據倉庫之父"間的論戰、理論模型確認時(shí)代以及數據倉庫產(chǎn)品百家爭鳴時(shí)代。

數據倉庫理論發(fā)展歷程

上世紀70年代，IBM的E.F.Codd等人提出關(guān)系型數據庫后，MIT的研究員提出單獨構建分析系統的基礎理論，新的理論試圖將業(yè)務(wù)處理系統和分析系統分開(kāi)，即將業(yè)務(wù)處理和分析處理分為不同層次，針對各自的特點(diǎn)采取不同的架構設計原則。他們認為這兩種信息處理的方式具有較大差別，應使用不同的架構和設計。但受限于當時(shí)的技術(shù)能力，這個(gè)研究?jì)H僅停留在理論層面。

到了80年代初，W.H.Inmon 開(kāi)始了“記錄系統”、“本原數據”、“決策支持數據庫”等專(zhuān)題的研究。幾乎同時(shí)，J. Martin在關(guān)于數據庫分類(lèi)的研究中，專(zhuān)指一種他稱(chēng)之為“第4類(lèi)數據庫”的“由用戶(hù)驅動(dòng)的計算環(huán)境”，為這種環(huán)境提供信息服務(wù)的是一種以“搜索和快速信息回收”為基本特征的數據庫。這個(gè)定義已經(jīng)和后來(lái)的數據倉庫十分類(lèi)似。

1988年，IBM 公司的研究員創(chuàng )造性地提出了一個(gè)新的概念--數據倉庫（Data Warehouse）。到了1991年，數據倉庫之父W.H.Inmon出版數據倉庫經(jīng)典作品--《構建數據庫倉庫》，標志著(zhù)數據倉庫概念的確立。書(shū)中指出，DW是一個(gè)面向主題的、集成的、相對穩定的、反映歷史變化的數據集合，并且是用于支持管理決策的數據集合。該書(shū)還提供了建立數據倉庫的指導意見(jiàn)和基本原則，憑借著(zhù)這本書(shū)，W.H.Inmon被稱(chēng)為數據倉庫之父。

pYYBAGMoGlaAejzxAAJKEfoIXlA271.png?source=d16d100b

由于傳統的關(guān)系型數據庫已無(wú)法滿(mǎn)足構建數據倉庫的需求，在1993年Codd提出了多維數據庫和多維分析的概念，即OLAP（On-Line Analysis Processing聯(lián)機分析處理）。當時(shí)Codd認為OLTP（On- Line Transaction Processing 聯(lián)機事務(wù)處理）已不能滿(mǎn)足終端用戶(hù)對數據庫查詢(xún)的需要，SQL對大數據庫進(jìn)行的簡(jiǎn)單查詢(xún)也不能滿(mǎn)足用戶(hù)分析的需求。用戶(hù)的決策分析需要對關(guān)系數據庫進(jìn)行大量計算才能得到結果，而查詢(xún)的結果并不能滿(mǎn)足決策者提出的需要。因此提出了多維數據庫和多維分析的概念，即OLAP。

1995年，Ralph Kimball出版了《數據倉庫工具箱》，數據倉庫行業(yè)進(jìn)入少林和武當之爭。Inmon主張建立數據倉庫時(shí)采用自上而下方式，以關(guān)系型數據庫的第3范式進(jìn)行數據倉庫模型設計，而Kimball則是主張自下而上的方式，力推數據集市（Data Market）建設。兩位數據倉庫領(lǐng)域的大咖為此吵得不可開(kāi)交，他們的粉絲也紛紛站隊，這種爭吵直到Inmon推出新的BI架構CIF，把Kimball的數據集市包括了進(jìn)來(lái)才算平息。

早期MPP時(shí)代的數倉

IBM DB2和Teradata是早期數倉理論的實(shí)踐者，也是市場(chǎng)領(lǐng)導者。其中Teradata是MPP數倉最成功的商業(yè)產(chǎn)品，幾乎是行業(yè)的天花板。誕生于1970年代末的Teradata公司，名稱(chēng)來(lái)源于Tera Bytes，TB數據的存儲也展示了哪個(gè)年代創(chuàng )業(yè)者的雄心壯志。終于在1992年第一個(gè)TB 級的數據庫在華爾街出現。1999年，客戶(hù)擁有130TB的數據分布于176個(gè)節點(diǎn)。短短7年時(shí)間，Teradata客戶(hù)的數據規模翻了176倍。

但進(jìn)入新千年后，數據庫巨頭間的競爭進(jìn)入白熱化階段，以Or acle Exadata為代表的一體機很快嶄露頭角。之后在Postgres基礎上演變而來(lái)的Greenplum構建了開(kāi)源的MPP架構數倉，也在市場(chǎng)中有很高的影響力。但真正讓數倉煥然一新的是云計算時(shí)代的云原生數倉Snowflake。

一體機時(shí)代的數倉

新千年后，數倉進(jìn)入一體機的快速發(fā)展時(shí)代，典型代表是Netezza、SAP HANA和Oracle Exadata。Netezza率先推出，后來(lái)被IBM收購。而Oracle Exadata為代表的一體機依然是今天Oracle公司的核心業(yè)務(wù)。2008年，Exadata V1誕生，由Oracle提供軟件惠普提供硬件，這一代產(chǎn)品僅支持數據倉庫和商務(wù)智能等OLAP工作。到了2009年9月，Exadata V2發(fā)布，采用了SUN的（此后MySQL也屬于了Oracle），次年Oracle完成了SUN的收購。在V2版本中，Exadata存儲節點(diǎn)中首次采用了Flash卡，從而可以同時(shí)支持OLAP和OLTP類(lèi)型的負載。有了高性能產(chǎn)品的同時(shí)也有了極其昂貴的價(jià)格。

著(zhù)名的Conor O'Mahony(DB2的市場(chǎng)經(jīng)理)羅列了使用一臺全機架系統(full-rack)Exdata V2所需的費用列表：

$1,150,000 硬件價(jià)格

$1,680,000 存儲服務(wù)器的軟件價(jià)格

$369,600 存儲服務(wù)器軟件支持和維護費用(以22%計)

$1,520,000 Oracle企業(yè)版軟件價(jià)格($47.5k*8 servers*8 cores*0.5 Intel core factor)

$736,000 Oracle RAC軟件價(jià)格($23k*8 servers*8 cores*0.5 Intel core factor)

$368,000 Oracle分區特性?xún)r(jià)格 ($11.5k*8 servers*8 cores*0.5 Intel core factor)

$368,000 Oracle高級壓縮(Advanced Compression) ($11.5k*8 servers*8 cores*0.5 Intel core factor)

$160,000 Oracle企業(yè)管理器診斷包(推薦安裝)

$160,000 Oracle企業(yè)管理器調優(yōu)包(推薦安裝)

$728,640 以上除去存儲服務(wù)器軟件的第一年軟件維護支持價(jià)格(以22%計)

Oracle Exadata 一體機

如此昂貴的價(jià)格，對于一般企業(yè)顯然無(wú)法接受。人們相信全新一代的數倉技術(shù)一定會(huì )在一個(gè)萬(wàn)眾囑目的情況下出現，像蓋世英雄身披金甲圣衣，腳踏七彩祥云而來(lái)。

云計算時(shí)代的數倉

隨著(zhù)移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)的蓬勃發(fā)展，率先掀起數據庫革命的是Google公司，他的三篇論文開(kāi)啟了大數據時(shí)代，之后言數倉、大數據必稱(chēng)Hadoop。但它的弊病也頗為明顯，昂貴、不方便使用、難維護等問(wèn)題始終無(wú)法很好的解決。直到計算機行業(yè)七彩祥云--云計算出現，為整個(gè)行業(yè)和人類(lèi)生活帶來(lái)巨大變化。而此時(shí)的數據倉庫在變更的前夜顯得異常安靜，古語(yǔ)言：三年不鳴一鳴驚人，Snowflake 就是三年不飛一飛沖天的云計算時(shí)代云原生數倉產(chǎn)品。

2012年，在Oracle公司工作十多年的2位程序員決心在云上建立一個(gè)數據倉庫，于是誕生了Snowflake公司。它誕生的第一天，就有云計算的特點(diǎn)：存儲與計算分離、按量付費、云中立。作為第一個(gè)基于云原生的數據倉庫，Snowflake 敏銳的抓住從本地到上云的時(shí)代趨勢，充分利用公有云強大基礎設施能力，讓用戶(hù)更加輕松實(shí)現跨云平臺、跨區域的方式移動(dòng)數據。這種基于云原生、云中立、跨多云平臺的云原生數據服務(wù)，為客戶(hù)提供巨大數據價(jià)值的同時(shí)，極大降低了客戶(hù)使用、維護、價(jià)格成本。

Snowflake產(chǎn)品上的成功同時(shí)也取得資本市場(chǎng)的巨大成功。2020年9月16日，在紐交所成功IPO，股神巴菲特斥幾億美元入股，交易首日股價(jià)翻倍市值達到704億美元，成為史上規模最大的軟件IPO，之后市值一度最高突破1200億美元，儼然成為資本市場(chǎng)的寵兒。

pYYBAGMoGleAW5YTAAKl91g7BFA139.png?source=d16d100b

數據倉庫和數據庫關(guān)系

廣義的數據倉庫并不是一項技術(shù)，也不是一個(gè)產(chǎn)品，而是一種數據處理過(guò)程。數據倉庫的數據來(lái)源有多種，業(yè)務(wù)系統、日志、互聯(lián)網(wǎng)、系統運行參數等等，這些數據可以在數據倉庫中進(jìn)行匯合，然后通過(guò)統一的建模，加工成服務(wù)與數據分析的數據模型，最終輔助企業(yè)分析決策。

那如何構建數據倉庫呢？常見(jiàn)的是使用OLAP數據庫（如近年流行Clickhouse）存儲數據，通過(guò)數據建模、ETL、數據可視化等一系列操作，這一過(guò)程被稱(chēng)為構建數據倉庫。由于數據倉庫基于OLAP產(chǎn)品，是做在線(xiàn)分析處理，這是與數據庫的本質(zhì)區別。另外，既然是數據倉庫就要加工數據，加工數據會(huì )耗時(shí)間，所以加工數據在實(shí)際的應用中又分為批處理和實(shí)時(shí)處理。而傳統的數據庫是為了解決事務(wù)存在的，他們的區別如下。

poYBAGMoGleAYd4LAAFB5LgC3oU291.png?source=d16d100b

總結和展望

數據倉庫是80~90年代提出的概念，互聯(lián)網(wǎng)企業(yè)為了解決更大數據量的管理問(wèn)題，掀起了大數據技術(shù)新浪潮，大數據已經(jīng)跳出了數倉定義領(lǐng)域，未來(lái)再專(zhuān)題闡述。隨著(zhù)2020年云原生數倉Snowflake上市并取得巨大的成功，大家開(kāi)始趨向把數據倉庫、大數據、數據湖、云存儲的技術(shù)全面融合，全世界掀起了云原生數據倉庫和湖倉一體的熱潮，國際上Databricks、Clickhouse已經(jīng)正面PK，國內有SequoiaDB、MaxCompute，AnalyticDB，GaussDB(DWS)，OuShuDB、StarRocks、SelectDB、HashData等不下數十款產(chǎn)品，還有很多類(lèi)似HTAP新品在路上，未來(lái)必將迎來(lái)百倉大戰的腥風(fēng)血雨。

數據倉庫發(fā)展史

pYYBAGMoGliAJ75cAAYGxvkxBa8865.png?source=d16d100b

審核編輯黃昊宇

聲明：本文內容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權轉載。文章觀(guān)點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習之用，如有內容侵權或者其他違規問(wèn)題，請聯(lián)系本站處理。舉報投訴

數據庫

數據庫

+關(guān)注

關(guān)注
7

文章
3628

瀏覽量
63690

評論

相關(guān)推薦

什么是數據湖？數據湖和數據倉庫有什么區別？

從本質(zhì)上說(shuō)，數據湖就是一個(gè)信息資源庫。人們常常將數據湖與數據倉庫混為一談，但兩者在架構和滿(mǎn)足的業(yè)務(wù)需求上都不一樣。尤其是，隨著(zhù)社交媒體數據、物聯(lián)網(wǎng)機器

的頭像

發(fā)表于 05-20 12:38 ?155次閱讀

什么是<b class='flag-5'>數據</b>湖？<b class='flag-5'>數據</b>湖和<b class='flag-5'>數據倉庫</b>有什么區別？

數據中臺、數據倉庫、數據治理與主數據的定位與差異

在數字化時(shí)代，大數據已經(jīng)成為企業(yè)運營(yíng)和決策的重要資產(chǎn)。為了更好地管理和利用這些數據，數據中臺、數據倉庫、數據治理和主

的頭像

發(fā)表于 05-08 10:40 ?165次閱讀

?通過(guò)Modbus讀寫(xiě)數據庫中的數據

本文是將數據庫的數據轉為Modbus服務(wù)端/從站，實(shí)現數據庫內的數據也可以走M(jìn)odbus協(xié)議通過(guò)網(wǎng)口或串口讀寫(xiě)的案例，下圖是通過(guò)智能網(wǎng)關(guān)的參數軟件(在附件中)配置的參數：上圖中的配置

發(fā)表于 03-14 13:44

構建高效數據生態(tài)：數據庫、數據倉庫、數據湖、大數據平臺與數據中臺解析_光點(diǎn)科技

在數字化的浪潮中，一套高效的數據管理系統是企業(yè)競爭力的核心。從傳統的數據庫到現代的數據中臺，每一種技術(shù)都在數據的旅程中扮演著(zhù)關(guān)鍵角色。本文將深入探討

發(fā)表于 01-17 10:20 ?163次閱讀

元件數據庫

軟件可以識別設備的元件數據庫就好了，我們公司的機器數據都是用物料編碼建立的

發(fā)表于 11-16 14:39

如何在HarmonyOS對數據庫進(jìn)行備份，恢復與加密

。 (2) 配置數據庫參數。 (3) 創(chuàng )建kvStore。 import distributedKVStore from \'@ohos.data.distributedKVStore\'; let

發(fā)表于 11-07 08:57

數據倉庫的發(fā)展(2)#Python

數據函數感知算法python

未來(lái)加油dz
發(fā)布于 :2023年08月23日 19:46:06

數據倉庫概述及特點(diǎn)

數據庫已經(jīng)在信息技術(shù)領(lǐng)域有了廣泛的應用，我們社會(huì )生活的各個(gè)部門(mén)，幾乎都有各種各樣的數據庫保存著(zhù)與我們的生活息息相關(guān)的各種數據。作為數據庫的一個(gè)分支，

發(fā)表于 08-11 14:33 ?3246次閱讀

加速Oracle數據倉庫 Emulex和博科第6代光纖通道

電子發(fā)燒友網(wǎng)站提供《加速Oracle數據倉庫 Emulex和博科第6代光纖通道.pdf》資料免費下載

發(fā)表于 08-03 10:20 ?0次下載

數據庫設計-數據庫的基本概念(2)#數據庫

數據庫

未來(lái)加油dz
發(fā)布于 :2023年07月18日 17:56:21

數據庫的數據模型設計(2)#數據庫

數據庫

未來(lái)加油dz
發(fā)布于 :2023年07月18日 17:54:39

如何提高數據倉庫的性能及優(yōu)化設計

　　隨著(zhù)數據倉庫規模的擴大，數據倉庫的性能問(wèn)題就顯得越來(lái)越突出，如何提高數據倉庫的性能，除了在設計階段對其邏輯結構和物理結構進(jìn)行優(yōu)化設計外；還可以在數據倉庫運行階段，采取一些優(yōu)化措施來(lái)

發(fā)表于 07-18 16:10 ?0次下載

數據庫使用介紹(2)#數據庫

數據庫

學(xué)習硬聲知識
發(fā)布于 :2023年07月13日 20:29:10

數據倉庫解決方案的實(shí)施過(guò)程是什么？#數據倉庫 #光點(diǎn)科技

數據倉庫

光點(diǎn)科技
發(fā)布于 :2023年06月19日 14:24:46

什么是數據倉庫解決方案？#數據倉庫 #光點(diǎn)科技

數據

光點(diǎn)科技
發(fā)布于 :2023年06月19日 10:27:00

精選推薦
更多

文章

資料

帖子

TSMaster 的 CAN UDS 診斷操作指南（下）

上海同星智能科技有限公司
1小時(shí)前

37 閱讀

瑞薩雙通道同步升壓控制器ISL81805調試經(jīng)驗分享及總結

駿龍電子
15小時(shí)前

558 閱讀

RL78/F24 CANFD參考例程

瑞薩MCU小百科
18小時(shí)前

320 閱讀

如何移植libwebsockets

ElfBoard
20小時(shí)前

430 閱讀

使用理想二極管控制器的汽車(chē)應用冗余電源拓撲

德州儀器
22小時(shí)前

442 閱讀

多媒體音頻LITE組件的教程案例

姚小熊27
0.12 MB

免費

1下載

WebAssembly Design Documents設計文檔

名士流
0.10 MB

免費

0下載

Go語(yǔ)言的視頻語(yǔ)音教程

劉軍
0.02 MB

2積分

2下載

HVM大規模并行功能運行時(shí)

劉英
0.27 MB

2積分

2下載

使用Arduino的非接觸式紅外溫度傳感器

費加羅
0.05 MB

2積分

3下載

FPGA 高級設計：時(shí)序分析和收斂

FPGA技術(shù)江湖
1天前

170 閱讀

為什么我的電源會(huì )出現振鈴和過(guò)熱？

久醉不醒
1天前

333 閱讀

無(wú)線(xiàn)鼠標主板，可以自己照著(zhù)做嗎？

angel725
2天前

640 閱讀

【Vision Board創(chuàng )客營(yíng)連載體驗】基于Vision Board的垃圾分類(lèi)

大菠蘿Alpha
2天前

333 閱讀

【Vision Board創(chuàng )客營(yíng)連載體驗】使用 Vision Board 做一個(gè) UVC Camera

ouxiaolong
3天前

319 閱讀

推薦專(zhuān)欄
更多

華秋（原“華強聚豐”）：

電子發(fā)燒友

華秋開(kāi)發(fā)

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網(wǎng)站地圖

設計技術(shù)

可編程邏輯

電源/新能源

MEMS/傳感技術(shù)

測量?jì)x表

嵌入式技術(shù)

制造/封裝

模擬技術(shù)

RF/無(wú)線(xiàn)

接口/總線(xiàn)/驅動(dòng)

處理器/DSP

EDA/IC設計

存儲技術(shù)

光電顯示

EMC/EMI設計

連接器

行業(yè)應用

LEDs

汽車(chē)電子

音視頻及家電

通信網(wǎng)絡(luò )

醫療電子

人工智能

虛擬現實(shí)

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動(dòng)通信

工業(yè)控制

便攜設備

觸控感測

物聯(lián)網(wǎng)

智能電網(wǎng)

區塊鏈

新科技

特色內容

專(zhuān)欄推薦

學(xué)院

設計資源

設計技術(shù)

電子百科

電子視頻

元器件知識

工具箱

VIP會(huì )員

最新技術(shù)文章

社區

小組

論壇

問(wèn)答

評測試用

企業(yè)服務(wù)

產(chǎn)品

資料

文章

方案

企業(yè)

供應鏈服務(wù)

硬件開(kāi)發(fā)

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務(wù)

網(wǎng)站廣告

在線(xiàn)研討會(huì )

活動(dòng)策劃

新聞發(fā)布

新品發(fā)布

小測驗

設計大賽

華秋

關(guān)于我們

投資關(guān)系

新聞動(dòng)態(tài)

加入我們

聯(lián)系我們

舉報投訴

社交網(wǎng)絡(luò )

微博

移動(dòng)端

發(fā)燒友APP

硬聲APP

WAP

聯(lián)系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務(wù) PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關(guān)注我們的微信

下載發(fā)燒友APP

電子發(fā)燒友觀(guān)察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡(jiǎn)介

企業(yè)動(dòng)態(tài)

聯(lián)系我們

企業(yè)文化

企業(yè)宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發(fā)燒友 （電路圖） 湘公網(wǎng)安備43011202000918 電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證：合字B2-20210191 工商網(wǎng)監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看