一節學習了數據倉庫,這一節學習數據集市。數據倉庫與數據集市是什么關系呢?不同的專家有不同的認識和爭論。嚴謹說,我們放棄爭論,求同存異。他比喻說,數據倉庫就像商超的倉庫,數據集市就像商超的分類柜臺。前一個包羅萬象,后一個按需索取。
什么是數據集市?數據集市也叫數據市場,是滿足特定的部門或者用戶的需求,按照多維的方式進行存儲,生成面向分析需求的數據立方體。
多數情況下,可以理解為,數據集市是數據倉庫的分類“店鋪”。數據集市比數據倉庫小得多,它可以容納幾十千兆,數據倉庫卻可以存儲幾百千兆到PB級數據。
從數據集市與數據倉庫的關系來看,數據集市可分為兩大類型:
一是獨立型數據集市。數據來自于操作型數據庫。它的開發周期較短,具有靈活性,但是脫離了數據倉庫,獨立建立的數據集市可能會導致信息孤島。
二是從屬型數據集市。數據來自于數據倉庫,這就導致開發周期長,但是它比獨立型數據集市更穩定,可以提高數據分析質量,保證數據的一致性。
著名專家恩門說:不可能將大海里的小魚堆在一起來構成一頭大鯨魚。從長遠角度看,從屬型數據集市更加統一和穩定,是未來建設的主要方向。