大數(shù)據(jù)可視化分析的步驟有哪些?

| 2022-09-16 admin

從技術(shù)上來說,大數(shù)據(jù)可視化的實施步驟主要有四項:需求分析,建設(shè)數(shù)據(jù)倉庫/數(shù)據(jù)集市模型,數(shù)據(jù)抽取、清洗、轉(zhuǎn)換、加載(ETL),建立可視化分析場景。

一、需求分析

需求分析是大數(shù)據(jù)可視化項目開展的前提,要描述項目背景與目的、業(yè)務(wù)目標(biāo)、業(yè)務(wù)范圍、業(yè)務(wù)需求和功能需求等內(nèi)容,明確實施單位對可視化的期望和需求。包括需要分析的主題、各主題可能查看的角度、需要發(fā)泄企業(yè)各方面的規(guī)律、用戶的需求等內(nèi)容。

二、建設(shè)數(shù)據(jù)倉庫/數(shù)據(jù)集市的模型

數(shù)據(jù)倉庫/數(shù)據(jù)集市的模型是在需求分析的基礎(chǔ)上建立起來的。數(shù)據(jù)倉庫/數(shù)據(jù)集市建模除了數(shù)據(jù)庫的ER建模和關(guān)系建模,還包括專門針對數(shù)據(jù)倉庫的維度建模技術(shù)。維度建模的關(guān)鍵在于明確下面四個問題:

1.哪些維度對主題分析有用?

2.如何使用現(xiàn)有數(shù)據(jù)生成維表?

3.用什么指標(biāo)來"度量"主題?

4.如何使用現(xiàn)有數(shù)據(jù)生成事實表?

三、數(shù)據(jù)抽取、清洗、轉(zhuǎn)換、加載(ETL)

數(shù)據(jù)抽取是指將數(shù)據(jù)倉庫/集市需要的數(shù)據(jù)從各個業(yè)務(wù)系統(tǒng)中抽離出來,因為每個業(yè)務(wù)系統(tǒng)的數(shù)據(jù)質(zhì)量不同,所以要對每個數(shù)據(jù)源建立不同的抽取程序,每個數(shù)據(jù)抽取流程都需要使用接口將元數(shù)據(jù)傳送到清洗和轉(zhuǎn)換階段。

數(shù)據(jù)清洗的目的是保證抽取的原數(shù)據(jù)的質(zhì)量符合數(shù)據(jù)倉庫/集市的要求并保持數(shù)據(jù)的一致性。

數(shù)據(jù)轉(zhuǎn)換是整個ETL過程的核心部分,主要是對原數(shù)據(jù)進行計算和放大。數(shù)據(jù)加載是按照數(shù)據(jù)倉庫/集市模型中各個實體之間的關(guān)系將數(shù)據(jù)加載到目標(biāo)表中。

四、建立可視化場景

建立可視化場景是對數(shù)據(jù)倉庫/集市中的數(shù)據(jù)進行分析處理的成果,用戶能夠借此從多個角度查看企業(yè)/單位的運營狀況,按照不同的主題和方式探查企業(yè)/單位業(yè)務(wù)內(nèi)容的核心數(shù)據(jù),從而作出更精準(zhǔn)的預(yù)測和判斷。