隨著企業(yè)收集的數(shù)據(jù)比以往任何時(shí)候都多,有效管理、集成和訪問這些數(shù)據(jù)的能力變得至關(guān)重要。兩種主要方法主導(dǎo)了這個(gè)領(lǐng)域:提取、轉(zhuǎn)換和加載(ETL) 以及提取、加載和轉(zhuǎn)換(ELT)。兩者都有相同的核心目的,即將數(shù)據(jù)從不同來源轉(zhuǎn)移到中央存儲庫中進(jìn)行分析,但它們的實(shí)現(xiàn)方式不同。了解差異、相似之處和適當(dāng)?shù)挠美峭晟茢?shù)據(jù)集成和可訪問性實(shí)踐的關(guān)鍵。
大數(shù)據(jù)的系統(tǒng)架構(gòu)設(shè)計(jì)主要包含3個(gè)方面ETL設(shè)計(jì)、ODS層、OLAP(聯(lián)機(jī)分析處理),重點(diǎn)對ETL和OLAP進(jìn)行分析:
Atitit etl之道 attilax著?1. ETL 11.1. (數(shù)據(jù)倉庫技術(shù)) 21.2. ETL的質(zhì)量問題具體表現(xiàn)為正確性、完整性、一致性、完備性、有效性、時(shí)效性和可獲取性等幾個(gè)特性 22.
Atitit etl之道 attilax著?1. ETL 11.1. (數(shù)據(jù)倉庫技術(shù)) 21.2. ETL的質(zhì)量問題具體表現(xiàn)為正確性、完整性、一致性、完備性、有效性、時(shí)效性和可獲取性等幾個(gè)特性 22.