您好,登錄后才能下訂單哦!
本文主要給大家簡單講講什么是mysql多維數據倉庫,相關專業術語大家可以上網查查或者找一些相關書籍補充一下,這里就不涉獵了,我們就直奔主題吧,希望什么是mysql多維數據倉庫這篇文章可以給大家帶來一些實際幫助。
數據倉庫可以通過集成各種多樣的數據實現信息的統一,這些數據來源包括現行的事務操作和管理信息系統,以及外部各種信息源。這些源數據將被整合,清洗,轉換,如果需要直接從這些數據來源讀取數據的話,該數據將會在數據倉庫中以更有利于操作的方式存儲。
數據倉庫的數據構造方式使你可以存儲當前和歷史的數據。當前數據是實際事務操作活動必要的,一般是定期的硬拷貝(比如打印出的報表)或者是聯機報表。而歷史數據,往往不是那么容易利用,可以提供基于時間點分析的商業信息,比如:追蹤、推論分析,以及對比,這些對于長期計劃和戰略性的市場決策都是很重要的。
如何從多個信息源整合信息,定期積聚存儲,有效的需求設計和發展技術,所有這些都和事務型管理信息系統所應用的技術有很大的不同。本書都是關于數據倉庫的設計和開發技術,它涵蓋了大部分建立數據倉庫所涉及到的大部分技術問題。更為重要的是,本書提供了一個易懂的操作指南,便于開發一個實際的數據倉庫。
本書的適用范圍
mysql多維數據倉庫指南是一個實戰的書籍。你將使用mysql數據庫,但該書不是關于mysql的。本書不涉及任何硬件架構方面的問題。
本書主要關心數據倉庫的設計和開發技術。它不涉及開發項目的管理,理論,以及如何領導開發等相關的技術問題。
本書用一個數據倉庫開發的例子來展示技術如何應用。提供數據模型和sql腳本,將能夠適用于實際的數據倉庫開發。這些腳本已經在Windows xp professional sp2 平臺上用mysql 5。0。21 版本測試通過。
另外,本書不再對以下的幾個主題進行特別的論述:
數據倉庫的概念
Sql
MySQL數據庫
適合閱讀本書的人:
數據倉庫應用于各種組織和商業機構,從政府部門,非盈利組織到學校,從制造業到零售店,從金融機構到醫療機構,從傳統公司到互聯網商家。
本書首先面向數據倉庫開發人員。但是,it 經理和其他it職業,特別是那些對mis(經營報告)和dss(決策支撐應用)感興趣的人將發現本書同樣有用。總的說來,本書是給那些為分析應用準備數據工作相關的人,以及那些需要遞交信息的人,比如打印報表,聯機報表。
本書同樣適用于那些數據倉庫初學者。它將直接快速的為那些正在準備開發他們第一個數據倉庫的人提供幫助。
教師和學生可以將該書作為教科書,以便于明確他們對于數據倉庫原理,概念的理解。大部分章節可以被定制用于實驗練習。
預備的技能
本書不是面向it新人,為了更有效的利用本書,讀者必須有一些系統開發經驗。但是,不要求先有數據倉庫的建設經驗。
需要實踐操作本書例子的人需要有rdbms(關系數據庫管理系統)和sql的實際操作技能。
你可以從本書得到
你將可以僅僅用一個示例,一個最先存儲商業銷售相關數據的數據倉庫,并且進行實踐操作,就可以磨練你的數據倉庫知識和實際技能。該示例是一個精簡版的實際數據倉庫,可以在很多種商業類型中找到它的原型。
你將基于mysql數據庫用本書介紹的技術一步步的開發該示例中銷售相關數據倉庫。這些技術是在通常數據倉庫開發中將碰到的問題的分解技巧。通過完成本文的學習并且完成所有的練習,你將獲得相關工作經驗并可以為負責第一個實際數據倉庫項目做好準備。
章節總覽
本書包含25個章節和一個附錄。所有章節組織為四個部分。第一部分涵蓋數據倉庫基礎。第二部分描述從原始數據到數據倉庫的遷移。第三部分討論如何控制數據倉庫的發展演化。第四部分涉及到一些高級的多維技術。接下來的部分將給出每個章節的預覽。
第一篇 基本原理
第一篇,涵蓋多維數據倉庫的基礎原理,有四個章節。
第1章,“基本組成”,介紹星型模式(一種數據庫模式,有一個事實表,周圍圍繞著多個維表)以及解釋該模式的基本組成。
第2章,”維度歷史“ 介紹用代理健來維護維成員的歷史記錄。
第3章,“度量可加性”,包含維度數據倉庫中最重要的特性之一,也就是存儲在數據倉庫事實表中的度量的可加性。
第4章,“維度查詢”,介紹最適合應用于星型模式的一種sql查詢,維度查詢可以用來證明一個維度數據倉庫是否具備兩個最基本的設計指標:簡單和高效。
第二篇: 提取、轉換和加載
該篇的所有5個章節涉及了數據集成,事實表,維表。
第5章,“源數據提取”介紹了不同類型數據的提取。
第6章“導入時間維”涵蓋了三種最通用的加載時間維的技術。
第7章 “初始化導入“和第8章,“定期導入”涉及到兩種類型的導入技術,初始化和周期性。
第9章,“周期導入計劃”,作為第二篇的總結,提供一個進階式的指導,關于如何利用Windows的任務管理器實現定期導入計劃。
第三篇:成長
第三篇介紹了不同的處理技術,這些技術主要處理一個成功的多維數據倉庫成長過程中碰到的相關問題。該部分有十個章節。
第10章,“增加字段”討論關于向現有數據倉庫中的表增加一個字段的技術問題。
第11章,“按需載入”涉及按需載入的技術。
第12章,“維表子集”,介紹相關技術以幫助用戶處理維表子集問題。
第13章,“維度角色扮演”,關于在一個事實表中多次使用同一個維度的問題。
第14章,“快照”讓你在需要作出匯總數據的時候,能提供快速性能的查詢。
第15章,“唯度層次”和第16章“多路徑和不齊整的維度層次”是關于簡單和多路徑維度技術,相應的,這些技術幫助人們進行匯聚和鉆取分析。
第17章,“維度退化”,展示了如何用維度退化技術去減少一個數據倉庫模式的復雜性。
第18章,“垃圾維”,是關于垃圾維的技術,即將表面上不相關的但是經常會被用戶進行要求分析的數據,用維的方式組織起來。
第19章,“多星型模式”展示了如何在模式中增加多個星型模式。
第四篇:高級技術
包含六個章節。
第20章,“不齊整數據源”,介紹如何在數據倉庫中處理那些結構無法直接映射到目標表的數據源。
第21章,“無事實的事實表”,幫助你為客戶建立一種可供分析的輔助數據,一種無事實字段的事實表,該數據無法從數據源直接取得度量。
第22章,“遲來的事實”,包含一個技術,用于處理當數據源中某個特殊的事實沒有在計劃載入時間之前產生的情況。
第23章,“外部數據源和維度合并“,包括兩個主題:處理外部數據源和如何將多個維中分散的屬性合并到一個維的技術。
第24章,“累積度量”,討論兩個相關的問題:計算度量和累積度量的不可相加性。
第25章,“分段維度”,闡述一種技術,可以幫助使用者針對那些有連續值的屬性進行數據分析。
附錄
附錄a,“格式文件數據源”,介紹如何使用本書例子中的格式文件數據源。
將Mysql這個最流行的開源數據庫軟件進行數據倉庫應用,在本書之前還從來沒有被在創建多維數據倉庫方面用這種入門指南的方式進行介紹。主題包括 星型模式建模,數據載入(數據的提取、轉換和加載:etl),測試檢驗,以及多維查詢。本書由始至終應用一個可實踐,相對精簡的真實的項目。其全面,易于接受的寫作形式使得那些需要建立數據倉庫的程序員可以得到相關的示例和資料。
什么是mysql多維數據倉庫就先給大家講到這里,對于其它相關問題大家想要了解的可以持續關注我們的行業資訊。我們的板塊內容每天都會捕捉一些行業新聞及專業知識分享給大家的。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。