您好,登錄后才能下訂單哦!
這篇文章主要介紹選擇mongodb的原因,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!
在使用場景方面,MongoDB非常適合用做以下應用程序的主要數據存儲——Web應用程序、分析與記錄應用程序,以及任何要求有中等級別緩存的應用程序。此外,由于能方便地存儲無Schema數據,MongoDB還很適合保存事先無法知曉其數據結構的數據。
之前所說的內容還不太足以讓人信服,為了證實它們,我們大致了解一下目前市面上的眾多數據庫,并和MongoDB做個對比。接下來,我將討論一些特殊的MongoDB使用場景,提供一些生產環境中的例子。最后,我還會討論一些MongoDB實際使用中的重要注意事項。
MongoDB與其他數據庫的對比
市面上的數據庫數量成爆炸式增長,要在它們之間進行權衡是很困難的。幸運的是,它們之中的大多數數據庫都能歸在幾個分類里。本節中,我會描述簡單及復雜的鍵值存儲、關系型數據庫和文檔數據庫,并對它們做一個比較。
推薦學習《python教程》
簡單鍵值存儲
簡單鍵值存儲正如其名,它們基于給定的鍵對值做索引。常見的場景是緩存。舉例來說,假設您需要緩存一個由應用程序呈現的HTML頁面,此處的鍵可能是頁面的URL,值是HTML本身。請注意,對鍵值存儲而言,值就是一個不透明的字節數組。不用強加關系型數據庫中的Schema,也沒有任何數據類型的概念。這自然限制了鍵值存儲的操作:可以放入一個新值,然后通過鍵將其取出或刪除。擁有如此簡單性的系統通常很快,而且具有可伸縮性。
最著名的簡單鍵值存儲是memcached(發音是mem-cach-dee)。memcached僅在內存里存儲數據,用持久性來換取速度。它也是分布式的,跨多臺服務器的memcached節點能像單個數據存儲來使用,這消除了維護跨服務器緩存狀態的復雜性。
與MongoDB相比,memcached這樣的簡單鍵值存儲通常讀寫會更快。但與MongoDB不同的是,這些系統很少能充當主要數據存儲。簡單鍵值存儲的最佳用途是附加存儲,既可以作為傳統數據庫之上的緩存層,也可以作為任務隊列之類的短暫服務的簡單持久層。
復雜鍵值存儲
可以改進簡單鍵值模型來處理復雜的讀寫Schema或提供更豐富的數據模型。如此一來,就有了復雜鍵值存儲。廣為流傳的論文 Dynamo:Amazon's Highly Available Key-value Store中描述的Amazon Dynamo就是這樣一個例子。Dynamo旨在成為一個健壯的數據庫,在網絡故障、數據中心停轉及類似情況下仍能工作。這要求系統總是能夠進行讀和寫,本質上就是要求數據能自動跨多個節點進行復制。如果一個節點發生故障,系統的用戶,也許這里是一個使用Amazon購物車的顧客,不會察覺到服務中斷。當系統允許同一份數據被寫到多個節點時,發生沖突的情況是不可避免的,Dynamo提供了一些解決沖突的方法。與此同時,Dynamo也很容易伸縮。因為沒有主節點——所有節點都是對等的,很容易從整體上理解系統,能方便地添加節點。盡管Dynamo是一個私有系統,但其構建理念啟發了很多NoSQL系統,包括Cassandra、Project Voldemort和Riak。
看看是誰開發了這些復雜鍵值存儲,看看實踐中它們的使用情況如何,您就能知道它們的優點了。以Cassandra為例,它實現了很多Dynamo的伸縮屬性,同時還提供了與Google BigTable類似的面向列的數據模型。Cassandra是一款開源的數據存儲,是Facebook為其收件箱搜索功能而開發的。該系統可以水平擴展,索引60TB以上的收件箱數據,允許在收件箱中對關鍵字和收件人做檢索。數據是根據用戶ID做索引的,每條記錄由一個用于關鍵字檢索的搜索項數組和一個用于收件人檢索的收件人ID數組構成。
這些復雜鍵值存儲是由Amazon、Google和Facebook這樣的大型互聯網公司開發的,用來管理系統的多個部分,擁有非常大的數據量。換言之,復雜鍵值存儲管理了一個相對自包含的域,它對有效存儲和可用性有一定要求。由于采用了無主節點的架構,這些系統能輕松地通過添加節點進行擴展。它們都選擇了最終一致性,也就是說讀請求不必返回最后一次寫的內容。用戶用較弱的一致性所換得的是在某一節點失效時仍能寫入的能力。
這與MongoDB正好相反,它提供了強一致性、(每個分片)一個主節點、更豐富的數據模型,還有二級索引,最后兩項特性總是一起出現的。如果一個系統允許建模多個領域對象,例如,構建完整Web應用程序時就會有此要求,那么查詢就需要跨整個數據模型,這時就要用到二級索引了。
因為有豐富的數據模型,可以考慮把MongoDB作為更通用的大型、可伸縮Web應用程序的解決方案。MongoDB的伸縮架構有時也會受到爭議,因為它并非源自Dynamo。但MongoDB針對不同領域有不同的伸縮解決方案。MongoDB的自動分片受到了Yahoo! PNUTS數據存儲和Google BigTable的啟發。讀過這些數據存儲的白皮書的人會發現,MongoDB實現伸縮的方法已經被實現了,而且還很成功。
關系型數據庫
本章中已經介紹了不少關系型數據庫的內容,簡單起見,我只討論RDBMS與MongoDB的相同點和不同點。盡管MySQL使用固定Schema的數據表,MongoDB使用無Schema的文檔,但兩者都能表示豐富的數據模型。MySQL和MongoDB都支持B樹索引,那些適用于MySQL索引的經驗也同樣適用于MongoDB。MySQL支持關聯和事務,因此,如果您必須使用SQL或者要求有事務,那么只能選擇MySQL或其他RDBMS。在不需要事務的情況下,MongoDB的文檔模型通常也足夠表示對象了。MongoDB中對單獨文檔的更新也是原子的,這提供了傳統事務的一個子集。MongoDB和MySQL都支持復制。就可伸縮性而言,MongoDB設計成能水平擴展的,能自動分片并處理故障轉移。MySQL上的分片都需要手動管理,有一定的復雜性,更常見的是垂直擴展的MySQL系統。
文檔數據庫
自稱為文檔數據庫的產品還不多,在本書編寫時,除了MongoDB之外,唯一的著名文檔型數據庫就是Apache CouchDB。盡管CouchDB的數據是使用JSON格式的純文本存儲的,而MongoDB使用的是BSON二進制格式,但兩者的文檔模型是相似的。與MongoDB一樣,CouchDB也支持二級索引,不同之處是CouchDB中的索引是通過編寫MapReduce函數來定義的,這比MySQL和MongoDB使用的聲明式語法更復雜一些。兩者伸縮的方式也有所不同,CouchDB不會把數據分散到多臺服務器上,每個CouchDB節點都是其他節點的完整副本。
使用場景和生產部署
老實說,您不會僅根據數據庫的特性就做出選擇,您需要知道使用它的真實成功案例。這里,我提供一些廣義上的MongoDB使用場景,以及一些生產環境中的范例。
Web應用程序
MongoDB很適合作為Web應用程序的主要數據存儲。就算是一個簡單的Web應用程序也會有很多數據模型,用來管理用戶、會話、應用特定的數據、上傳和權限,更不用說完整領域了。正如它們能和關系型數據庫的扁平式方法對齊一樣,它們也能獲益于MongoDB的集合與文檔模型。因為文檔能表示豐富的數據結構,建模相同數據所需的集合數量通常會比使用完全正規化關系型模型的數據表數量要少。此外,動態查詢和二級索引能讓您輕松地實現SQL開發者所熟悉的大多數查詢。最后,作為一個成長中的Web應用程序,MongoDB提供了清晰的擴展路線。
在生產環境中,MongoDB已經證明它能管理應用的方方面面,從主要數據領域到附加數據存儲,比如日志和實時分析。這里的案例來自The Business Insider(TBE),它從2008年1月起使用MongoDB作為主要數據存儲。雖然TBE是一個新聞網站,但它流量很大,每天有超過一百萬獨立頁面訪問(page view)。這個案例中有意思的是除了處理站點的主要內容(文章、評論、用戶等等),MongoDB還處理并存儲實時分析數據。這些分析被TBE用于生成動態熱點地圖,標明不同新聞故事的點擊率。該站目前還沒有太多的數據需要分片,但它有使用副本集來保證自動故障轉移。
敏捷開發
無論如何看待敏捷開發運動,您都很難否認大家對于快速構建應用程序的渴望。不少開發團隊,包括Shutterfly和紐約時代的團隊,都部分選擇了MongoDB,因為相比關系型數據庫,使用MongoDB他們能更快地開發應用程序。一個明顯的原因是MongoDB沒有固定的Schema,所有花在提交、溝通和實施Schema變更的時間都省下來了。
除此之外,不再需要花時間把數據的關系型表述硬塞進面向對象的數據模型里去了,也不用處理ORM生成的SQL的奇怪行為,或者對它做優化了。如此一來,MongoDB為項目帶來了更短的開發周期和敏捷的、中型大小的團隊。
分析和日志
我之前已經暗示過MongoDB適用于分析和日志,將MongoDB用于這些方面的應用程序數量增長得越來越快。通常,發展成熟的公司都會選擇用于分析的特殊應用作為切入點,進入MongoDB的世界。這些公司包括GitHub、Disqus、Justin.tv和Gilt Groupe,還有其他公司就不再列舉了。
MongoDB與分析的關聯源自于它的速度和兩個關鍵特性:目標原子更新和固定集合(capped collection)。原子更新讓客戶端能高效地增加計數器,將值放入數組。固定集合,常被用于日志,特點是分配的大小是固定的,能實現自動過期。相比文件系統,將日志數據保存在數據庫里更易組織,而且能提供更強大的查詢能力。現在,拋開grep或自定義日志檢索工具,用戶可以使用他們熟悉并喜歡的MongoDB查詢語言來查看日志輸出。
緩存
這是一種數據模型,它能更完整地表示對象,結合了更快的平均查詢速度,經常讓MongoDB介于傳統的MySQL與memcached之間。例如之前提到的TBE,它不使用memcached,直接通過MongoDB來響應頁面請求。
以上是選擇mongodb的原因的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。