Vertica 數(shù)據(jù)庫與 Cassandra 相比有什么優(yōu)勢？

分類: 為什么 常識(shí)詞典 編輯 : 常識(shí) 發(fā)布 : 09-30

閱讀 :400

Vertica 數(shù)據(jù)庫與 Cassandra 相比有什么優(yōu)勢？Vertica 是傳統(tǒng)關(guān)系型數(shù)據(jù)庫么？首先它也是基于列的，除了沒有 HDFS 之外，它跟 HBase 或者是 Cassandra 有什么區(qū)別？-L 接口慢慢大家都會(huì)有。我個(gè)人覺得 No-L 這種提法本身就有問題，實(shí)現(xiàn)部分 -L 的 Vertica 不能算傳統(tǒng)關(guān)系型數(shù)據(jù)庫。稱為 Column-based 數(shù)據(jù)庫比較合適。HBase、Cassandra 等都屬于該范疇。但 Vertica 比較特殊，沒用 HDFS 這種分布式文件系統(tǒng)。它自己用本地文件系統(tǒng)通過 spread 通信。我比較關(guān)心執(zhí)行效率問題。個(gè)人認(rèn)為 No-L 和 -L 的比較主要是開發(fā)人員使用體驗(yàn)，對(duì)實(shí)際數(shù)據(jù)處理效率沒有實(shí)際意義，傳統(tǒng)關(guān)系型數(shù)據(jù)庫修改數(shù)據(jù)很快適合 OLTP，但不適合海量數(shù)據(jù)查詢分析。但對(duì)于 OLAP 來說，更多的關(guān)心執(zhí)行效率。Vertica 在數(shù)據(jù)插入上比較慢，但查詢快，所以要比較 OLAP。2 個(gè)答案

答案 1：

你把vertica寫成virtica了，我先幫你糾正過來。vertica是傳統(tǒng)的關(guān)系型數(shù)據(jù)庫，特點(diǎn)是按列存儲(chǔ)，而且集成了MapReduce支持。Cassandra則是屬于No-L陣營，特點(diǎn)是綜合Dynamo的弱一致性模型和Bigtable的數(shù)據(jù)模型。它們的比較其實(shí)就相當(dāng)于這兩個(gè)陣營的對(duì)比了，這方面文章不要太多。那么很顯然，vertica最大的優(yōu)勢就是它提供了-L的支持，可以很好的兼容以往的工具和數(shù)據(jù)，習(xí)慣-L的程序員用起來也爽。傳統(tǒng)的-L語義在高可伸縮性要求下很難實(shí)現(xiàn)，如join等操作。你可以設(shè)想一下，如果要join的表都非常大，超出單臺(tái)機(jī)器的處理能力，要高效地完成這個(gè)操作該有多困難。事實(shí)上這方面已經(jīng)有很多學(xué)術(shù)研究在進(jìn)行。傳統(tǒng)的數(shù)據(jù)庫除了-L語義外，還要保證transaction的ACID，而要同時(shí)滿足高一致性和事務(wù)操作的要求是很難實(shí)現(xiàn)高可伸縮性的。因而才會(huì)有No-L的出現(xiàn)，它們犧牲了部分-L和事務(wù)的語義、降低一致性要求，以實(shí)現(xiàn)高可伸縮性的系統(tǒng)。Vertica的底層存儲(chǔ)實(shí)現(xiàn)和HBase的不一樣。雖然都是叫按列存儲(chǔ)，HBase是先將表格按行劃分成塊，在數(shù)據(jù)塊-才是按列存儲(chǔ)；Vertica的存儲(chǔ)比較靈活，它號(hào)稱可以配置哪些列要放在一起存儲(chǔ)，每列都分開就是最基本的按列存儲(chǔ)，所有列都和在一起就是按行存儲(chǔ)了，不過同一列的數(shù)據(jù)還是會(huì)放在一起。所以按列或者按行存儲(chǔ)只是不同的系統(tǒng)設(shè)計(jì)選擇，不是決定性因素。關(guān)鍵還是在于對(duì)上層提供的語義。你如果關(guān)心的是執(zhí)行效率，推薦你一篇-.cse.nd.edu/~dt-ain/courses/cse40771/spring2010/benc--rks-sigmod09.pdfHBase，Cassandra本身只有存儲(chǔ)能力，如果要做查詢需要借助Hadoop這樣的框架進(jìn)行，Hive就是把查詢都編譯成Hadoop任務(wù)實(shí)現(xiàn)的。Hadoop的查詢效率要比關(guān)系型數(shù)據(jù)庫要低，主要是因?yàn)?）Hadoop為了保證容錯(cuò)，中間數(shù)據(jù)都要走一遍磁盤，IO開銷大；2）Hadoop缺少查詢優(yōu)化引擎還有索引等優(yōu)化機(jī)制（有人把Hadoop任務(wù)轉(zhuǎn)換成sql語句，然后再利用傳統(tǒng)數(shù)據(jù)庫的優(yōu)化算法優(yōu)化portal.acm.org/citation...）。Hadoop社區(qū)主要關(guān)注的是高可伸縮性，性能不行，就加機(jī)器唄。

答案 2：

你那個(gè)文檔我看過，比較的是Hadoop與Vertica，我覺得沒有可比性，應(yīng)該比HBase與Vertica。除非HBase沒有優(yōu)化它的存儲(chǔ)和查詢，直接使用Map Reduce做查詢。MapReduce是對(duì)大文件，無序數(shù)據(jù)處理。HBase應(yīng)該是有排序的，還沒仔細(xì)讀源代碼。

標(biāo)簽 : 為什么 09-30

下一篇:思八達(dá)能忽悠這么多的人？下一篇 【方向鍵 ( → )下一篇】

上一篇:男人小便時(shí)會(huì)忍不住想去沖掉便池上的臟東西？上一篇 【方向鍵 ( ← )上一篇】

欄目列表

外語學(xué)校認(rèn)證考試高考研究生留學(xué)百科為什么知道問答百科知識(shí)校園安全職場

蜜桃无码视频,欧美日韩一=三道夲,国产精品午夜AV电影网免费看,aaa.www

為什么

Vertica 數(shù)據(jù)庫與 Cassandra 相比有什么優(yōu)勢？

欄目列表

相關(guān)文章

最新文章