歡迎來到 常識(shí)詞典網(wǎng) , 一個(gè)專業(yè)的常識(shí)知識(shí)學(xué)習(xí)網(wǎng)站!
[ Ctrl + D 鍵 ]收藏本站
答案 1:
你把vertica寫成virtica了,我先幫你糾正過來。vertica是傳統(tǒng)的關(guān)系型數(shù)據(jù)庫,特點(diǎn)是按列存儲(chǔ),而且集成了MapReduce支持。Cassandra則是屬于No-L陣營,特點(diǎn)是綜合Dynamo的弱一致性模型和Bigtable的數(shù)據(jù)模型。它們的比較其實(shí)就相當(dāng)于這兩個(gè)陣營的對(duì)比了,這方面文章不要太多。那么很顯然,vertica最大的優(yōu)勢就是它提供了-L的支持,可以很好的兼容以往的工具和數(shù)據(jù),習(xí)慣-L的程序員用起來也爽。傳統(tǒng)的-L語義在高可伸縮性要求下很難實(shí)現(xiàn),如join等操作。你可以設(shè)想一下,如果要join的表都非常大,超出單臺(tái)機(jī)器的處理能力,要高效地完成這個(gè)操作該有多困難。事實(shí)上這方面已經(jīng)有很多學(xué)術(shù)研究在進(jìn)行。傳統(tǒng)的數(shù)據(jù)庫除了-L語義外,還要保證transaction的ACID,而要同時(shí)滿足高一致性和事務(wù)操作的要求是很難實(shí)現(xiàn)高可伸縮性的。因而才會(huì)有No-L的出現(xiàn),它們犧牲了部分-L和事務(wù)的語義、降低一致性要求,以實(shí)現(xiàn)高可伸縮性的系統(tǒng)。Vertica的底層存儲(chǔ)實(shí)現(xiàn)和HBase的不一樣。雖然都是叫按列存儲(chǔ),HBase是先將表格按行劃分成塊,在數(shù)據(jù)塊-才是按列存儲(chǔ);Vertica的存儲(chǔ)比較靈活,它號(hào)稱可以配置哪些列要放在一起存儲(chǔ),每列都分開就是最基本的按列存儲(chǔ),所有列都和在一起就是按行存儲(chǔ)了,不過同一列的數(shù)據(jù)還是會(huì)放在一起。所以按列或者按行存儲(chǔ)只是不同的系統(tǒng)設(shè)計(jì)選擇,不是決定性因素。關(guān)鍵還是在于對(duì)上層提供的語義。你如果關(guān)心的是執(zhí)行效率,推薦你一篇-.cse.nd.edu/~dt-ain/courses/cse40771/spring2010/benc--rks-sigmod09.pdfHBase,Cassandra本身只有存儲(chǔ)能力,如果要做查詢需要借助Hadoop這樣的框架進(jìn)行,Hive就是把查詢都編譯成Hadoop任務(wù)實(shí)現(xiàn)的。Hadoop的查詢效率要比關(guān)系型數(shù)據(jù)庫要低,主要是因?yàn)?)Hadoop為了保證容錯(cuò),中間數(shù)據(jù)都要走一遍磁盤,IO開銷大;2)Hadoop缺少查詢優(yōu)化引擎還有索引等優(yōu)化機(jī)制(有人把Hadoop任務(wù)轉(zhuǎn)換成sql語句,然后再利用傳統(tǒng)數(shù)據(jù)庫的優(yōu)化算法優(yōu)化portal.acm.org/citation...)。Hadoop社區(qū)主要關(guān)注的是高可伸縮性,性能不行,就加機(jī)器唄。答案 2:
你那個(gè)文檔 我看過,比較的是Hadoop與Vertica,我覺得沒有可比性,應(yīng)該比HBase與Vertica。除非HBase沒有優(yōu)化它的存儲(chǔ)和查詢,直接使用Map Reduce做查詢。MapReduce是對(duì)大文件,無序數(shù)據(jù)處理。HBase應(yīng)該是有排序的,還沒仔細(xì)讀源代碼。下一篇:思八達(dá)能忽悠這么多的人? 下一篇 【方向鍵 ( → )下一篇】
上一篇:男人小便時(shí)會(huì)忍不住想去沖掉便池上的臟東西? 上一篇 【方向鍵 ( ← )上一篇】
快搜