蜜桃无码视频,欧美日韩一=三道夲,国产精品午夜AV电影网免费看,aaa.www

歡迎來到 常識詞典網(wǎng) , 一個專業(yè)的常識知識學習網(wǎng)站!

[ Ctrl + D 鍵 ]收藏本站

您所在的位置:首頁 > 教育學習 > 問答

問答

你同意「數(shù)據(jù)比算法重要」這個說法嗎?

分類: 問答 常識詞典 編輯 : 常識 發(fā)布 : 08-22

閱讀 :389

你同意「數(shù)據(jù)比算法重要」這個說法嗎?觀點來自這里:anand.typepad/datawock...作者說谷歌的強不是強在 PageRank 算法,而在于它是第一個在排名時把鏈接——而不只是文字和標題——考慮進去的。又以自己教的數(shù)據(jù)挖掘課為例。他讓學生以 Netflix 用戶對一萬八千多部電影的打分為基礎數(shù)據(jù),寫程序為她們推薦別的電影。其中有組學生的算法較優(yōu),另外一組學生算法一般,但使用了外部數(shù)據(jù)——IMDB 對電影類型的歸類。結果第二組的結果勝過了第一組。25 個答案

答案 1:

雖然不能這么絕對的判斷一定誰比誰重要,但在實際應用中很多時候的確是數(shù)據(jù)更加重要。有幾方面的原因:

在很多問題中,算法的『好壞』在沒有大量有效數(shù)據(jù)的支撐下是沒有意義的。換句話說,很多算法得到的結果的質量完全取決于其和真實數(shù)據(jù)的擬合程度。如果沒有足夠的數(shù)據(jù)支撐、檢驗,設計算法幾乎等于閉門造車。

很多算-有一堆可調參數(shù)。這些參數(shù)的選擇并沒有什么標準可依,無非是扔給大量數(shù)據(jù),看參數(shù)的變化會帶來什么樣的結果的變化。大量、有效的數(shù)據(jù)成為優(yōu)化這類算法的唯一可行方法。

更極端的例子是,算法本身很簡單,程序的完善全靠數(shù)據(jù)訓練。比如神經(jīng)網(wǎng)絡。

對于很多成熟的算法,優(yōu)化算法的增量改善通常遠小于增大輸入數(shù)據(jù)(這是個經(jīng)濟性的考慮)。

比如問題中舉例的 Google。在它之前的搜索引擎已經(jīng)把基于網(wǎng)頁內(nèi)容的索引算法做得很好了,要想有更大的改善需要換思路。PageRank 算法的采用大大增加了輸入的數(shù)據(jù)量,而且鏈接數(shù)據(jù)本身對于網(wǎng)頁排名相當關鍵(當然他們也做了大量算法的優(yōu)化)?!静逶挘涸谶@樣的思想指導下,Google 想要插手社交網(wǎng)絡或微博也不足為奇了吧?實時搜索、排名沒有真人的互動怎么可能?!縉etflix 挑戰(zhàn)賽的例子中,Netflix 本身的推薦算法也是優(yōu)化到極致了。再從算法本身去找改進之處,投入產(chǎn)出比太低。引文中的學生僅僅是加入了 IMDB 數(shù)據(jù)庫關于電影分類(從而更加明確觀眾的偏好)就能帶來比復雜算法更加顯著的改善,試想如果他們能拿到 Rotten To-toes 的數(shù)據(jù)會怎樣?W-en people are equally -art, big data wins.這個結論的悲摧之處在于,在類似行業(yè)中,今后小的創(chuàng)業(yè)公司想要打敗巨頭就不那么容易。要么要改變思路,要么要改變策略。指望靠小聰明扳倒大象會很成問題。當然這也不是絕對的。比如典型的反例(算法比數(shù)據(jù)重要)是 Google 剛被批準收購的 ITA Software。這家牛 B 烘烘(估計是現(xiàn)存最大的 Lisp s-op)的公司的機票搜索引擎驅動著世界各大航空公司、票務中介的后臺系統(tǒng)。它的數(shù)據(jù)來自一個各大航空公司授權的公司,其他競爭者也可以花錢(雖然不便宜)買到同樣的數(shù)據(jù)。但它的牛 B 之處在于能從同樣的數(shù)據(jù)里比別人更快挖出更好的結果。

答案 2:

我強烈同意數(shù)據(jù)比算法重要!雖然我們可以打官腔說這兩個同樣重要,但如果是一個資深的機器學習和數(shù)據(jù)挖掘研究人員,絕對不會掩飾他們對數(shù)據(jù)的渴望,當然對他們來說設計好的算法是很容易的,但好的數(shù)據(jù)卻是不容易拿到的。

答案 3:

數(shù)據(jù)比算法更重要,這是有一定道理的,但是在拿它當信條之前,必須知道在什么場景下它有道理。所有的格言都一樣,是對態(tài)度簡短有力的描述,但因為簡短,就不可能全面。比如“成功在于堅持”,當然有道理,但不加分析地事事堅持,就很沒道理了。數(shù)據(jù)比算法更重要,它的意義在于告訴我們,在試圖設計更復雜的算法去提高性能之前,先看看有沒有辦法收集更多的、質量更高的數(shù)據(jù),因為這往往是提高性能更簡潔有效的手段。另外,除了先驗知識外,算法能達到的最佳性能,受限于數(shù)據(jù)所提供的有用信息容量,當算法性能接近這個容量時,不管你再怎么改進算法,基本都沒有意義了,唯一的手段就是去獲得更多有用的數(shù)據(jù)。但要注意的是,這句話的意思決不是說算法沒有用,或者沒有必要去研究算法,好的算法之所以好就在于它能充分地利用數(shù)據(jù),如果你的算法根本就不能有效利用數(shù)據(jù),獲取再多的數(shù)據(jù)也是徒勞。具體到Anand Rajara-n的帖子,我記得Netflix Prize獲獎團隊主要成員Ye-uda Koren有一個評論:在他們的實驗里,IMDB的數(shù)據(jù)根本沒用。因為IMDB的數(shù)據(jù)主要能用來描述item-item關系,如果Netflix Prize競賽中這方面數(shù)據(jù)稀疏,那IMDB的數(shù)據(jù)就是很好的補充。但是Netflix Prize競賽中,item數(shù)量只有不到兩萬,提供的數(shù)據(jù)已經(jīng)足夠構建item-item關系,根本用不著IMDB的數(shù)據(jù)。Netflix Prize競賽中數(shù)據(jù)的不足主要在于user-item關系得不到充分描述,因為user數(shù)量太大了(50萬?)。剛才看了看帖子,沒有找到這條評論,可能是在別人轉述的帖子上Ye-uda Koren做了評論。

答案 4:

程序 = 數(shù)據(jù)結構 + 算法,數(shù)據(jù)結構用來干啥的,裝數(shù)據(jù)的呀。 數(shù)據(jù)能干啥?數(shù)據(jù)是信息的源泉,沒有足夠的數(shù)據(jù),就沒有信息,信息技術沒有信息啥都沒有。 算法能干啥?把數(shù)據(jù)中信息提取出來,不經(jīng)過提取,數(shù)據(jù)還是數(shù)據(jù),變不成有用的信息。 這倆不是并列的關系,而是一體的,如何能說誰重要呢?腦子重要還是心臟重要,你給我說說。 此外,數(shù)據(jù)的好壞如何衡量?不是越多越好,當然數(shù)據(jù)越多往往所蘊含的信息越大,這個容易看得出來;算法的好壞如何衡量?不是越復雜約好,能從海量的垃圾中找到有用的信息的算法就是好的算法,雖然不這么復雜,不是所有的人都能看到這點。 我最想說的是什么?如果不是事不關己的旁觀者,數(shù)據(jù)往往是自己能拿到最多的數(shù)據(jù),然后根據(jù)自己的這些數(shù)據(jù)去找最合適的算法。

答案 5:

我認為算法和數(shù)據(jù)不能割裂開來看。寬泛一點說,考慮采用什么樣的數(shù)據(jù)也是算法設計中的一部分。

答案 6:

嚴格角度講,數(shù)據(jù)重要,算法也重要。但是,我覺得大多數(shù)情況下,數(shù)據(jù)更加重要。第一,算法對于整個研究領域而言是相對透明的,你能想到的方法別人也可以想到,一般成熟的算法都是已經(jīng)提出來兩三年的,是業(yè)界公認的;第二,數(shù)據(jù)往往更加事倍功半,算法改進很難(如果已經(jīng)有一定基礎的話),但是,如果能得到優(yōu)質數(shù)據(jù),一旦數(shù)據(jù)量達到原來數(shù)倍甚至更多的增加,發(fā)現(xiàn)效果會得到十分明顯的改善;第三,優(yōu)質的數(shù)據(jù)往往能為算法提供方向,甚至直接驅動需求;機器學習領域常出現(xiàn)這樣的情況,在一個數(shù)據(jù)集上得到的結論往往在一個更大更復雜的數(shù)據(jù)集上變得不同(有人做過實驗,采用一種公認很差的算法能在一些曾經(jīng)被使用的比較toy的數(shù)據(jù)集上取得比好算法差不多甚至更好的效果),所以,好的接近實際應用的數(shù)據(jù)集才能告訴什么是真正好的算法;而對實際數(shù)據(jù)分析的結果往往會改變我們固有的對主要問題的觀念,就是你覺得重要的不一定重要,你沒注意的反而是影響問題的最重要因素。第四,好算法常有而優(yōu)質數(shù)據(jù)不常有;看-總是可以看到更多更好的idea,但是優(yōu)質數(shù)據(jù)(比如淘寶)卻是可遇而不可求;

答案 7:

數(shù)據(jù)可以直接賣錢,算法要等算出數(shù)據(jù)才能賣錢。

答案 8:

還是不要這么比較吧,意義不大。具體問題要具體分析。雖然我這說了和沒說一樣,我只是不同意這樣做這樣的比較。

答案 9:

借用一個比方,要做魚香肉絲,算法是菜譜,數(shù)據(jù)是里脊胡蘿卜。沒有菜譜,做出來的可能是鍋包肉或溜肉段,但做不出來鍋包肉;反過來,沒有原料肯定不行,原料多了,存在進一步改良菜譜的可能,鍋包肉有了新的口味。理解了二者的關系就足夠了,非要分清誰更重要,圖什么呢?

答案 10:

算法和數(shù)據(jù)是一件事的多個面,您舉的例子里,我看到的主要評價標準就是“數(shù)據(jù)挖掘結果的有效性”這一點。而從其中拆分出的“算法 和 數(shù)據(jù) 孰輕孰重”的問題似乎是要在一元標準上建立兩個主次標準,我認為這樣做只會讓這件事更糊涂。 如果想知道現(xiàn)在的時間,最好只看一個表。對于做事來說,就是只選擇一個參照系來做評判,即使所選擇的參照系(“表”)不太準,你也能得到一個比較清晰的結論。如果再拆分出更多的“表”來評價這件事,不僅把問題復雜化了,也增加了很多無效的思考工作。在很多領域其實都會出現(xiàn)這種現(xiàn)象,比如有的老板認為績效需要考勤作為基礎,為了提高績效而抓員工的考勤,從而制定出考勤+績效的雙重考核標準,這樣看起來很科學,實際上更多只是徒增了管理成本,我認為這是費力不討好的。

答案 11:

LZ的問題就好像 廚藝和食材哪個重要。。

答案 12:

巧婦難為無米之炊,沒有數(shù)據(jù),再牛b的算法也是沒有意義的。

答案 13:

想起了以前看過的一篇-,在big data的數(shù)據(jù)集,簡單算法也可以達到比較理想的效果

答案 14:

對于同一算法f,性能如下遞增f(x) 數(shù)據(jù):xf(x+) 海量數(shù)據(jù):x+f(x*) 好的衍生數(shù)據(jù):x*f(x+*) 海量好的衍生數(shù)據(jù):x+*選擇什么算法f,看問題復雜性和效率的重要與否。不過當有海量好的衍生數(shù)據(jù),好的算法帶來的改善不會太明顯。另外,挖掘出好的數(shù)據(jù)(feature engineering,mining...)是一個費時費力試錯的工作,非常依賴與你的洞察力和采用的算法。

答案 15:

實際應用中,算法為數(shù)據(jù)服務?,F(xiàn)在看來,數(shù)據(jù)為王是一個大勢。很多領域,因為數(shù)據(jù)量的問題,已經(jīng)漸漸變成大企業(yè)才能玩得轉的了。

答案 16:

問題類似 好的食材重要,還是好廚具重要?看似都重要,不過說實話,好食材比好廚具稀缺多了。不過對于大數(shù)據(jù)集,研究的組合有無限多種,先確定要自己要分析什么比較重要。

答案 17:

算法就那么多,數(shù)據(jù)卻不是想要就能有的,于是這個說法在多數(shù)情況下就成立了。要是能無條件獲得到互聯(lián)網(wǎng)的任意數(shù)據(jù)就無敵了...

答案 18:

一個是雪中送炭,一個是錦上添花。沒有諸葛亮,只有一群臭皮匠難成大器;有了諸葛亮,卻不能充分發(fā)揮其才能,也是白瞎

答案 19:

沒有絕對的東西,要看在什么條件下

答案 20:

在一堆繁雜的數(shù)據(jù)面前,好的算法尤為重要,沒有算法,你壓根不知道這一堆是啥東西!

答案 21:

讓人啼笑皆非的描述,因為算法,其實是處理數(shù)據(jù)的(廣義的)。 存在兩個過程,數(shù)據(jù)的表述和數(shù)據(jù)的處理(流動),這從來就不是誰重要誰不重要的問題,而是缺了誰,就沒法運行的問題。

答案 22:

我認為這兩者不能直接比較,并且這兩者的比較沒有意義。只是可能來說,在不同階段數(shù)據(jù)顯得更重要,而另外的階段如何做好算法則是更重要了。

答案 23:

在數(shù)據(jù)挖掘領域當然是數(shù)據(jù)更重要。在解決大部分工程性問題的時候,數(shù)據(jù)結構往往比算法分析更實用。因此似乎很容易得出數(shù)據(jù)比算法重要的結論,但算法更多體現(xiàn)的是一種思想,是一種思考并解決問題的方法,數(shù)據(jù)結構的選擇更是這種思想的體現(xiàn)。

答案 24:

很顯然這種說法是不科學的。

答案 25:

不同意這么絕對的說法. 算法必須有數(shù)據(jù)才能執(zhí)行, 問題是沒了算法數(shù)據(jù)就是垃圾

下一篇:中國那么多的事后諸葛、馬后炮? 下一篇 【方向鍵 ( → )下一篇】

上一篇:西方上流社會似乎格外喜歡加烈葡萄酒,呢? 上一篇 【方向鍵 ( ← )上一篇】

欧美亚洲日韩九色| 欧美日韩黄色激艳猛片| 国产精品日韩专区| 欧美99精品不卡一区二区| 人人妻人人澡人人爽人人精品图片| 欧美性7777| 国产凸凹视频一区二区| 男人伸进女人下面桶| 亚洲AV永久少妇精品一区在线| 蜜桃31成人精品| 日本黄色视频在线观看| 国产精品天天爽夜夜爽| 亚洲熟女偷拍| 另类古典欧美人妻| 久久久久AV片无码| 乱子伦精品中文字幕| 欧美成人资源在线观看| 成人男人天堂网站| 日韩不卡在线视频| 产精品一区在线观看你懂的| 国产精品久久久无码中文字| 中国黄片一级免费看| 国产精品99精品无码频亚| 国产av自拍一区| 国产成人精品magnet| 亚洲综合久久一本伊伊区| 欧美亚洲日韩天堂网| 亚洲国产精品综合色区| 中国AV日韩丝袜一区| 中文区中文字幕免费看| 武强县| 97香蕉超级碰碰碰久久兔费| 亚洲v码国产乱码在线观看| 中文字幕亚洲色图无码| 国产欧美一区二区三区蜜臀| 欧美三级中文字幕久久版| 亚洲欧美区日韩| 国产精品一区二区久久精品| 国产18禁网站| 色天使色偷偷色噜噜噜| 在线天天综合网视频|