一个理工狗眼中的大数据

丧心病狂刘老湿 评论 大数据时代 4 2014-05-10 15:47:53
James
James 2014-05-13 10:53:33

非常好,专业论述。观点也同意。

红皇后
红皇后 (相信现实此刻就是最好的) 2014-05-14 09:34:43

支持一个 写的很好

水秀乡
水秀乡 2014-05-14 09:35:56

理工男 不明觉厉

惊蛰小白
惊蛰小白 (跳进去体会,跳出来观察) 2014-05-14 09:37:57

“知其然”可以替代“知其所以然”的概念更像是一个悖论~~

十里红妆
十里红妆 (平和地说话、走路,思考) 2014-05-14 09:38:32

知道这本书,但是没看过啊。。

LindtF
LindtF (你不知道我在想什么) 2014-05-19 15:53:19

工科女表示,这本书没什么好看的,而且里面东西总觉得有点偏颇。而且内容还没有译者序说得好。

佳音读书
佳音读书 2014-05-22 15:52:32

我实在看不下去。

吃不下筷子咽不下碗
吃不下筷子咽不下碗 (君子知微知彰,知柔知刚) 2014-05-28 00:03:48

“而随着技术的发展,概率模型下的NLP技术在上个世纪90年代以后全面战胜了规则模型,我们不需要去理解自然语言的语义、语法,让处理器的摩尔法则和指数级叠加的文本互相厮杀,只要有足够数量的样本集——Bingo!一切都搞定了”
“沾沾自喜的人们以为这就是世界的真理,忽视了近十年概率模型应用的规模一再扩大,准确率却停滞不前。即使是文本的二元情感分类如此简单的任务,无监督的学习器也很难拿出一个看得过去的成绩,更不用说机器翻译这样近十年来都没有巨大突破的领域了。就目前人类的技术水平而言,我们很难能够乐观的估计概率模型能够在我们有生之年将机器翻译技术推到“信达雅”的地步,概率模型和大数据的发展过程恰似一个对数函数,经过了最初的高速发展之后就放缓了自己的脚步。 ”
哈哈

莫名
莫名 2014-05-30 18:18:16

支持,写得好!

你不知道你多美
你不知道你多美 2014-06-10 11:34:30

写的很好

小米饽饽
小米饽饽 2014-06-12 22:50:15

红莲
红莲 2014-06-26 10:13:28

堆积了一些乱七八糟的东西观点却毫无说服性

rena
rena 2014-07-03 15:55:46

"经济发展的不均衡决定了所谓的样本=总体永远不可能出现——全世界有十几亿人还处日生活开销不足2美元的贫困线以下,连登录网络的条件都不具备,我们怎么能够奢望我们收集到的数据就会是总体?而所谓“知其然”可以替代“知其所以然”的概念更像是一个悖论,或许在应用层面上而言,这种说法有其合理之处,但对我们如何更好的了解这个世界的真相,却毫无用处。"

同意

似水流年
似水流年 2014-08-19 09:43:21

作者所说的大数据可能只是为了得出正确的结论而不是寻找世界的真实吧。。对数据分析不明觉厉。。

清扬婉兮
清扬婉兮 2014-08-21 12:05:19

赞一个

daisy007
daisy007 (我要重生) 2014-09-08 23:34:34

说得太犀利啦,作者你还有才

kitty
kitty 2014-09-17 09:07:58

写的很好!很有自己的观点,不知道大数据对我们的影响还会在哪里

polycr
polycr 2014-11-18 17:18:25

"经济发展的不均衡决定了所谓的样本=总体永远不可能出现——全世界有十几亿人还处日生活开销不足2美元的贫困线以下,连登录网络的条件都不具备,我们怎么能够奢望我们收集到的数据就会是总体?而所谓“知其然”可以替代“知其所以然”的概念更像是一个悖论,或许在应用层面上而言,这种说法有其合理之处,但对我们如何更好的了解这个世界的真相,却毫无用处。"
这句话哪里有道理了,大数据并非只有网民的行为分析啊,还包括其他素材的收集,可以是书籍、电子资料等各种渠道的信息,没人限制信息获取的来源和途径。不要对这种统计学方法太有偏见了。

丧心病狂刘老湿
丧心病狂刘老湿 2014-11-18 22:18:32

@polycr 作者在书中提出的一个主要观点是“样本==总体”(话说打完这句我才发现,写代码习惯了会有后遗症),那么既然全球有那么多的贫困人口连网络接入条件都不具备,样本怎么可能等于总体?是你要先搞清楚,我们讨论的不是什么网民行为分析和统计学问题,而是作者所提出的“样本==总体”这个理论是否成立。

echo_hexi
echo_hexi 2014-12-29 19:56:02

欢欣鼓舞的计算机学家们纷纷将自己的精力投入到这个神奇的领域,但是丝毫没有发现,其实他们只是在重复着所有学者们无数年来在做的事情——寻找这个世界的真实。。。还有如何找到数据之前的联系。。

小手冰凉
小手冰凉 (钱塘江上潮信来,今日方知我是我) 2015-01-13 19:50:38

虽然没读这本书,但是也关注了好久。看过书评,作为同样一个计算机的挨踢男,表示作者功力很强大!顶起。。
PS这本书我不看了。

长空_daisy
长空_daisy (我是我所想) 2015-02-23 22:33:44

书没看过,为书评点个赞。
本科时曾对大数据欢欣雀跃,兴致冲冲看了些paper……工作后做数据分析表示累觉不爱……单纯靠研究算法带来的效率提升,从观察来看,好像不如在业务经验指导下的深入分析。机器学习只是帮助人们发现未曾留意的可能性,但这种发现的准确性需要人类主观分析。毕竟沉默数据的存在可能掩盖了事实的真相。
因果关系才是这个世界的本质啊!

Devil
Devil 2016-03-29 14:47:13

大数据近几年已经兴起,大佬们张口闭口就是这些名词,却不知到底是什么,建议好好看看,还不错的呢

Devil
Devil 2016-03-29 14:48:41

不错的

J™
J™ (身后有余忘缩手,眼前无路想回头) 2016-12-20 18:25:34

同意最后一句

但大数据在区域性的效果还是有的,现在距离你写文章也两年了,数据挖掘也发生很多的变化,就包括微软的翻译软件也是进步神速。

文章最后也写了一个悖论,也许数据可以预测犯罪,但那个人在还没有犯罪的前提下,我们是不是可以抓他?数据也许可以预测我们的行动,但我们的行动会不会因为被数据预测反而发生了改变?好吧,我也有点乱。

只是想说,大数据对于知其然起作用就够了,剩下的还要靠我们,数据当然不是一切。

艾丹儿
艾丹儿 (目前BMI 21,目标BFR 21。) 2018-02-11 08:16:22

今天刚好读到big data&simple-model VS less data&elaborate-model 看完作者的有启发,谢谢