有意思的几个地方
一、算法到底是什么 算法是由一个又一个的二元决策组成的巨大的决策树。二叉决策树可以为复杂的对象生出数百万甚至数十亿的节点。算法的决策树接收输入,然后将输入值带入方程和公式中运行,再将得到的答案作为新的输入,层层迭代演绎,创建出细节复杂的一串串长字符串。关键是分类到二元数据+决策树。 为什么历史数据对算法非常重要?没有历史数据,就没法进行分类。所以只有在数据确定可知的情况下,算法才会起作用。基于历史数据提炼出一个函数或一条曲线来预测未来数据。 最小平方法对基于已观察到的结果构建预测模型提供了方法,是算法建模的基础。回归分析法就是利用历史数据推测现在。 正态分布应用于购置保险,彩票投注。 警告,任何幅度的偏离在正态分布里都是有可能的。算法交易是基于概率论发展起来的。
二、通过算法分析歌曲
算法分析流行音乐的进本结构、模式和风格,通过观察歌曲的三维结构,而非聆听,绝对客观与热门歌曲对比,在屏幕上用点表示分析的歌曲和热门歌曲,形成云结构,基本结构相似的热门歌曲汇聚成带,靠近中心的新歌,即使不一定能红,也是不错的。存在的问题:算法的判断是基于过去的流行歌曲,对于不一样的风格的新歌曲,则是该技术的瑕疵,无法引领新风尚。
Polyphonic公司开发的算法基于新兴光谱反卷积技术,用不同序列的傅里叶变换和数学函数结构歌曲,分辨出歌曲的调子、节拍、节奏、音高、和弦进程、声音饱满度、声音质量和抑扬顿挫。软件将算法得到的数据构建成三维模型,算法通过观察歌曲的三维结构方式,绝对客观地将其与过去的热门歌曲进行对比。
三、通过算法治病开药
医生的诊断其实就是一个二元决策树,输入来自病人的各种生理指标和已有的治疗情况(其实是个隐含马尔科夫过程),决策判断的依据是各种病历。但即便是最爱啃书本的老学究也难以消化并记住书里所有的内容。公道地说,书只是一份参考资料,在医生对某种药物不甚了解时,供其查找。然而,算法不仅能够在几秒之内从中找到相关内容并记住,还能利用药品生产企业的最新数据,不断地进行细致入微的调整。虽然医学表面上看起来不能被电脑程序入侵,但这一事实已经被算法撼动了——真正的改变即将到来。
四、通过算法分析人
1、人格分析
每个人都有自己的人格类型。在真正的专家眼中,每个人都可以像动物园的动物一样被分类、加标签并编成目录。你是善变的猩猩还是温顺的小鹿呢?为人行事诡计多端,还是如亚伯拉罕?林肯一样诚实呢?拥有杰出技能的精神病学家只需通过和我们交谈,就能迅速得出答案。他们知道我们为什么而工作,为什么而奋斗,也知道我们和什么样的人合得来。但是平常给我们做性格测试的人中很少有这样的诊断专家,他们是凤毛麟角的人才。但如果这类稀有人才能被一台机器模仿、复制,甚至发展得更强大呢?如果存在一套算法能识别我们的性格、发现我们的弱点、看透我们的思想并预测我们的行为呢?如果我们创造了一台拥有读心术的机器呢?美国的卡勒教授发展出一套算法。
卡勒系统把言语互动简化为言语模式和词汇选择。在习惯面前,无法伪装自己。我们造句的程序已经到根深蒂固的程度。没有办法在一瞬间改变习惯或采用一种完全不同的说话方式。而我们运用的句式、词汇、谓语和代词显示出了我们长期养成的性格。基于这些,可以将人分成六类, 情感支配型(切入正题前试图建立关系,了解交流的人,女性居多),逆境中容易歇斯底里。 思想支配行动(提出很多问题,收集数据,没有客套话直接正题,决策基于严谨的实用主义)喜欢提问题。 行动支配型(销售人员,崇尚进取和实干)推销员和川普。在压力下,容易失去理智,冲动想报复。 反思支配型(思考可能的情况多于处理已经发生的现实。将知识运用到现实中是一个弱点) 意见支配型(政客。会把自己的想法当成事实)喜欢用 我觉得 来开头说话。 反应支配型(对事物反应强烈,自然率真,有创造力)喜欢用 是的 来引导对话。 所以,你觉得受不了的人,在其他人看来就没那么讨厌,是因为他们性格更合得来。飞行员通常是思想支配型,但最好的飞行员也同时具有情感和意见支配型的特点。人们不喜欢跟毫无热情,按部就班的工作狂汇报报告,但是却会紧密团结在工作努力又关心下属的人周围。多愁善感和坚忍不拔是互不影响、独立发展的特质。学工商管理的人,往往局限于细节,流程和标准。有创造力、头脑灵活的技术型人才,能够快速思考问题并用独特的方法解决。 推而广之,一个人说的任何话都能被算法读取进而判断其性格。这在客服服务上可以极大运用。但是分类会导致我们建造一个属于我们自己的舒适世界,和不同类型的人及文化交流和接纳能力受到影响。不过事实上我们都喜欢和自己对路的人交流。同样,朋友之间总是有等级排序的。等级最高的是那些能够左右其他人观点的人,具有影响力的人,等级较低的则是追随者。很奇妙的算法运用,在我们的只言片语间寻找线索,分辨谁是真正的影响者。算法可以通过对话判断谁是真正的影响者,公司能有针对性的进行营销活动。
2、预测政策变化
情报部门耗费巨资收集到的大部分信息,只不过是在分析一些人为何作出某种选择。信息包括每个人的历史、私事和他走到这个职位的历程。但是麦斯奇塔教授说这情报官无关紧要“比方说你一个下棋的房间,你只要看一下棋盘,就知道棋手接下来将怎么走,”麦斯奇塔说“它们怎样走到那一步不重要,现实世界的事也是如此。”绝大多数中情局从业人员都是直接从大学招聘的。旧式研究方法规定分应该对其研究的地域人文有深厚的了解,所以大多数新成员毕业于文科而非理工科。因此,很多情报员都致力于研究个人历史以及围绕权力人物上演的戏剧性事件,这些事情谈论起来也许很有趣,但要预测个遥远国度的人最终会做什么事,它们并非是至关重要的因素。
真正重要的是分析出怎样做才符合掌权人的最佳利益。然而,我们的情报员却只是在文化差别、宗教冲突,以及种族,国家和民族之间主流意见的差异上狠下功夫。相比之下,算法编写更为便捷。如果重量级相关人和他们的利益能被清楚了解、明确定义(通常也是可以做到的)那么即便是要分析预测伊朗这样领导层不稳定的国家,算法也能比人类分析员更准确地预测他们将会怎样做。关键是人群博弈时是基于自己的利益为主,这是可以简化为二元决策树的。
五、其他
只有你自己懂的东西,你才能够教会别人。
大公司容易落入管理过度、创新不足,因为提高已有的产品和既定流程的效率是能够赚取最多的钱。世界上最重要的发明大都是来自专注于某一领域的初创公司,这种专注度是大公司所不具备的。绝大多数大公司认为提高已有产品和既定流程的效率是最值得花时间做的事。如果利润额为1000亿美元的公司效率提高了5%,那么净收益也就轻轻松松的增加了50亿美元;几乎没有一件新产品能达到同样的效果。因此,大公司易落入管理过度、创新不足的窠臼。这也就是为什么初创公司如此重要。
莱布尼茨对现代算法的三大贡献:
贡献一:0和1的定义
1703年,莱布尼茨发表论文《关于只用记号0和1的二进制算术的阐释》,给出了二进制的定义。可以说,“在构思上,莱布尼茨是历史上第一个接近人工智能的人。” 莱布尼茨明确规定了认知思维和逻辑可以被简化为二进制表达式。他认为,越复杂的思想越需要简单朴素的概念来描述。他还相信,通过将人类逻辑推理分解为数学运算,能够找到一种演算推论器,即一种解决争议的算法。逻辑总能被无情地简化到其骨干,就像纷繁复杂的国家铁路网,追根溯源是由一系列简单的双向岔道口组成。如果逻辑能够被分解为一连串的二元判定,即便是这样的二元判定数需要无限延伸,也可以不用人为而执行。
贡献二:微积分符号系统
莱布尼茨对微积分符号系统和理论的发展完善,为数学家提供了构建强大算法的武器。微积分和算法是西方科学界的两大主导思想。
贡献三:人类的语言和心智可以解构
莱布尼茨发现了存在于最简单的语言片段及其表达的人类情感之间的联系。他认为语言,以及人类如何使用语言,应该用一种严谨、科学的方式来研究。既然复杂的人类认知能被0和1解构,那么语言为什么不能呢?
高斯相依函数可以用来表示两个或多个变量之间的行为关系。2000年,这个公式被李祥林引进到华尔街,用于预测关联风险,以审查核准抵押贷款证券的评级。 但问题是,当华尔街把李祥林发表的数学公式奉为唯一的风向标,债务抵押债券市场就进入了极端,而极端事件的关联性建模,恰恰是高斯相依所做不了的事。
斯皮维花重金在纽约和芝加哥之间铺了一条几乎是直线光纤(不过还没有考虑地球曲率的影响),比现行的光线的速度快4毫秒,能更快地对两地的股市和股指期货的变化做出反应,后来这条光纤使用费非常高,成了交易商们的必选,否则会别别人慢,坐失良机。
诈骗者如何获取个人信息?从各公司的客服人员处获取,每3000个打到客服的电话中就有1个诈骗电话,他们用自己仅有的一点信息来骗客服人员给出客户的更多个人信息。