深度学习仍然离不开你的大数据
深度学习仍然离不开“你”的大数据
深度学习需要大数据,这已经不是什么秘密了,比如ImageNet上超过百万张已标注的训练图像。这些数据从哪里来?答案当然是你以及你所认识的每个人。现代计算机视觉应用程序之所以成为可能,主要归功于互联网用户已上传的、有时带有说明图像内容的文本标签的数十亿张图像。你是否曾在Facebook上发布过一张朋友的照片并进行评论?Facebook应该对你表示感谢!该图像及其文本可能已被用于训练他们的人脸识别系统了。你是否曾在Flickr上传过图片?如果是,那么你所上传的图像可能已成为ImageNet训练集的一部分了。你是否曾通过识别一张图片来向某个网站证明你不是一个机器人?你的识别结果可能帮助了谷歌为图片设置标签并被用于训练其图片搜索系统。
大型科技公司通过计算机和智能手机为你提供许多免费服务:网络搜索、视频通话、电子邮件、社交网络、智能助理,诸如此类。这些对公司有什么用处呢?答案你可能已经听说过,就是这些公司真正的产品其实是其用户,例如你和我,而他们真正的客户则是那些获取我们在使用这些免费服务时的注意力和信息的广告商。还有另外一个答案:在使用大型科技公司如谷歌、亚马逊和Facebook等提供的服务时,我们会以图像、视频、文字或语音等形式直接为这些公司提供样本,这些样本可供公司更好地训练其人工智能程序,这些改进的程序能够吸引更多用户来贡献更多数据,进而帮助广告商更有效地定位其广告投放的对象。此外,我们提供的训练样本也可被公司用于训练程序来提供企业服务,并进行商业收费,例如计算机视觉和自然语言处理方面的服务。
Cong对本书的所有笔记 · · · · · ·
-
人工智能仍然无法学会自主学习
人工智能仍然无法学会自主学习 DNN这种“从数据中学习”的方法已被逐渐证实比“普通的老式人...
-
人工智能仍然无法自主学习
说如今大获成功的ConvNets能够自学是不准确的。正如我们在前一章看到的,为了让ConvNets学会...
-
深度学习仍然离不开你的大数据
-
长尾情况的应对需要常识
对抽象事物的感知以及类比是人类擅长的,但到目前为止,还没有特别成功的人工智能算法来实现...
-
人类的价值观都不一致,如何编程给机器人?
科幻小说家亚瑟·克拉克(Arthur C. Clarke)在其1968年出版的《2001:太空漫游》16中描写了...
说明 · · · · · ·
表示其中内容是对原文的摘抄