数据要素产业
微软前副总裁:机器学习和人工智能5大关键
微软前副总裁S. Somasegar从智能应用开发的角度,总结了2016机器学习和人工智能的5大发展趋势:算法和数据结合的微智能,将能灵活地在应用中得到融合;让“每一个应用都变得智能”;人工智能的黑箱将被揭开;现阶段的机器学习和人工智能中,人类的作用不可替代;最后,他认为对于企业来说,不是从一开始就需要机器学习。
风险投资集团Madrona不久前在西雅图举办了一场机器学习与人工智能峰会,汇集了智能应用生态系统中不少大公司和初创企业。
本次峰会的一个重要的议题来自对与会者的问卷调查。在调查中,所有受访者都表示,机器学习对他们的公司和所在行业很重要或者非常重要。
然而,超过半数的受访者认为,自己所在的机构在机器学习上还不够专业,难以支持他们完成需要做的事。
S. Somasegar
微软开发者部门前任副总裁,现Madrona投资合伙人S. Somasegar参加了这次峰会,下文是他所写的总结。他认为,本次峰会展现了机器学习和人工智能当下的五个趋势:
1. 微智能(micro-intelligence)和中间件(middle-ware)服务
广义上讲,现在的公司分为两类:一类是研发机器学习和人工智能技术的;另一类则是在应用和服务中使用机器学习和人工智能的。在包括数据预服务和学习服务或Maas提供者的(数据存储)块服务(比如aka和中间件服务)中,现在正有大量的革新在发生。
随着微服务(microservices)的出现,并且通过REST API 可以完美地连接这些微服务,现在有一种逐渐增强的趋势,即,让学习服务和机器学习算法能够得到使用和再使用,而不是像以前那样必须从头开始重新设计。
举个例子,Algorithmia 公司提供了一个算法交易平台,任何智能的应用都能按需取用平台上的算法。这些算法和模型与特定数据集的结合(使用条件限于特殊的vertical),就是我们所说的微智能。这些微智能可以完美地融入应用中。
2.每一个应用都会变得智能
如果你的公司还没开始使用机器学习来监测异常,推荐产品或者预测客户流失,你很快就会用到了。由于新数据的快速迭代、大量计算能力变得可用以及新的机器学习平台门槛降低(不管是在大型的科技公司,比如亚马逊、谷歌和微软,或者初创企业),我们会看到越来越多的应用,它们能够产生实时的预测,并且不断变得更好。在过去六个月,我们所见到的所有100多个处于早期的初创企业中,超过90%都在计划使用机器学习来提供更好的用户体验。
谷歌使用AI技术的软件数量近年来大幅增加
3.黑箱不黑
在机器学习和人工智能的世界中,信任和透明绝对是至关重要的。
过去的一年间,有好几个高调的机器学习和人工智能项目走到了聚光灯下,包括微软的Tay,谷歌DeepMind 的AlphaGo,Facebook的聊天应用 M 以及各种各样的聊天机器人。自然用户交互界面的发展(声音,对话和视觉)为我们提供了非常有意思的选择和机会,让人类可以与虚拟助手(苹果的Siri,亚马逊的Alexa,微软的Cortana以及Viv)互动。
在我们与人工智能产品的交互中,也有一些令人烦恼的例子。比如,在Georgia Tech的一门线上课程结束时,学生们才发现一位与他们互动了一整个学期的助教Jill竟然是聊天机器人。
这一例子展现了技术和创新的神奇之处,同时,也引发了一些关于机器人、机器学习和人工智能的世界中信任和透明这方面规则的思考。
与人工智能相关的工作中,理解“是什么”背后的“为什么”通常是另一个比较关键的部分。对于医生和病人来说,只告诉他们“有75%的概率触发癌症,需要使用某种药物进行治疗”,这还不够,他们需要知道是什么信息让机器得到了这一预测或者答案。
我们百分之百地相信,对于机器学习,接下来我们可以做到完全透明,我们还应该想清楚,这一技术的进步在道德上会有什么启发,这会是我们生活中不可缺少的一部分,也是社会进步不可缺少的一部分。
4.人类依然不可或缺
关于我们该不该担心人工智能会代替人类,接管世界这一话题,现在有许多讨论。在自动化领域,机器学习和人工智能发挥着重要作用,并且获得了巨大的进步。但是,可以肯定的是,在智能应用的开发中,我们仍然需要人类,来创造正确的,端对端的用户体验。
房屋买卖网站Redfin做了一个尝试,把机器学习生成的推荐推送给用户。这些机器生成的推荐比起用户自行搜索和筛选的结果更能吸引用户。不过,匹配率真正大幅度地提升是在Redfin让中介对机器生成的推荐进行修正后再推送。Redfin能够把中介对机器的推荐的修正作为额外的训练数据,进而带动推荐房源点击量的大幅提升。
大数据平台Splunk 也强调了这一点。如果仅靠机器,没有人的参与,消费者很难从Splunk获得最大的价值。
Spare5是一家搜集数据,以支持计算机视觉研究的公司,他们的例子也说明了人类在训练机器学习模型中的作用:人类可以对要输入模型中的数据进行修正和分类。
机器学习中另一个常见的格言是: garbage in, garbage out(输入的是垃圾,输出的也是垃圾)。也就是说,数据的质量和完整性对于建造高效的模型至关重要。
5.也不是从一开始就需要机器学习
在智能应用的开发中,机器学习是一个不可或缺的部分,也是至关重要的原料,但是,在智能应用的开发中,最关键的目标是建立能够与你的用户产生共鸣的应用和服务,创造一种简单的方法,让消费者可以使用你的服务,并且不断做得更好。
要有效地使用机器学习和人工智能,最基本的要求是拥有大型的数据集。这一领域的成功人士的建议是:立即开始开发程序,把自己想要提供的东西拿来试验,实验的过程中,思考机器学习可以如何改进你的应用,你需要搜集什么数据?来为客户创造最佳的体验。
在让每一个应用都变得智能的道路上,我们已经走了很远,但是要做的还很多。正如艾伦人工智能研究院(Allen Institute for AI)的CEO Oren Etzioni所说,在人工智能和机器学习上,我们获得了长足的进步,但是如果现在就宣布胜利,就好像“刚爬上树头便宣称登上了月球”一样。