数据要素产业
IBM用机器学习找外星人 不用再望穿银河秋水
如果云计算在1982年就成为现实的话,科幻电影《外星人E.T.》中E.T. 的可能会更快的回归自己的星球。对于那些并不是很了解的年轻人而言,E.T. 是同名叫座电影中的一个可爱的外星人——因为同行的植物学家同伴离开得太匆忙,他被不小心留在了地球上。最终,E.T. 在一个工具房中被当地的孩子发现。孩子们用拼读机、内衬铝箔的雨伞以及装满电极的咖啡罐发出了长距回击波,最终成功帮助他联系到了自己的家人。
上面说的只是三十多年前的情况。在已经拥有机器人学习与云计算技术的今天,我们可以借助先进技术寻找外星人了吗?答案是:肯定的。
就在上周的伦敦东部高性能计算中心,来自南非总部的IBM Research科学家 Francios Luus主持了有关深度学习计算环境和自主机器学习会议,这场一年一度的会议持续了三小时。
Luus 介绍了 IBM Bluemix Spark 项目的十二个参与者,他们将以艾伦望远镜阵列收集到的600万个信号样本为基础分析压缩数据。艾伦望远镜阵列的设计初衷,就是为了在厘米波长下能够同时高效进行多项外星人研究。参与者们的目标是通过 Spark 和机器学习技术的结合来找到有关外星生命的异常数据。
“比起在这里研究机器学习,如果我们可能在其他地方找到外星生命,这件事想必更让人振奋吧,” Luus 说到。
“单纯一个人处理这些数据实在是太多了,所以我们允许任何人访问。我们将在研讨会上为大家介绍深度学习技术在应对挑战时的应用——它将帮助参与者发现类似有关生命的异常数据值并将其可视化,这简直太振奋人心。”
我们只是努力的将 IBM 和加利福尼亚 Mountain View 的SETI Institute 研究所的一部分进行结合,并同时使用 IBM 的存储服务和 IBM 的 Bluemix Spark 服务来分析他们在过去几年就已经收集到的大量无线电望远镜数据。
团队已经基于构建出了一个系统,整个系统由 IBM 云和为大众提供原始数据的 Github 组成,同时还有一些辅助工具查看 Github 已有数据。
Luus 非常希望这项工作能够得到大家的认同。“机器学习可以找到 SETI 团队错过的任何异常数据,这并非人机对抗,这是人机之间的协助工作,或许还有外星人的加入。”