Select Language

AI社区

数据要素产业

这个人工智能的热门领域,平安已经抢先

文 | 周天财经

周天财经 原创出品

平安重视科技投入早已是「明牌」。

在马明哲的年报致辞中开篇便以「改革有恒,科技先行」,为平安的未来发展定下基调。

最近平安获得的一个奖项,显示出平安在人工智能技术的一个热门领域,占据着业内领先地位。

这项技术就是联邦学习。

01 解决数据孤岛的联邦学习

近日,美国 BAI(Bank Administration Institute)组委会对外公布了 2020 年 BAI 全球创新奖获奖名单,平安科技「蜂巢」联邦智能平台凭借「建立基于隐私安全的数据生态」的贡献,在「监管科技(RegTech)」类别中获得「监管科技创新奖」。

BAI 全球创新奖旨在对全球各地的领先金融机构进行嘉奖,目前已经步入第 10 个年头,我们注意到,平安是本届全球创新奖获奖者中唯一一家来自中国的科技企业。

毫无疑问,世界已经进入到人工智能技术蓬勃发展的新纪元。我们身边的万事万物,都在被新技术所塑造改变。

李开复在《AI未来》一书中提到,「当计算机的运算能力和工程师的能力达到一定的水准之后,数据量的多寡就成为决定算法整体效能与精准度的关键所在。」

意思很明确,算法、算力、数据是人工智能的三个底层要素,而在实际情况中,往往是数据量以及数据的优质程度,左右了人工智能的训练效果。

特别是,仅仅依靠一家企业,难以利用自身数据来训练出优秀的模型,不同的数据源都面临着相似的难题。

你可能会想说,那大家都把数据贡献出来统一整理后进行训练不就好了?是的,这样最简单粗暴,但在过程中不但有商业利益分配的问题,同时还有隐私保护和信息安全难以得到保证的问题,更不用说还需要符合监管规定。

更具体一点来说,机器学习模型在训练时需要用到大量的数据,尤其是像深度学习模型,模型学习的参数越多,训练所需要的数据将随之大量增加,约翰霍普金斯大学教授 Jeff Leek 指出,如果样本数据集很小,那还不如使用简单的线性模型。

如何在规避这些问题的同时,又能有效利用起分布在各处的数据,把模型训练得更加高效?联邦学习技术便应运而生。

联邦学习(Federated Learning)是当下人工智能技术的一个热门研究领域,在 2016 年由谷歌最先提出,简单来说,联邦学习可以绕过数据源之间的信息壁垒,不将所有数据合并到一起,而是通过协议来传递加密之后的信息,经由一系列复杂的机制设计,在保护数据隐私的同时,达到训练升级模型的效果。

香港科技大学讲席教授杨强曾在雷锋网公开课上举过一个形象的例子:

「假设用一只羊来类比机器学习模型,我们希望羊吃了草以后能够长大。」

过去的做法是,把草买到一起来建立模型。比方说左边的模型,左边的箭头是指向羊的。羊不动,但是草被购买到中心。相当于用简单粗暴的办法来获取数据,形成大数据,来建立模型。

但我们希望能够保护各自的隐私,所以让草不动,让羊动。也就是说,我们带着模型到不同的草场去访问,那么久而久之羊就长大了这个就是联邦学习的新思路,就是让草不出草场,本地主人无法知道羊吃了哪些草,但是羊还是长大了。」

因此,平安的联邦学习平台取名蜂巢,也是作了一个类似的比拟。假设数据就是花蜜,联邦学习技术就像蜜蜂采蜜一样,通过采集不同花朵的花粉并带回各自的蜂巢,最终酿出各色香甜的蜂蜜。

02 平安的「蜂巢」,强在哪?

事实上,金融行业由于对数据隐私保护、用户体验的高度重视,加之数据和资本密集,对人工智能等新技术的落地需求迫切,也成为了联邦学习技术的一个重要应用领域。

业内的共识是,联邦学习作为重要的新技术方向,未来在金融、保险、投资、教育、医疗等领域都有着广阔的发展空间。目前,国内像平安、、蚂蚁、京东、字节等科技巨头都已在联邦学习领域积极布局。

此次获奖的平安蜂巢平台的优势主要在,一方面支持百万级规模数据训练,并配备了可视化建模界面,支持基于容器的快速部署应用,能够将部署时间从传统数周缩短到短短 1 天,技术过硬且产品友好,外部用户能够迅速上手。

另一方面,在监管机构与银行的应用场景中所形成的「联邦图谱」,类似一张蛛网,所辖银行可以共同帮助监管机构优化风控模型,提升反洗钱效率,属于行业创新性的首次技术突破。此外在算子层的跨平台建模,建立行业各个平台间互联互通的标准,也是业内首次。

在银行领域,银保监会建议对数据进行国密加密,对于加密的稳定性与安全性要求更高,而目前蜂巢支持国密 SM4. 多密钥、秘密分享、差分隐私和同态加密等多层次的加密方式,以满足企业各个业务场景的不同需求。

周天财经了解到,在蜂巢具体的应用中,某银行与某电商进行联合建模,通过利用电商公司的互联网数据标签来完善优化银行的金融风控模型。建模过程中,合作双方在本地训练模型,通过交换加密下的模型中间计算结果来进行模型的全局更新与优化,替代了传统模式的数据直接共享。全程无明文数据的交换,在物理上保证了原始数据的安全性。在保证数据应用的合法合规的前提下,最终实现模型效果提升与风控策略优化。

在金融领域以外蜂巢亦有应用落地,比如某医疗科技公司与多家医院的影像科建立合作,在保证病人隐私数据安全的同时,实现多地医院共同优化医学影像模型,提升影像智能诊断的准确率。

2011 年,IBM 开发的沃森 AI 系统曾在问答节目中击败人类,名噪一时,随后 IBM 宣布沃森将被应用在医疗领域,成为一名 AI 医生,但令人唏嘘的是在今年 2 月,据华尔街日报报道,IBM 正在考虑出售 Watson Health 业务,其中一个原因就在于,在实际应用中,由于美国的医疗数据系统都是各自为战的孤岛,沃森虽然可以阅读海量论文,但却难以接触到足够大量的真实病例数据,算法缺乏数据喂养,应用效果大打折扣。

而像联邦学习技术的出现,则通过支持多个医院建立起一个数据生态,保护数据隐私的同时多方共赢,换言之,以蜂巢为代表的新平台,可能会让沃森的遗憾成为过去时。

总体而言,目前蜂巢平台已服务营销、医疗、监管风控等多个场景,从 2018 年至今,蜂巢平台先后申请了二十多项技术专利,在国内外顶会及期刊发表十余篇论文,例如在近日刚刚公布论文接收结果的国际顶级会议 ICASSP 2021 上,通过团队在 AI 领域多年的技术积累与科技创新,成功入选 2 篇联邦学习论文。

03 持续投入,监管技术合作大有可为

罗马并非一日建成,平安在技术上的领先来自于长期投入。

平安年报数据显示,截至 2020 年 12 月末,平安科技专利申请数量达到 31412 项,较年初增加了 10029 项,位居金融科技、数字医疗专利申请榜单的全球第一位,位居人工智能、区块链专利申请榜单全球第三位。

平安通过自身丰富的金融场景,为其金融科技的应用提供了锤炼的平台。比如平安银行在全流程风控平台的加持下,「新一贷」最快 10 秒放款,信用卡审批效率提升了 15 倍,并且将 2020 年的不良贷款率较年初下降了 0.47 个百分点。

平安产险则通过智能推荐引擎,车险投保方案一次询价成功率从 27% 提升到了 70%,包括平安好车主推出的「一键理赔」功能,由智能机器人和理赔专家在线支持,平均报案时间仅 2 分钟,最快结案时间仅 3 分钟,完全颠覆了过往的理赔体验。

平安也在通过金融壹账通,将其先进的金融科技能力对外输出,特别是在政府端合作,以及监管科技中取得了突破。

比如在 2020 年 5 月,证监会科技监管局与金融壹账通达成了合作,由后者提供相关科技服务,提升监管科技化与智能化水平。

2020 年 6 月,中国保险资产管理业协会和金融壹账通在线签署战略合作协议,共同开展保险资管科技创新。金融壹账通将为协会提供一系列技术解决方案,并向监管、会员及行业进行推介,提升整体的科技化数据化水平。

金融壹账通孵化自平安集团,随着能力打磨成熟,开始对外输出进行平台化运作。一系列合作的达成,一方面说明了平安在金融科技领域的领先布局,技术方案外部化得到了市场认可。

另一方面,to B、to G 的合作往往标的金额大、服务周期长,不仅看科技服务方的技术能力,也要看其业务理解能力和持续服务的稳定性。平安集团自身丰富的金融实践经验,以及品牌背书,让其形成了赋能产业的正向循环。

在 2020 年 1 月,广东省中小企业融资平台(「中小融平台」)正式上线发布,这一系统也是由金融壹账通提供技术解决方案,而根据最新披露的消息,截至今年 3 月 5 日,该平台已累计实现融资 436.9 亿元,服务当地中小企业数量超过 81 万家。

借由广东「中小融」平台,基于打通的政务数据,和其背后的大数据、区块链、AI 等先进技术,银行能够更有效地识别中小企业的潜在风险,提高放款效率,真正让金融血液注入到实体经济之中。

这一项目的成功运作,也证明了,像平安这样的大型企业的技术外部化能力,如果能够与政务力量有效合作,将会发挥出巨大的杠杆效用,让技术真正落地。

从目前的发展状况看,数据资源是联邦学习最大的金矿,仍然有着巨大的应用空间,而其技术本身的特性也意味着,与政府合作,在监管科技上突破创新必将大有可为。

在此过程中,就像我们在前面提到的那样,打破数据孤岛不仅要在技术上解决问题,同时也是在组织间建立起合作标准和范式。其中涉及到大量的细节工作以及 know-how 积累,而处在领先地位的平安集团,有望成为行业生态的主导力量。