#parse("/0080/e/0080ep_includecss_1301.vm")
网易首页 > 网易河北 > 正文

微众银行杨强:如何突破人工智能的数据瓶颈?

0
分享至

人工智能的边界和挑战是什么?现在走到了哪里,又该向何处去?5月24日-25日在成都举办的CCF年度盛会——2019 CCF青年精英大会(YEF 2019)上,人工智能领域专家们展开了讨论,中国科学院张钹院士给出的答案是“人工智能刚刚起步,现在离起点不远,人工智能之路还很长,并且永远在路上。”

虽然人工智能技术的行业应用越来越广泛,仿佛真的站在风口准备拥抱下一场革命,但正如专家们所言,对于人工智能的发展,应该保持谨慎的乐观态度。当前人工智能还面临诸多挑战,例如数据孤岛问题、隐私保护问题、安全问题、如何从感知智能发展到认知智能再到更远的让机器拥有自我认知等等,突破这些瓶颈,或许才是人工智能走得更远的关键。

其中数据孤岛和隐私保护问题是当前人工智能大规模产业化应用过程中遇到的突出问题。对此,人工智能国际专家、微众银行首席人工智能官杨强教授在大会上发表了题为《用户隐私,数据孤岛和联邦迁移学习》的特邀报告,他的答案是:开展新一代的人工智能算法研究,突破数据孤岛和小数据的限制,同时保护数据安全和用户隐私。这个答案的背后是一项新的领先全球的技术,叫做“联邦迁移学习。”

image.png

大数据时代并未真正到来,小数据和数据孤岛林立

杨强教授指出,人工智能发展离不开大数据,人工智能技术如果是火箭引擎,大数据就是燃料,但是数据量的激增并不意味着真正的“大数据”时代到来。多数行业中是数据质量不高的“小数据”,是一个个数据孤岛,数据割裂严重。

例如在法律领域,如果想得到一个非常好的样本,需要经历很长的链条,经过很长时间,有法官、律师等多方参与,才能把一个样本标注好,这导致有标注的高质量数据并不多,并且分散在各地的各级法院。而在医疗领域这种数据孤岛更加严重,例如医疗影像往往分散在各个医院。导致这种结果的原因很多,包括监管原因、机构各自的利益、流程制度限制等。

从迁移学习到联邦学习,打通数据孤岛

能否从技术角度寻求解决方案?作为国际人工智能界“迁移学习”(transfer learning)领域的发起人和带头人,杨强教授从迁移学习中找寻问题的答案,首先想到通过知识迁移解决“小数据”问题。如果面临的是“小数据”,就找到一个类似的“大数据”,举一反三,帮助只有小数据的任务运用来自其他相关任务的大数据,从而获得更好的表现,使得建立的模型能够更可靠,鲁棒性好,不受外界干扰,平稳运行,这在人工智能落地的应用上是非常重要的一个特性,同时也能够防止隐私泄露。这种从源领域迁移到目标领域的方式,在金融、工业、信息流推荐等领域都有应用,例如贷款风控策略在不同用户类别间的迁移、推荐系统中推荐策略迁移、舆情分析系统中的关键词迁移等。

image.png

虽然迁移学习可以有效解决“小数据”的问题,但是实际上现在面临的不仅仅是“小数据”的问题,而是“数据割裂”、“数据孤岛”。这不仅仅是技术的问题,不能通过简单的数据整合(Data integration)解决,而是要克服政策、监管、技术等多维度难题。此时“联邦学习”(Federated Learning)提供了新的思路,让多方参与,共同建模。

image.png

从联邦学习到联邦迁移学习,保护数据隐私

打通数据,共同建模,这本是一个美好的期望方向,但数据隐私保护的日益严格带来了严峻挑战,欧盟数据隐私保护法GDPR(The General Data Protection Regulation )作为“史上最严厉”的数据隐私保护法案成为一个信号,全世界都在加强数据隐私保护方面的立法建设,那么是否可以让联邦学习参与方只交换模型而不交换数据?让数据不出本地,从而保护数据隐私?据杨教授介绍,数学家们提供了新思路——将同态加密技术(Homomorphic Encryption,HE)融入联邦学习,其核心思想并不复杂,假设A加B是一个公式里的两项,对整个公式加密,那么HE就可以把它表达成对A的加密加上对B的加密。这样可以让参与方不上传数据,只上传加密的算法模型参数而进行共同建模,在这个过程中,即使通过多次交换,也不能重构出另一方的数据,真正实现数据不泄露。

在实际应用中,有基于同一特征维度,不同用户群体的“横向联邦”,例如谷歌的手机终端联邦学习,微众银行联合多家银行建立的反洗钱模型,以及针对同一用户群体,不同特征维度的“纵向联邦”,例如根据用户在银行的信用表现进行个性化保险定价。除此以外,微众银行AI团队首次提出了“联邦迁移学习”,将“联邦学习”和“迁移学习”相结合,即使是在用户群体和特征维度重合都小的情况下,也可以进行合作,这意味着无论是政府机构和金融机构之间,还是互联网机构和金融机构之间,或者是其他各领域之间,都可以实现跨界合作。

image.png

联邦学习不仅是技术方向,更是社会问题

杨强教授提到,虽然有了技术工具,微众银行也对外开源了通用的联邦学习框架平台Federated AI Technology Enabler(FATE),但如何设立激励机制吸引机构进入联邦,形成良性生态,则包含博弈论、机制设计、法律等多领域,联邦学习不仅是能解决数据孤岛和数据隐私保护的技术方向,更是一个复杂的社会协同治理问题。除了吸纳更多企业加入联邦生态,微众银行AI团队也在积极推动联邦学习国际标准IEEE标准的制定,这一标准有望在两年内出台,为立法和监管提供更多技术依据。

image.png

联邦学习将走向何方?人工智能将走向何方?杨强教授的观点是,数据可以不出本地,各个数据拥有方可以在安全、保密的前提下交换人工智能模型的参数,以达到联合建模的目的。这种不同学科的交叉融合是趋势,联邦学习和迁移学习,或者是其他机器学习方法,都可以相互融合,发挥各自的特点,从一个领域下的人工智能算法理论迈向多个领域,这才是更有价值的研究。

相关推荐
热点推荐

中国的富豪向美捐1亿美元,又向我国捐百亿,却遭到李嘉诚的反对

室内风格
2021-06-12 07:02:25

港台明星接连打国产疫苗,绿媒急了,台湾老百姓更急!

上海新闻广播
2021-06-12 23:08:33

台积电突破1nm芯片,中国却掌握着这种原材料的命脉:存储量达全球75%!

前瞻网
2021-06-13 09:32:16

“地铁奶奶”走红,优雅气质引热议,网友赞叹:老版章子怡

健身魔鬼说
2021-06-11 21:00:15

冯雷46岁仍未婚:爸爸妈妈,我是正常男人

茶余饭后说名人
2021-06-13 09:00:18

贾玲目测有200斤!穿衬衫配半身裙成五五分身材,胖成两个张小斐

时尚艾娃Elvaav
2021-06-12 22:47:18

警惕!又一地出现本土感染者!

海峡都市报
2021-06-12 12:15:01

8年前,李双江小儿子被判入狱10年,如今他现状怎样了?

麦大人
2021-06-11 11:15:06

女孩商场浪漫告白,告白结束突然说分手转身离去,路人:看不明白

视点新闻
2021-06-12 15:30:44

中国第一女贪官案细节披露:40位上司被她迷倒,9人发生关系敲诈

和讯网
2021-06-02 15:50:22

“他长得那么帅,怎么会骗人?”

青年观察家
2021-06-12 20:48:57

中国女排1人实力提升,美国队主帅都另眼相看,他这次是真怕了

开球咯
2021-06-13 01:13:40

一个“强奸罪人”自证清白20年:她丈夫报的警 我否认却遭殴打 家属被通知交7000就能解决

海峡都市报
2021-06-12 11:00:15

大S深夜用小号突发两文,疑似发出求救信号:我们被集体屠杀了

正能量瓜总
2021-06-12 02:24:39

周也的脸看着就很“贵”,就算涂了俗气的眼影,也照样hold得住

Ainee小屋
2021-06-12 20:43:56

你见过世界观最宏大的游戏是什么?

平行鱼贩
2021-06-13 07:57:41

德国队全体成员与埃里克森的照片合影:希望一切平安顺利

虎扑足球
2021-06-13 04:43:07

山东一“人造景区”爆火,斥资3亿门票120元,游客:比真的还真!

吃喝玩乐百事通
2021-06-12 15:24:36

小时候没看懂,成人后才发现这部日本版《鬼子来了》藏这么多暗喻

皮皮电影
2021-06-13 08:53:18

重磅!利拉德回应加盟湖人!太阳3-0掘金让他认清现实

球王体育
2021-06-13 13:09:44
2021-06-13 14:33:08

头条要闻

欧洲记者:G7峰会每天用的检测试剂是“中国制造”

头条要闻

欧洲记者:G7峰会每天用的检测试剂是“中国制造”

财经要闻

体育要闻

惊魂!埃里克森突然昏厥 如今情况稳定

娱乐要闻

倪妮同框张艺谋 为刘浩存温柔擦眼泪

科技要闻

未来公开课第六期|郝景芳

汽车要闻

硬刚理想和蔚来 岚图FREE将于6月19日上市

态度原创

家居
游戏
教育
数码
时尚

家居要闻

湖南大哥花150万回乡建法式别墅 庭院堪比游乐场

《消逝的光芒2》公布7分钟实机演示 12月7日正式发售

教育要闻

由剑南春赞助,名师张雪峰解读新高考

数码要闻

5天股价翻倍 鸿蒙概念股坐不住了:买我风险很高

新青年UP|专访王琳凯:“幼稚鬼”不必长大