作者 | 邬学宁
编辑 | 陈静
题图 | 网络
上海2018年“创客中国”高峰论坛上,数据科学50人成员、SAP硅谷创新中心首席数据科学家邬学宁以“大数据驱动人工智能的应用和展望”为主题发表了演讲。随着物联网、云计算和移动互联网等技术的发展成熟,大数据驱动的人工智能进行“双创”的风口,已经到来。DT君整理出了数据侠邬学宁的演讲实录,一起来看看用大数据当燃料,能“燃”起人工智能怎样的未来吧~
▍人工智能的两次寒冬及未来走向
近年来,人脸识别、无人驾驶、医疗影像辅助诊断和机器翻译等大量人工智能应用落地,各种商业创新蓬勃发展。2017年被称为人工智能商业化和产品化的元年,但人工智能并非新技术,已经有了一个甲子六十年的坎坷发展史,期间经历了两次“AI寒冬”。
当人工智能这个术语在上世纪50年代被首次提出时,整个社会处于对其的盲目乐观状态,当时美苏正处于冷战时期,对前苏联监听内容需要大量人工翻译,有科学家乐观的估计只需五年时间,人工智能的机器翻译系统就能替代人工翻译,但过了五十年,该理想都还未能实现。到上世纪60年代,人工智能对于其承诺的愿景,大多没有做到。1973年,英国发表了James Lighthill报告,批评人工智能研究进展令人失望,建议暂停对其的研究,英美政府停止资金支持,人工智能陷入了长达十年的首次寒冬。
上世纪80年代,霍普菲尔德网络、神经网络反向传播算法和专家系统等突破,人工智能再次热门起来,但因受限于计算力和数据,人工智能进入了第二个“冬天”。
(图片说明:人工智能60年发展史)
21世纪的首个十年,神经网络以深度学习的形式再次回归,人工智能进入了第三个春天。
本轮人工智能被媒体大众所广为熟知,可能要归功于AlphaGo和李世乭的“人机大战”。AlphaGo不仅精于计算,而且具有极好的棋感和大局观,并使用了人类围棋史上未曾出现过的招式,令整个围棋界惊呼:“围棋上帝降临!”
AlphaGo使用深度学习和“强化学习”相结合的人工智能技术,所谓“强化”是心理学“行为主义”学派的一个概念,指动作被强化,这是一种类似于多巴胺的机制,比如我们偶尔喝了杯咖啡,感觉不错,大脑会分泌多巴胺,使我们以后喝咖啡这个动作的概率上升。AlphaGo Zero更是完全依靠强化学习进行自我迭代,它为什么叫Zero?就是因为它完全放弃了人类的知识,从0开始完全依靠自己左右手互搏,进行迭代进化。在金融市场、无人驾驶、库存管理、通讯和电子竞技(Dota)等众多领域,强化学习均有广泛的应用前景。
这一次人工智能的未来走向可能是什么样的?有以下三种可能。
第一个走向:人工智能是“神”。奇点理论的提出者奇点大学校长,谷歌人工智能总监雷·库兹韦尔认为,随着纳米技术、生物技术等呈几何级数加速发展,未来20年,人类的智能将会大幅提高,人类的未来也会发生根本性重塑。在‘奇点’到来之际,机器将无需人类干预,而通过人工智能实现快速的自我进化,智力全面碾压人类,从而开启一个全新的时代。孙正义认为2060年超人工智能的智商可能达到一万,而爱因斯坦的智商只有两百,彼时,人工智能与人类智商的差距,如同我们与蚂蚁智商的差距,它就像“神”一样的存在了。
第二个走向是沿着神经网络深度学习的路径继续发展。深度学习依赖大数据的驱动,大数据红利已经吃得差不多了,所以接下来人工智能会沿着目前的轨迹继续发展,但增速放缓。
第三个走向是再次滑落低谷。人工智能又会重蹈覆辙,再次走入低谷。
(图片说明:人工智能未来可能的发展走向)
▍人工智能的主要技术
本轮人工智能,落地应用最多的恐怕非计算机视觉莫属。
计算机视觉技术被大量应用在无人驾驶、安防、零售和医疗等领域。
今年美国CES上有很多的计算机视觉的创新应用。比如说女生出差旅行的时候拉一个很大的行李箱很不方便,基于计算机视觉技术的箱子可以跟着主人走,以后就再也不用拖着拉杆箱出行了。另一个创新应用:据统计,家用冰箱里有20%的食品处于过期的临界状态,计算机视觉可以扫描每个食品的保质期,在临近保质期的时候即使提醒用户。
计算机视觉的算法,源于1960年代霍普金斯大学的两位教授的实验,他们在猫的脑壳上打了个小孔,放入微电极,通过给猫看不同的视觉信号,发现猫的视觉是分层的。这两位教授也获得了1980年诺贝尔医学奖,半个世纪之后,该发现对人工智能的巨大推动作用估计是他们两位所始料未及的。基于分层识别模型的计算机视觉卷积神经网络发已经超过了人的视觉的判别能力。
哺乳动物的视觉是分层的,深度学习的神经网络也由很多层组成。以人脸识别为例,深度学习的输入层对应视网膜的像素层;第一层对应视觉皮层V1,进行边缘检测,勾勒出线条和轮廓,第二层在第一层的基础之上进行抽象,形成鼻子、眼睛等五官特征,第三层再继续进行抽象,构建出人脸。
(图片说明:卷积神经网络(CNN)对人脸的分层处理)
对于人工智能领域的创业者有以下一些建议。中国现在已经有15家做人脸识别的比较成规模的企业,从创业的角度来说,做人脸可能有点晚了,但是将计算机视觉与其他行业相结合,比如上面提到的拉杆箱、电冰箱等,尚有很大的发展空间。
第二个深度学习的主要技术是循环神经网络(RNN)。
地球上有很多动物的视觉要比人好,但是只有人具有语言系统可以表达复杂的思想和情感。自然语言处理技术这两年也取得了很大的进展,主要是采用循环神经网络加上注意力机制的算法。
(图片说明:自然语言处理算法:循环神经网络+注意力机制)
现在各大厂商都在做智能音箱,比如天猫精灵、小米小爱、京东叮咚、百度小度、Google Home 和 亚马逊Alexa等等。智能音箱被认为可能是下一代互联网的入口。同时,机器翻译技术也已达到了实用水平,出现了谷歌翻译、科大讯飞翻译机等一批优秀的翻译系统。自然语言处理主要采用的是循环神经网络技术,该技术与大脑认知过程中的工作记忆和长期记忆的协同机制很类似,结合注意力机制,人工智能在自然语言方面取得了很大的进展。
深度学习第三大创新是对抗生成网络(GAN),GAN将博弈论引入机器学习建模中,使两个模型进行对抗,不断进行自我迭代提升,最终达到纳什均衡,使机器能生成很多真假难辨的艺术品。
很多人认为人工智能不能从事画家那样的创造性的工作,而然GAN颠覆这一观点。比如你告诉AI“一辆巴士在空中飞”,AI就会“想象”出一幅画来,一辆巴士长了翅膀在空中飞。
(图片说明:GAN基于文字“一只胸部是白色、头是淡灰色、翅膀和尾巴是黑色的小鸟”所生成的图像)
▍理性偏乐观看待人工智能
我们可以用一种理性偏乐观的态度看待人工智能。目前的人工智能还是在解数学的最优化问题,人工智能并不具有“自我”的意识,离威胁人类还非常遥远,也没有看到明确的路径。
本轮人工智能是多学科交叉融合的结果。Hinton教授十年前刚提出深度学习模型时,是基于量子力学的玻尔兹曼机模型,之后认知科学、行为主义心理学和博弈论都对人工智能的发展起到了巨大的推动作用。
深度学习模型通过大量“训练”,所“学到”的是几何的角度从输入空间到输出空间的复杂映射,本质上仍然是求解数学函数的最小值。深度学习依赖大量的标签数据,无人驾驶公司雇了很多的人来人肉打标签,打标签的费用甚至比科学家团队的费用还要高,可以用:“没有人工就没有智能”来概括目前深度学习对标签数据的高度依赖。对于已经积累了大量标签数据的企业来说,深度学习可能是一个产品创新的利器,对于没有那么多数据的初创企业而言,基于“小数据”的知识图谱可能更适合,知识图谱是人工智能“符号主义”延续下来的血脉,能很好地表达人类的先验知识。
目前人工智能是没有意识的,AlphaGo并不知道它在下棋。担心人工智能统治人类的人,包括霍金和马斯克,大多都是没有自己亲身实践过人工智能算法的经验,他们的担心源于不了解。但是人工智能的确已经在倒逼道德和法律的发展。
“人工智能虽然还是很‘笨’的,但是已经足够改变行业了。凡事过去,皆为序章。未来30年人工智能的全面落地将会改变所有的行业和对人类命运产生深远影响,被称为“数字文艺复兴”和“第四次工业革命”,目前还处在商业化的早期,现在开始着手利用人工智能进行创新创业一点都不晚。
未来是属于大家的,也是属于人工智能的,但归根结底,是属于会造人工智能的人的。
注:本文整理自作者在上海2018年“创客中国”高峰论坛上的演讲实录。内容仅为作者观点,不代表DT数据侠立场。
期待更多数据侠干货分享、话题讨论、福利发放?在公众号DT数据侠(ID:DTdatahero)后台回复“数据社群”,可申请加入DT数据社群。
▍数据侠门派
本文数据侠邬学宁,SAP硅谷创新中心首席数据科学家,2018年数据科学50人成员,复旦大学人工智能客座讲师,致力于机器学习与人工智能算法研究,在全球零售、金融、制造、医疗、智慧城市等不同行业拥有丰富的利用大数据进行产品与商业模式创新的经验,著有《SAP企业机器学习》(清华大学出版社),曾担任教育部高教委骨干师资培训班大数据课程讲师,openSAP讲师。
▍加入数据侠
“数据侠计划”是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。了解数据侠计划详情请回复“数据侠计划”,投稿、合作请联系datahero@dtcj.com。
返回搜狐,查看更多
责任编辑: