KPHZ致力于打造以知识产权为核心,搭建促进国际技术转移、科技成果转化的专业化服务平台!
KPHZ致力于打造以知识产权为核心,搭建促进国际技术转移、科技成果转化的专业化服务平台!
近日,博鳌亚洲论坛国际科技与创新论坛首届大会在澳门隆重举行。本届大会以“创新赋能可持续发展”为主题,汇聚了来自25个国家将近千名政要、行政长官、商界领袖、学术专家,围绕科技创新促进世界经济复苏和全球可持续发展等焦点话题进行了探讨。
其中,“创新动力——人工智能,拥抱未来”分论坛邀请了欧洲科学院外籍院士陈俊龙、中国工程院院士戴琼海、加拿大科学院院士张大鹏、IEEE Life Fellow Imre J. Rudas、第四范式副总裁、主任科学家涂威威等学术代表就人工智能技术趋势进行了分享。其中,涂威威以“Towards AI for Everyone”为题,介绍了当下AI的思考与发展。
以下为演讲实录:
·AI发展三部曲
AI是一个非常年轻的学科,根据南京大学周志华教授的总结,自1956年被提出至今,共经历了3个阶段:推理期、知识期、学习期。人工智能的研究学者希望让机器自己有思考的能力,使机器更聪明,能够做更多需要人类智慧才能做的事情。当时大家普遍认为数学家是最聪明的人,数学家最强的是推理能力。于是,当时人们觉得要实现AI需要具备数学家的推理能力,“自动定理证明”是当时最经典的工作之一。但人们很快发现只是数学定理的推理,并不能解决很多实际的问题,比如前面张院士提到的中医望闻问切,以及当我们想预测病人疾病未来的走势时,自动的几何定理证明系统并不能回答疾病相关的问题。
于是,人们意识到AI光有推理是不够的,还缺乏相应的知识,需要通过知识去总结并指导未来的生产。随后,AI进入了知识期,期间非常经典的工作叫“专家系统”,总结人类专家的经验并固化。但是人类专家的经验总结起来非常复杂,比如老中医很难准确地说出自己的判定逻辑。这个方向曾经引爆了人工智能的一次短暂的高潮,然而很快随着许多应用落地的失败,AI进入了寒冬。
而将AI带出寒冬的是机器学习技术。经过多年发展,AI来到了学习期,从知识工程过渡到机器学习,不再依赖于人类专家总结经验规律,而是让机器从数据中直接学习,从数据中总结规律。机器学习的经典定义,是计算机程序利用经验来改善系统性能,而这里的经验往往是指数据。目前,机器学习在我们熟知的AlphaGo、互联网巨头们的搜索与推荐系统、在线广告系统、金融市场分析、计算机视觉、语言学、生物信息学等诸多领域都取得了很大的成功。
·机器学习因何让AI走向成功?
因此,我们需要思考:AI为何在机器学习时代成功了?其原因在于机器总结的业务规则要远超人类专家,人类总结成百上千条已是极限,但机器可以基于海量数据不知疲倦地总结并发现数十亿条规则。正因如此,我们的高维机器学习应用到互联网营销、点击率预测、糖尿病预警、金融反欺诈等众多行业场景中,取得了比专家更好的业务效果。
造成上述的原因在于人类受限于大脑的生理构造,计算以及存储能力受限。诺贝尔奖、图灵奖获得者Herbert A.Simon就因提出“有限理性”理论获得诺贝尔奖。简单来说,就是人在做决策的时候,由于多方面因素的限制,只是追求当下满意的决策而非最优决策。此外,人的思维是过度泛化的,尽可能把问题想的简单,便于思考和处理,但现实问题往往是很复杂的。
机器的优势在于可以更好的解决问题的复杂性,全面分析问题,并实时响应,提供极致更优解,且相比于人类经验的难以复制,机器的这种能力有非常强的可复制性。
·AI全面赋能企业决策
机器这样的能力如何更好地为企业所用?事实上,Herbert A. Simon也曾说企业最核心的问题是决策,西方军事学家John Boyd认为决策的过程是由“观察、判断、决策、行动”四步骤组成的相互关联、相互重叠的循环周期,也就是所谓的OODA循环。
首先需要通过数据观察现在业务的状况,其次对业务进行更深入地分析并对业务发展进行准确预判,再为各类业务问题寻求能够实现其价值最大化的更优决策,最后按照决策结果采取相应行动,最终完成整体的管理行为。
AI在其中每一环都可以赋能。在观察阶段,AI可以实现文本、语音、图像等全场景、多模态数据的“观察”,不知疲倦的协助决策者处理企业业务有关的海量数据,提取对决策有价值的关键信息﹔在判断阶段,机器可以帮助企业利用数据,从业务中总结出足够多的规律,构建更复杂的业务规则,帮企业更好地认识业务发展,同时因为决策会影响未来,AI也能够帮助企业对未来有更加精准的预判﹔在决策阶段,机器可以进一步发挥优势,凭借强大的计算能力进行全局精准决策优化,最终为行动提供指导。
·AI走向普及技术创新仍是关键
AI不应该只是巨头们的摇钱树和竞争利器,AI作为先进的生产力,应该为更多的企业与人所用,为社会创造更大的价值。然而,在AI规模化落地的过程中,企业又不得不面临认知、数据、人才、工具、技术、规模等落地门槛。例如在数据方面,除了面对数据多样性,还要面对数据大规模增长、数据不一致、数据有效性差、数据分布漂移等问题,因此需要在针对AI的数据治理工具、弱监督学习、数据增强、主动学习等方面发力,解决数据的“壁垒”。
在人才方面,目前,顶尖的机器学习专家团队参与了包括定义问题、收集数据、数据预处理、特征工程、选择或设计模型架构、调整模型超参数、性能评估等机器学习的所有阶段,这也说明了机器学习技术本身有着极高的技术门槛,AI人才匮乏、专家经验难以复制等诸多因素阻碍了AI在各领域落地。
为了推动机器学习技术在更广泛的场景应用,AutoML(自动机器学习)成为了学术界和工业界的研究重点。其目的是将机器学习过程自动化,以低门槛的形式实现AI构建和应用,解决AI落地对高水平人才的依赖问题。目前,AutoML已可实现感知类、预测类、决策类等不同场景的应用开发,并在第四范式的众多客户中取得了不错的落地效果。
当然,机器学习也有一定的局限性。机器学习有一个假设叫“独立同分布”,它使得机器学习应用的场景都是受限的,只能在一个封闭的领域去使用。要解决这些问题,我们需要应对适应性的挑战,通过强化学习、迁移学习等技术,解决数据分布变化、环境动态交互、新任务目标、数据概念变化等问题。此外,还需要可解释机器学习、差分隐私、联邦学习、多方安全计算等技术解决信任、隐私保护和公平性挑战。
机器学习应用落地还有一点不可忽视,就是算力。如今超高维、多样化的数据、多样性需求、甚至是不同的模型都对计算效率提出了更高的要求。为了顺应AI时代的计算模式,需要将算法与底层硬件的深度融合,从计算、存储、网络、调度等方面进行软硬一体化设计﹔还需要大规模分布式机器学习计算框架、专用AI芯片充分发挥算法的优势,进一步提升AI的计算效能。