高通徐晧:混合AI是AI的未来 让高效AI无处不在
9月5日,借助2023年中国国际服务贸易交易会成果发布平台,高通公司(Qualcomm)发布了人工智能(AI)白皮书——《混合AI是AI的未来》。高通公司中国区研发负责人徐晧博士分享了高通公司在人工智能(AI)方面的愿景,以及高通在前沿科技领域的研究和探索。

徐晧介绍称,目前AI在终端侧已经有了较为广泛的应用,包括智能手机上的人脸识别、指纹识别、背景虚化等功能;在智能家居和娱乐方面,人们经常接触到智能音箱的唤醒功能;此外,目前很多的电车也已经可以非常顺畅地与人交流,语音识别以及今后会开发出来的L4、L5级别的自动驾驶等一系列演进等。正是这些应用,不断地把人工智能技术推广到各行各业,带到每个人的身边。
徐晧认为,一个更重要的趋势是在去年年底ChatGPT发布之后,大家对大语言模型以及生成式AI有了更好的了解。而随着生成式AI快速发展,日活用户数已经达到几亿。对于生成式AI的特点以及对今后人工智能的发展有哪些巨大影响,徐晧有着自己的理解。
在他看来,首先,人们以前理解的AI往往只能处理指定的工作,现在有了生成式AI以及大模型以后,其展示出来的人工智能的能力,已经实现了革命性的突破。经过大量训练模型以及大量数据阅览,AI已经有了一定的创造和生成的能力,这是一个很重要的新特点;其次,越来越多多模态的人工智能应用正在拓展。
但由于大语言模型和多模态模型都需要大量的数据训练以及GPU的运算环境和能力,因此这部分功能在大部分时间中都停留在云端运行,而基于这种大模型进行搜索,产生的实际成本将是原先搜索引擎的约10倍,因此从成本层面来讲较难普及。
而通过什么样的方式才能将终端与云端的资源、能耗以及算力进行最优分配?徐晧认为,混合AI就是答案。他表示,混合AI,是包括云端、边缘云和终端的统一架构,进一步来说,就是将(模型的)大规模训练留到云端,执行放在终端。终端的计算能力会越来越强,因此能在终端执行或者推理的工作完全可以放在终端来做,而那些不能完成的部分,则可以通过快速、可靠的5G或6G的连接,将数据上传到云端进行运算,之后再将结果推回到终端。这样的统一架构包括了云端的训练,云端的计算,边缘云的支持,以及终端的能力,并将终端的AI能力发挥到了极致。
在终端侧处理存在的好处包括:无需将图像和视频推到云端,可以节约很多能耗和网络流量、具有一定的隐私性,并具备更快速的处理能力。而面对什么样的应用适合在终端执行,什么样的应用更适合留在云端这一问题,徐晧提出“可以让终端判断什么样的运算能够直接在终端侧处理”。
据介绍,高通在终端侧人工智能方面有着非常多的研发和产品:目前,在全世界范围内,搭载骁龙和高通平台的已上市用户终端数量已达到数十亿台,每年还有数亿台搭载骁龙和高通平台的终端进入市场;从研发层面来说,高通注重三个方向,高效硬件、算法改进和软件工具。基于高通的平台,开发者可以通过跨层的模型、硬件和软件创新等全栈AI优化,将同样的应用快速部署到不同类型的终端上。
高通从2007年就开始投入人工智能领域的研究,到今年已经推出了第八代AI引擎,伴随着技术的进步,不断地将最新的算法和最强的能力加入到每一代的高通AI引擎中,让高效的AI无处不在。
而整体模型效率研究是高通推动AI落地到终端的最重要的研究方向之一,主要包括四大领域:第一,是如何通过量化将模型从浮点运算转换为定点运算;第二是条件计算,即仅基于输入信息执行大型推理模型部分组件,实现运算简化,降低终端能耗;第三是神经网络架构搜索;第四是编译,即学习编译AI模型以实现高效的硬件执行。徐晧称,这一系列算法都可以简化模型在终端侧的运行。
此外,高通也将AI硬件加速放到了5G调制解调器及射频系统产品中,并推出了高通AI软件栈(Qualcomm AI Stack),提供了一个集成所有AI框架(如TensorFlow、PyTorch、ONNX、Keras)、开发者库、系统软件和操作系统的整合平台,有不同层面的架构支持,能够助力开发人员一次开发,即可跨不同终端和操作系统进行扩展。
在生成式AI的未来应用方面,徐晧预测,在未来几年各类终端上,可能会有影响力极大的应用场景落地。在XR方面,通过生成式AI,未来终端可以基于简单提示创作3D环境和场景;在汽车方面,生成式AI也能帮助汽车做一系列自动驾驶的优化和改进;此外,手机上能看到更多的在终端侧运行的生成式AI应用;生成式AI还将影响PC和物联网。