字节跳动升级豆包AI应用 新增实时互动视频通话功能 | 南华早报
Coco Feng
抖音母公司字节跳动近日升级了其豆包聊天机器人,这是中国最受欢迎的面向消费者的人工智能(AI)应用之一,最近推出的实时视频通话功能将该应用转变为交互式数字助手。根据上周五通过豆包微信公众号发布的公告,该功能允许用户与聊天机器人背后的AI技术进行互动视频对话。用户只需在语音通话时打开智能手机的摄像头即可激活该功能。一旦激活,豆包可以实时自动充当博物馆参观时的讲解员;观察植物时具备园艺知识的导师;在杂货店购买食材时的食谱大师;以及研究图表、图形或视频时的分析师。
据豆包介绍,新功能基于字节跳动的视觉推理AI模型构建,该模型整合了视觉和语言输入,以支持内容创作和主题深入研究。它还支持在线搜索以从互联网获取最新信息。
豆包的实时互动视频通话功能展示了字节跳动在生成式AI(GenAI),展示了基于其自身AI模型构建的产品所具备的先进多模态能力。GenAI指的是用于创建新内容的算法,包括音频、代码、图像、文本、模拟和视频。本月早些时候,豆包展示了其将任何照片转换为像素艺术的能力。2月,母公司字节跳动推出了OmniHuman-1多模态AI模型,该模型因其能将照片和声音片段转换为逼真视频的能力而广受关注。
智能手机上显示的中国聊天机器人应用图标。这些图标按顺时针方向依次为:科大讯飞的星火、字节跳动的豆包、智谱AI的智谱清言和百度的文心一言。照片:Shutterstock