腾讯混元开源:升级模型矩阵,云上推出256k长文模型
<article><section data-type=“rtext”><p>【环球网科技报道 记者 李文瑶】5月17日,腾讯云对外公布大模型研发、应用产品的系列进展。据官方介绍,腾讯混元大模型能力持续升级,多个版本模型hunyuan-pro、hunyuan-standard、hunyuan-lite通过腾讯云对外开放,满足企业客户、开发者在不同场景下的模型需求,落地最优性价比模型方案。</p><p><span data-scene=“align-justify”><font face=“楷体”>其中,</font><font face=“楷体”>最大模型已拓展至万亿级参数规模,并在</font><font face=“楷体”>1B、3B、7B、13B等不同参数量下,均有布局。</font></span></p><p><span data-scene=“align-justify”><font face=“楷体”>升级后的腾讯混元,在国内率先采用混合专家模型</font> <font face=“楷体”>(MoE) 结构,模型总体性能相比上一代提升了50%,部分中文能力</font><font face=“楷体”>已追平</font><font face=“楷体”>GPT-4</font><font face=“楷体”>,在</font><font face=“楷体”>“时新”问题的回答表现上,数学、推理等能力上均有较大提升。</font></span></p><p><img data-alt=“腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生” src="//img.huanqiucdn.cn/dp/api/files/imageDir/21896f174e8ada69437618352246c63cu1.png?imageView2/2/w/750" /></p><p><span data-scene=“align-justify”><font face=“楷体”>在腾讯云上,混元大模型也提供了万亿参数</font><font face=“楷体”>hunyuan-pro、千亿参数hunyuan-standard、百亿参数hunyuan-lite等多种尺寸的模型服务,目前已面向企业及个人开发者全量开放。</font></span></p><p><span data-scene=“align-justify”><font face=“楷体”>hunyuan-standard最新上线了支持256k超长上下文窗口的长文模型,具备单次处理超过38万字符的超长文本能力,在长文档的阅读理解和大规模数据分析方面展现出强大性能,能够为金融、医疗、教育、出行等行业的专业人士提供强有力的工作支持,显著提高工作效率。</font></span></p><p><span data-scene=“align-justify”><font face=“楷体”>在多模态能力方面,混元大模型也持续迭代升级。在生图领域,腾讯混元文生图基础架构已全面升级至</font><font face=“楷体”>Sora同款的DiT架构,支持中英文双语输入及理解,具备多轮绘图能力,测评结果国内领先;在生视频领域,腾讯混元支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力,</font><font face=“楷体”>已经支持</font> 16s 视频生成<font face=“楷体”>;在生</font><font face=“楷体”>3D层面,腾讯混元已布局文/图生3D,单图仅需30秒即可生成3D模型。</font></span></p><p><span data-scene=“align-justify”><font face=“楷体”>腾讯集团副总裁蒋杰宣布,腾讯混元大模型将拥抱开源。此前,混元文生图大模型已全面开源,仅</font><font face=“楷体”>3天时间就在Github上获得超千位开发者关注。多种尺寸的腾讯混元MoE模型也即将对外开源,可分别支持手机端、PC端、云/数据中心等多样化的部署场景。</font></span></p><p>腾讯云大模型知识引擎、图像创作引擎、视频创作引擎三大工具发布,打造大模型时代原生工具链,通过PaaS服务简化数据接入、模型精调、应用开发流程,助力企业更高效、简单地用大模型开发AI原生应用,快速接入生产场景。 </p><p>腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,通过打造高性能的模型、高效率的工具平台、高敏捷的场景应用、高可用的算力基础设施,以及强安全的模型环境,构建离产业最近的AI。</p></section></article>