Amazon Bedrock推出多个新模型和全新强大的推理和数据处理功能
北京2024年12月6日 /美通社/ -- 亚马逊云科技在2024 re:Invent全球大会上,宣布推出Amazon Bedrock的多项创新功能。Amazon Bedrock是亚马逊云科技一项完全托管的服务,旨在利用高性能基础模型构建和扩展生成式人工智能(AI)应用程序。此次发布进一步彰显了亚马逊云科技对模型选择的承诺,同时优化了大规模推理的执行方式,帮助客户从数据中挖掘更多价值。
亚马逊云科技人工智能和数据副总裁Swami Sivasubramanian博士表示:“Amazon Bedrock服务持续快速增长,因其广泛而领先的模型选择、可轻松基于自身数据进行定制的工具、内置的负责任的AI功能以及开发复杂智能体的能力成为越来越多客户的选择。为了让客户充分释放生成式AI的潜力,Amazon Bedrock一直致力于解决开发人员当前面临的最大挑战。通过此次新发布的一系列新功能,我们将帮助客户开发出更智能的AI应用程序,让他们为其最终用户创造更大价值。”
汇集领先AI公司的广泛模型选择
Amazon Bedrock为客户提供丰富的完全托管的模型选择,这些模型来自领先的AI公司,包括AI21 Labs、Anthropic、Cohere、Meta、Mistral AI以及Stability AI等。此外,Amazon Bedrock是客户使用新发布的Amazon Nova模型的唯一渠道。Amazon Nova是新一代基础模型,以行业领先的性价比为广泛的任务提供先进的智能能力。通过此次发布,亚马逊云科技在Amazon Bedrock上新增更多行业领先的模型,进一步扩展Amazon Bedrock的模型选择范围。
通过Amazon Bedrock Marketplace访问100多个热门、新兴和专业模型
尽管Amazon Bedrock中的模型能够支持众多任务,许多客户仍希望将新兴的专用模型融入到他们的应用程序中,为其独特的用例,如分析财务文档或生成新型蛋白质等提供支持。借助Amazon Bedrock Marketplace,客户如今能够轻松地从100多个模型中进行查找与选择,这些模型可部署在亚马逊云科技上,并能通过Amazon Bedrock中的统一体验进行访问。这涵盖了诸如Mistral AI的Mistral NeMo Instruct 2407、Technology Innovation Institute的Falcon RW 1B以及NVIDIA NIM微服务等热门模型,以及众多专业模型,如用于金融行业的Writer的Palmyra-Fin、用于翻译的Upstage的Solar Pro、Camb.ai的文本转音频MARS6以及用于生物学的EvolutionaryScale的ESM3生成模型等。
客户一旦找到他们想用的模型,就能依据自身扩展需求选择合适的基础设施,并通过完全托管端点轻松将其部署在亚马逊云科技上。客户随后可将该模型与Amazon Bedrock的统一应用程序编程接口(API)安全集成,从而使用诸如Guardrails和Agents等工具,并受益于内置的安全和隐私功能。
Zendesk是一家全球服务软件公司,服务于覆盖全球10万个品牌的多元文化客户群体。该公司可在Amazon Bedrock中使用如用于翻译的Widn.AI等专用模型,通过电子邮件、聊天、电话以及社交媒体对客户服务请求进行个性化和本地化处理。这将为客服人员提供其所需的数据,比如客户母语表达中的情绪或意图等,最终提升客户服务体验。
提示词缓存和Intelligent Prompt Routing帮助客户大规模处理推理问题
在选择模型时,开发人员需要权衡多种因素,如准确性、成本和延迟。针对其中任一因素进行优化,都可能意味着在其他因素上做出让步。为了在将应用程序部署到生产环境时平衡这些考量因素,客户会采用多种技术,例如缓存常用提示词或将简单问题分配给较小模型。然而,运用这些技术既复杂又耗时,需要专业知识来反复测试不同的方法,以确保终端用户获得良好的体验。正因如此,亚马逊云科技新增了两项功能,帮助客户更有效地大规模管理提示词信息。
- **通过缓存提示词功能降低响应延迟和成本。**Amazon Bedrock现已支持安全地缓存提示词,从而减少重复处理,且不会影响准确性。对于受支持的模型,此功能最高可将成本降低90%,并将延迟最多缩短85%。例如,一家律师事务所可以创建一个生成式AI聊天应用程序,用于回答律师有关文件的问题。当多名律师在提示词中询问关于文档同一部分的问题时,Amazon Bedrock能够缓存该部分内容,使其只需处理一次,之后每当有人想要询问相关问题时便可重复使用。这通过减少模型每次需要处理的信息量来降低成本。Adobe的Acrobat AI助手通过实现快速文档摘要和问答功能,提高了用户的工作效率。根据初步测试,借助Amazon Bedrock上的提示词缓存功能,Adobe发现其响应时间缩短了72%。
- **提示词智能路由功能有助于优化响应质量和成本。**借助该功能,客户能配置 Amazon Bedrock 自动把提示词分配至同一模型系列里的不同基础模型,以优化响应质量和成本。运用先进的提示词匹配和模型理解技术,提示词智能路由能够预测每个请求对应的每个模型的性能,并将请求动态路由至最有可能以最低成本提供所需响应的模型。提示词智能路由可在不影响准确性的情况下,将成本降低多达30%。Argo Labs为餐厅提供创新的语音代理解决方案,通过提示词智能路由处理各类客户咨询和预订业务。当客户提交问题、下单以及预订位置时,Argo Labs的语音聊天机器人会动态地将查询请求路由至最合适的模型,从而优化响应的成本和质量。例如,像"今晚这家餐厅有空桌吗?“这样简单的是非问题,可以由较小模型处理,而"这家餐厅提供哪些素食选项?“这类更复杂的问题则可由较大模型来回答。借助提示词智能路由功能,Argo Labs能够利用其语音代理无缝处理客户交互,同时实现准确性和成本之间的合理平衡。
Amazon Bedrock**知识库的两项新功能助力客户最大程度发挥数据价值
无论自身数据存储于何处、采用何种格式,客户都希望利用它们为终端用户构建独特的由生成式AI驱动的体验。知识库是一项全托管功能,客户借助检索增强生成(RAG),能够轻松利用上下文相关及关联数据自定义基础模型的响应。虽然知识库已能便捷地连接至诸如Amazon OpenSearch Serverless和Amazon Aurora等数据源,但许多客户还希望将其他数据源和数据类型融入其生成式AI应用程序中。基于此,亚马逊云科技为知识库新增了两项功能。
Amazon Bedrock Data Automation将非结构化多模态数据转换为结构化数据,用于生成式AI**和分析
如今,大多数企业数据都是非结构化的,这些数据包含在文档、视频、图像以及音频文件等内容中。许多客户希望利用这些数据挖掘见解或为客户打造新体验,但将其转换为便于分析或RAG所需的格式往往是一个艰难的手动过程。例如,银行在处理贷款业务时可能会接收多个PDF文档,需要从每个文档中提取详细信息,对姓名、出生日期等特征进行标准化以保证一致性,然后将结果转换为文本格式,再输入数据仓库进行分析。借助Amazon Bedrock Data Automation,客户能够使用单个API从非结构化内容中大规模自动提取、转换并生成数据。
Amazon Bedrock Data Automation能够快速且经济高效地从文档、图像、音频以及视频中提取信息,并将其转换为结构化格式,适用于智能文档处理、视频分析以及RAG等用例。该功能可以使用预定义的默认设置生成内容,例如视频片段每个场景的描述或音频的转录内容,客户也可以根据自身的数据架构生成定制化的输出内容,并将其轻松加载到现有的数据库或数据仓库中。通过与Knowledge Bases的集成,Amazon Bedrock Data Automation还可以解析内容以支持RAG应用程序,通过整合嵌入在图像和文本中的信息,提升结果的准确性和相关性。同时,该功能提供置信度评分,并基于原始内容生成响应,有助于降低生成"幻觉"风险并提高透明度。
Symbeo是一家隶属于CorVel的公司,提供自动化应付账款解决方案。Symbeo计划利用Amazon Bedrock Data Automation,从复杂的文档(如保险理赔、医疗账单等)中自动提取数据。这将帮助Symbeo的团队更快速地处理理赔事务,并缩短向客户回复的周转时间。数字资产管理平台Tenovos正在使用Amazon Bedrock Data Automation在大规模语义搜索中提升内容的复用率,复用率提高了50%以上,节省了数百万美元的营销费用。
Amazon Bedrock Marketplace现已正式可用,同时Amazon Bedrock Knowledge Bases中的推理管理功能、结构化数据检索、GraphRAG以及Amazon Bedrock Data Automation均已预览可用。此外,Luma AI、poolside和Stability AI的模型也即将上线。
免责声明:
本新闻稿中提及的生成式AI新发布服务暂时仅在亚马逊云科技境外区域可用,亚马逊云科技中国仅为帮助您了解行业前沿技术和发展海外业务选择推介该服务。
消息来源:亚马逊云科技