OpenAI的新人工智能代理需要大量成人监督 - 彭博社
Rachel Metz
OpenAI 标志。
摄影师:安德烈·鲁达科夫/彭博社 *欢迎来到《深入科技》,我们重新改版的每日通讯,提供来自彭博社全球记者关于科技商业的报道和分析。今天,*瑞秋·梅茨 测试了 OpenAI 的新代理是否能成为她一直梦想的个人助理。
全球科技
马克·扎克伯格的信心: Meta 首席执行官预测将迎来一个 “非常重要的一年”,在这一年中,社交媒体公司的“高度智能和个性化的 AI 助手”将覆盖超过 10 亿人。
Arm 中国为特朗普时代做好准备: Arm 的中国合资企业 聘请 本地芯片老将陈峰为新 CEO,以更好地应对美国总统唐纳德·特朗普第二任期内复杂的地缘政治变化。
英国机构面临网络攻击风险: 英国政府部门 面临 由于未能更新数百个过时的计算机系统而导致的破坏性黑客攻击的风险,独立监管机构表示。
重新估值
ASML 的股票在周三上涨了多达 12%,因为这家荷兰芯片制造商 报告 的第四季度业绩好于预期,增加了 146 亿美元的市值。
你好,操作员
通常当我想为女儿从图书馆租一本电子书时,我只需访问我们当地分馆的网站,浏览几个标题,然后点击一个进行借阅。但在星期二,我决定让我的新数字助手为我完成这件事。在几分钟的煎熬中,我看着OpenAI的人工智能代理缓慢地在互联网上导航,就像一个被详细描述过网络但从未实际使用过的人。几分钟后,这个工具终于找到了如何获取一本《保姆俱乐部》书籍,《克劳迪娅与幽灵电话》,并将其发送到我孩子的Kindle上,但我必须全程监控它。OpenAI 上周发布了 操作员,标志着其首次进入快速增长的AI代理世界。该服务可以代表个人执行广泛的任务,使用互联网的方式与人类相似,包括导航到网站、输入和点击按钮。对于OpenAI和像Anthropic这样的竞争对手来说,这些代理可能最终兑现了长期以来关于AI提升我们在家和工作中生产力的承诺。在此时,人们重新关注中国公司如DeepSeek的聊天机器人正在迅速赶上顶级美国AI开发者,这使得OpenAI在代理方面的关注可能使其脱颖而出。虽然像ChatGPT这样的聊天机器人可以输出食谱或提供餐厅推荐,但操作员旨在采取行动。该产品可以帮助用户订购杂货、进行预订、填写表格,并一般性地简化我们日常任务的更多内容。作为一个忙碌的工作父母,我有很多任务可以进行简化。
OpenAI的操作员自上周末以来,我已将操作员派往从琐碎(购买化妆品和零食)到必要(帮助组织我孩子的夏令营日程)的任务。对于某些任务,操作员是有帮助的;而对于其他任务,它则更像是一种负担。但在整个过程中,它的速度很慢,问了太多后续问题,以至于抵消了任何节省的时间。一些缺陷是可以预期的。OpenAI推出操作员作为软件的“研究预览”,这意味着它有时仍会出错。它也仅对愿意每月支付200美元的美国客户开放,以获取最近推出的 ChatGPT Pro订阅。知道这是一个不完美的产品,我从简单的事情开始。我想要一款来自Sephora的透明中性色唇膏,因此我让操作员为我挑选颜色。在一些指导和许可下——它需要我登录Sephora的网站,确保我的支付信息已输入并批准购买——操作员成功购买了它。完成这一任务后,我在过程中有点饿了,我告诉我的AI助手给我带点零食。我要求找到甜咸口味的冰淇淋,并通过Instacart送货——这是OpenAI与之合作推出操作员的公司之一。该服务选择了Ben & Jerry’s的咸焦糖冰淇淋,售价8.09美元,然后让我惊讶的是,它建议我在购物车中再添加一件至少1.91美元的商品以便我可以享受免费送货。一个小时内,门铃响了:我的冰淇淋和姜汁啤酒到了。然而,在其他时候,操作员却难以弄清楚我想要什么或如何正确完成任务。当被要求创建一个电子表格来组织我孩子繁忙(且非常复杂)的夏令营日程时,操作员在时间、价格和名称等细节上搞砸了。这让我觉得浪费了时间和计算能力。鉴于这只是一次测试,我准备并愿意密切关注这个产品。但如果OpenAI及其同行希望代理能够起飞,他们需要说服人们相信这些服务可以代表他们自主行动。否则,我们可能会决定,如果我们想要工作做得好,我们应该自己去做。
引用
“我不相信DeepSeek的操作是完全透明的。这是胡说八道。”
霍华德·卢特尼克
总统特朗普提名的商务部长候选人
卢特尼克在他的参议院确认听证会上暗示中国人工智能初创公司DeepSeek可能规避了美国的出口管制。### 阅读
当天科技和娱乐领域最受关注的故事
OpenAI及其合作伙伴微软,正在调查是否有与DeepSeek相关的团体以未经授权的方式获取了OpenAI技术的数据输出。微软的安全研究人员在秋季观察到一些他们认为可能与DeepSeek有关的个人正在大量提取OpenAI的数据。
变动
- 6.9%在彭博社报道特朗普政府正在探索对该公司芯片销售给中国的额外限制后,英伟达的股价下跌了最多6.9%。
AV俱乐部
迈克·西弗特,T-Mobile首席执行官,加入 彭博科技讨论公司第四季度的盈利超预期,以及他们如何与苹果秘密合作在iPhone上实施Starlink服务。
更多来自彭博社的消息
获取深入的科技信息以及更多彭博科技通讯到您的邮箱:
- 网络公报 关注黑客和网络间谍活动的阴影世界
- 游戏进行中 深入探讨视频游戏行业
- 电源开启 获取苹果新闻、消费科技新闻等
- 屏幕时间 近距离观察好莱坞与硅谷的碰撞
- 声音片段 报道播客、音乐产业和音频趋势
- 问与AI 解答您关于人工智能的所有问题