OpenAI的新推理模型令学术界和高管们感到兴奋 - 彭博社
Shirin Ghaffary
智能手机上的ChatGPT标志。
摄影师:安德烈·鲁达科夫/彭博社OpenAI最新的模型以其解决更复杂问题的能力给学术界和商业领袖留下了深刻印象,尽管它仍然存在一些显著的局限性。但首先……
三件事需要知道:
• OpenAI聘请前Coursera高管来扩展AI在学校的使用• 纽瑟姆表示他对AI法案的“寒蝉效应”感到担忧• 新的聊天机器人ETF承诺模仿沃伦·巴菲特,大卫·泰珀
使用AI的新理由
Derya Unutmaz最近与一个聊天机器人有了情感时刻。Unutmaz是一名免疫学家,自称是AI的重度用户,他请OpenAI新发布的模型建议一种他长期以来一直在追求的关于T细胞疗法治疗肿瘤的研究方法。令他惊讶的是,AI系统提出了一种他之前没有想到的新方法。
“你看到自己工作多年的东西,它提出了一些相对明显的东西,”杰克逊实验室的Unutmaz博士说。“我在想,‘好吧,我为什么没想到这一点?’”
上周,OpenAI开始推出一个名为o1的AI模型,旨在花更多时间计算答案——公司称之为“思考”——然后再回应用户查询。通过这种方法,OpenAI表示其工具应该能够解决更复杂的多步骤问题,包括科学、数学和编码方面的问题。
对于习惯于向ChatGPT询问食谱或旅行信息的普通用户来说,这些差异可能并不立即显现。但对于像Unutmaz这样的学者来说,这些进展提供了一个承诺,可以在口袋里拥有一个学术同行,帮助他们头脑风暴解决方案。相比之下,他表示,GPT-4o,OpenAI的前一个模型,更像是“一个超级聪明的记忆者”。
著名数学家Terence Tao写道他曾尝试过o1,并发现它的反应水平相当于“一个平庸但并非完全无能”的研究生。这听起来可能不是很高的赞誉,但Tao表示,经过几次迭代,这个工具可能接近一个能够在研究中“显著有用”的合格研究生的水平。
OpenAI是包括谷歌和Anthropic在内的几家AI公司之一,正在努力开发推理能力。目前,仍然存在明显的限制。OpenAI的o1模型仍处于“预览”模式,无法查找实时信息。(该模型的升级版本即将推出。)OpenAI还表示它“收到了轶事反馈”,称o1的预览版本比之前的模型更容易产生幻觉——或编造信息,尽管它自己的评估显示出相反的趋势。**另请阅读:**OpenAI的新产品得到了前NSA首席的输入还有延迟时间的问题。o1返回答案所需的时间明显更长——在我的实验中,通常多出几秒——因为AI系统正在分步骤进行推理,有时还会找到多个问题的答案。这对于习惯于从聊天机器人获得即时响应的用户来说,是一个显著的延迟。
对于OpenAI及其竞争对手来说,赌注在于这些先进的AI系统最终将通过能够处理更复杂的任务来引发显著的商业需求。
Box的首席执行官Aaron Levie。摄影师:Michael Short/BloombergBox首席执行官Aaron Levie表示,他的云存储公司已经开始内部测试o1的性能。他看到它在处理更复杂的数学计算和文字问题方面具有巨大的潜在价值。
Levie表示,该软件可能对使用AI来理解复杂商业文件的Box客户有所帮助。例如,Levie说,o1可能帮助客户确定一个有效的合同结束日期,该日期根据文件上最近签名的日期而变化,而现有模型可能在这方面面临困难。
“当我们回顾一年半前的AI与今天的AI时,我从未预测到这种变化的速度。这超出了我们最狂野的期望,”Levie说。“我认为这些模型将继续变得更好、更便宜和更快。”
对AI有问题吗? 给我发邮件, Shirin Ghaffary,我会在未来的新闻通讯中尝试回答你的问题。
本周人类名言
“保护选举的完整性对民主至关重要,我们必须确保AI不会被用于通过虚假信息破坏公众的信任——尤其是在今天这个紧张的政治气候中。”
加文·纽瑟姆
加利福尼亚州州长
纽瑟姆签署了多项法案,限制本周早些时候使用人工智能进行政治深度伪造和重建表演者的数字形象。州长尚未对有争议的人工智能安全法案SB 1047做出决定,该法案旨在限制先进人工智能系统的灾难性风险。纽瑟姆表示,他仍在听取双方的论点。### 值得关注
凯瑟琳·科斯特列娃是Creatio的首席执行官,这是一种无代码平台,利用人工智能的力量实现工作流和客户关系管理的自动化。该公司在夏季宣布获得2亿美元的新融资,估值为12亿美元。科斯特列娃将与卡罗琳·海德和埃德·卢德洛一起出现在“彭博科技”节目中。### 深度学习
- 萨姆·阿尔特曼离开了OpenAI董事会的安全与保障委员会
- 一位前谷歌高管的初创公司正在使用人工智能预测天气
- 借助人工智能,已故名人正在重新工作——并赚取数百万
- 《华盛顿邮报》关注使用人工智能聊天机器人的隐藏环境成本
来自彭博社的更多信息
获取每日科技以及更多彭博科技周刊到您的邮箱:
- 网络简报涵盖黑客和网络间谍活动的阴暗世界
- 游戏进行中报道视频游戏行业
- 电力开启获取苹果新闻、消费科技新闻等
- 屏幕时间前排观看好莱坞与硅谷的碰撞
- 声音片段报道播客、音乐产业和音频趋势