OpenAI的ChatGPT语音模式在2024年被评为最佳人工智能产品设计之一 - 彭博社

Austin Carr

2024-12-26

苹果 iPhone 16 Plus。

摄影师：Victor J. Blue/Bloomberg作为我们年终通讯的一部分，我一直在反思2024年最佳人工智能产品设计。但首先……

今天你需要知道的三件事：

• Salesforce表示它在与Veeva的新软件竞争中赢得了大型制药客户• TSMC的股票因对人工智能的兴奋而创下新高，该股票有望实现自1999年以来的最佳年度• 漫威对手是网易和迪士尼的一款免费游戏热门

触觉人工智能

整理一份最佳人工智能产品的年终名单几乎是不可能的。评估标准令人困惑且抽象，技术发展速度也不合理。看看最近的大型视频发布：OpenAI 在12月9日推出了其令人震惊的Sora生成器，仅仅一周后，谷歌宣布对其竞争对手Veo引擎进行了升级，声称这是真正的尖端技术。

与其试图评估最佳人工智能模型，我更关注的是人工智能软件中的最佳交互模型。不久前，大多数人工智能功能都是通过输入框中输入的提示驱动的。如今，用户界面和体验更加流畅和复杂，使设计成为行业中的关键差异化因素。

每次重大产品发布时，你都会听到晦涩的工程术语 — “它是原生多模态的！” — 这通常归结为你与AI服务互动的轻松和愉快程度。例如，当ChatGPT在你的iPhone上回应时，它会逐字揭示答案，并伴随触觉反馈，让你感觉它在给你打字。而谷歌的Gemini则一次性显示所有回复，没有任何相应的触觉反馈。这些常常被忽视的小细节，将会帮助区分AI应用，因为它们的能力变得商品化。

以下是我今年关注的AI设计趋势列表 — 以及我与为本期通讯聊天的设计师们的关注点。

**隐形助手：**在被要求为此列表提供建议时，几位顶尖设计师立即提到了 Granola，这是一个自动将杂乱的笔记和冗长的会议电话转换为简洁摘要和行动项的系统。开发者们常常谈论将AI作为软件的无缝层，但它往往表现为一个独立的机器人或一堆额外的按钮。相比之下，Granola则在后台运行。一位设计师告诉我，它是AI设计适应人类习惯的典范，而不是人类被迫适应AI。

**玩家二已加入游戏：**今年秋天，Anthropic推出了“计算机使用，”这让AI初创公司的热门Claude模型能够控制设备，为用户处理琐碎任务。它能够感知屏幕上发生的事情，并可以像我们一样移动光标、点击和输入。这是一种引人入胜的方法，通常涉及大量手动提示工程。Browser Co.和谷歌同样一直在探索为你浏览各自网页浏览器的AI代理 — 想象一下，要求它查找并预订前往百慕大的最便宜航班，然后将行程通过电子邮件发送给家人。这引发了关于UI设计未来的有趣问题，以及我们是否应该优先考虑使其易于理解，以便服务能够使用AI代理。

真实的自然语言处理：ChatGPT的高级语音模式确实神奇 — 可能是我今年经历过的最惊艳的人工智能体验。疯狂的是，语音服务并不新鲜：在苹果公司的Siri和亚马逊公司的Alexa成为家喻户晓的名字之前，我们就一直在尝试与计算机对话。然而，这些口头互动非常生硬，并不是流畅的对话，而更像是基本的（且常常令人沮丧的）问答交流。OpenAI的对话模块令人印象深刻之处在于，它理解人类语言的无 coherence — 停顿和结结巴巴、跑题、打断 — 并自然且聪明地进行调整。

**记忆更新：**至少要给微软公司一些赞誉，因为它尝试构建这样一个风险特征的Recall，这是一个Windows工具，用于记录您在PC上所做的一切的屏幕截图，以更好地为其Copilot AI提供信息。不可避免地，它引发了对隐私和安全的担忧，而微软仍在 figuring out 如何将Recall带给大众。但它提供了一个关于如果我们让人工智能深入研究我们，可能会实现的能力的瞥见。是的，想象大型语言模型像社交网络和搜索引擎一样吞噬我们的个人数据是令人害怕的，但机器人的信息与实用性之间存在非常线性的关系。在“告诉我更多”的门后，有一个设计可能性和无提示的人工智能辅助的世界。

设计中的社交：人工智能交互往往是用户与聊天机器人的一对一对话。工作区应用 Cove 的开发者旨在使体验更加协作。当一群人在线上共同处理同一个项目时，人工智能被视为团队中的另一个成员。每个人的光标实时显示在其他人的屏幕上，因此你可以看到他们正在编辑的内容以及他们请求人工智能帮助的内容。再也不需要从单独的 ChatGPT 线程复制粘贴到发送给同事的单独消息；Cove 让你们可以一起迭代，人工智能同时对每个人可用。考虑到我听到的关于 Cove 和 Anthropic 的 Artifacts 的赞誉，社交提示工程明年似乎会变得更加流行，后者是一个类似的光滑功能，可以立即与同事分享你的人工智能工作。还有 SocialAI，一款 iPhone 应用，允许你创建一个完全由具有可选择特征的机器人组成的社交网络（辩论者、搞笑者、评论者、书呆子等）。这类似于 X 和 Bluesky，但无论你发布什么，你都会收到来自机器人的数十条简洁回复，而不是来自人类的回复。一位设计师告诉我，这实际上是一种迷人的（尽管超级奇怪的）方式，可以同时与多种人工智能聊天，以帮助构思和根据你信息流中的人工智能个性生成独特的答案。

预计到2025年，这种类型的人工智能体验将无处不在——理想情况下，没有人工智能的恶搞者取而代之的是人类的恶搞者。

大新闻

**在风险投资公司获得合伙人职位曾经是终身职业。**但初创投资的下滑，以及更大基金的独立性降低，促使了一个异常数量的合伙人选择离开——或被迫离开。

充电完毕

中国数据中心运营商Yovole据说正在考虑在美国市场进行首次公开募股。

亚马逊可能在新的一年里面临另一场工会斗争。

《新闻周刊》创建了一个“公平”计量器作为重新建立与读者信任的一种方式。

触觉人工智能

大新闻

充电完毕

更多来自彭博社的消息