当前最值得尝试的人工智能应用 - 《华尔街日报》

Cordilia James

2023-06-19

人工智能目前正处于一个重要的时刻。

无论是科技巨头还是小型初创公司，都在尝试生成式人工智能，它能够根据训练数据中的模式生成文本和图像。这有望让我们的生活变得更轻松。这些工具也模糊了人类创作与非人类创作之间的界限：输入几个字——至关重要的“提示”——然后看着文字、图形甚至音乐凭空出现。

根据皮尤研究中心的报告，虽然大多数美国成年人都听说过OpenAI的ChatGPT，但只有14%的人尝试过它。自ChatGPT问世以来，已经出现了许多免费的人工智能工具，而且还有更多即将到来。

生成式人工智能工具并非一时流行。随着资金涌入这一领域，科技公司不断创新，更多服务变得可用，它们将在我们的日常生活中变得更加普遍。决定尝试哪些人工智能工具可能会让人不知所措，因此我们整理了一份易于尝试的应用程序和网站列表，帮助你入门。

通用搜索和聊天机器人

支持人工智能的聊天机器人是一种以对话形式搜索信息、集思广益工作想法甚至写诗的增强方式。请注意：这些自然语言处理器常常会犯错误或编造事实——这是生成式人工智能固有的问题，称为幻觉——所以不要将聊天机器人所说的一切当作绝对真理。

OpenAI的ChatGPT

ChatGPT是当前最著名的生成式AI工具，允许用户输入纯文本提示以获取纯文本回复。它基于互联网海量数据进行训练，因此擅长处理复杂问题和起草信件。使用前需创建OpenAI账户，或通过谷歌、微软或苹果账号登录。免费版面向所有用户，但响应较慢且在高峰时可能拒绝请求。每月20美元的ChatGPT Plus版无拥堵中断，并能优先获得底层更新。(官网, iOS版)

OpenAI的ChatGPT能通过纯文本回复解释复杂话题并激发创意。#### 微软Bing

新版Bing将OpenAI技术与微软搜索引擎结合，提供实时响应。您可通过输入提示获取文本、图片及视频搜索结果。当推荐菜谱不符合需求时，逐步指导视频会特别有用。该机器人会标注信息来源，但这不意味着它能完全避免AI幻觉。虽然免费使用，但要体验全部功能需下载Edge浏览器并使用微软账户登录。(官网, iOS版, 安卓版)

微软的必应聊天可以在回复中包含多媒体内容，例如YouTube视频。#### 谷歌的Bard

Bard非常适合直接获取要点。你可以用它来起草博客文章或给老板的电子邮件，甚至进行网络搜索。该公司正在开发一个更新，允许用户通过图片提示Bard，未来几个月内，Bard将能够使用Adobe的生成式AI图像工具Firefly生成图像。使用这款免费软件需年满18岁并拥有谷歌账户，支持多种浏览器。(官网)

谷歌的Bard提供文本和图像回复，并将在未来几个月内具备生成图像的能力。### 图像生成器

AI图像可以基于文本或视觉提示生成，例如“金刚滑旱冰下帝国大厦”。许多图像生成器难以准确再现人类形象，更适合抽象概念或创意。

OpenAI的DALL-E 2

OpenAI的DALL-E是最早的图像生成器之一，尽管有些笨拙，但仍是一个有趣的工具。它能根据文本描述（如“牛油果形状的椅子”）甚至照片生成四张图像。4月6日后注册的用户需购买积分才能使用。(官网)

OpenAI的DALL-E是最早的图像生成器之一。提示：一个形状像牛油果的扶手椅。#### 必应图像创建器

必应图像创建器由最新版本的OpenAI DALL-E驱动，但通过流畅的界面和快速获取免费结果的方式进行了改进。您需要使用微软账户登录，但可以使用任何浏览器。注册后，您将获得“加速”，即快速生成图像的代币。加速会随时间补充，但如果用完，图像生成可能需要更长时间。(网站)

用户可以通过任何浏览器访问必应图像创建器的独立网站。#### DreamStudio

必应和DALL-E不允许您创建公众人物的图像。Stability AI的DreamStudio可以。您可以输入“Ariana Grande穿着粉色连衣裙吃纸杯蛋糕”，然后得到她做这件事的图像——某种程度上。(Getty Images正在起诉Stability AI侵犯版权。)要使用该工具，请创建一个Stability AI账户或通过Google或Discord登录。每个人开始时都有25个积分。使用系统默认设置，每个积分大约可以得到一张图像，但这取决于您的设置。您可以支付1美元获得额外的100个积分。(网站)

Stability AI的DreamStudio允许用户生成公众人物的图像。#### Prisma Labs的Lensa

这款应用主要用于编辑照片和添加视频动画及特效。它可以作为一种创意方式生成在线个人资料图片，即“魔法头像”：你上传自己的照片，它会将你重新想象成各种角色，比如美人鱼或宇航员。与DreamStudio一样，Lensa也使用了Stability AI的Stable Diffusion文本转图像模型。订阅起价为每周3美元。(iOS, Android)

Lensa可以作为一种生成在线个人资料图片的方式，WSJ记者Dalvin Brown进行了测试。照片：Lensa#### Adobe Firefly

Adobe Firefly提供许多免费功能。你可以通过文本描述生成图像，为文本应用样式或纹理，并根据文本描述编辑图像。你还可以更改背景、移除对象或放大超出拍摄范围的图像。Adobe表示，Firefly使用Adobe Stock图片和其他数据集进行训练，以尊重艺术家的所有权。(网站, iOS, Android)

Adobe Firefly 可以根据文字描述生成图像。### 职业与效率

企业正寻求利用人工智能提升工作效率。这些工具能帮助减少撰写邮件、记录笔记甚至参加会议的时间。若要在工作中使用这些工具，可能需要获得公司批准。

GrammarlyGo

GrammarlyGo 结合自有技术与 OpenAI 的 GPT-3.5，可通过扫描邮件并总结回复内容，助您快速起草邮件。该工具还能调整措辞或语气，并会逐步学习您的偏好。免费用户每月可获得100次提示，Grammarly Premium 用户每月支付30美元（或年付144美元）可获得1000次提示。(官网)

OtterPilot

Otter.ai 的智能会议助手能自动进行实时笔记记录和行动项跟踪。使用时只需登录 Otter 账户并关联 Google 或 Microsoft 日历，OtterPilot 便会自动加入会议并做笔记——即使您本人未参会（需注意企业管理员可能禁用此工具）。免费版每月提供300分钟笔记时长（单次会议限30分钟），专业版每月16.99美元更适合长时间会议。(官网, iOS, Android)

如果您错过会议，OtterPilot可以自动为您做笔记——甚至能捕捉幻灯片内容。### 音频生成器

AI生成的音频可以模仿某人的声音或创造全新音色。目前主要面向不愿花时间在录音棚的内容创作者——不过自己尝试也很有趣。它还能根据文字提示创作音乐，生成体现特定情绪、风格或乐器的独特音频片段。#### ElevenLabs的Prime Voice AI

Prime Voice AI可将文本转为音频片段，既可使用您的真实声音，也能用工具技术创建新声线。输入文本后，可根据种族、性别和年龄调整AI生成的声音。无论是睡前故事还是新闻文章，这个声音都能为您朗读。免费版每月提供10,000字符额度并自动重置。要克隆您真实声音需订阅服务，起价每月5美元。(官网)

谷歌MusicLM

在谷歌MusicLM中，输入如"篝火旁弹奏的宁静吉他"等提示词，工具会生成多个相似风格的音乐片段。可无限创作并下载曲目，但需用谷歌账号注册AI测试厨房并排队等候。(官网, iOS版, 安卓版)

其他一切

在线旅行社 Priceline 和配送公司 Instacart 是众多开发人工智能工具的公司之一。内置在你已有应用中的AI优势在于它们能提供更个性化和易用的体验。

多邻国的角色扮演

法语和西班牙语学习者可以使用多邻国的角色扮演文本聊天机器人来练习语言技能，主题对话就像真实的聊天线程。遇到困难时，AI会提供应答建议，纠正错误并指导写作提升。该功能包含在每月30美元的多邻国 Max订阅中。(iOS)

可汗学院的Khanmigo

这款由OpenAI驱动的聊天机器人专为需要个性化作业辅导的学生设计。其"辅导我"模式和测验模块涵盖数学、阅读、科学和历史等科目。虽对K-12主要学科问题最准确，但仍可能出错。加入候补名单需可汗学院账户，注册者须满18岁，但可为子女开通权限。入选后需每月捐赠20美元。(官网)

Snapchat中的My AI

Snapchat消息功能的新聊天机器人由ChatGPT驱动。用户可以自定义AI，为其命名、设置头像和服装。（在Snap因不当回应引发争议后，该公司为18岁以下用户添加了过滤功能。）Snapchat+订阅用户现在可以向AI发送照片，AI会以自己生成的图片回复。（iOS，Android）

Expedia应用内旅行规划

Expedia的AI助手同样由ChatGPT驱动，提供可直接在应用中预订的旅行推荐。当用户向机器人询问住宿建议时，它会将这些建议整理到应用的“行程”部分。请注意：该工具仍处于测试阶段，仅支持英语，且无法获取实时价格信息。（iOS）

—欲了解更多WSJ科技分析、评论、建议和头条新闻，请订阅我们的每周通讯。

联系Cordilia James，邮箱：[email protected]

刊登于2023年6月21日印刷版，标题为“AI应用妙用”。