当前最值得尝试的人工智能应用 - 《华尔街日报》
Cordilia James
人工智能目前正处于一个重要的时刻。
无论是科技巨头还是小型初创公司,都在尝试生成式人工智能,它能够根据训练数据中的模式生成文本和图像。这有望让我们的生活变得更轻松。这些工具也模糊了人类创作与非人类创作之间的界限:输入几个字——至关重要的“提示”——然后看着文字、图形甚至音乐凭空出现。
根据皮尤研究中心的报告,虽然大多数美国成年人都听说过OpenAI的ChatGPT,但只有14%的人尝试过它。自ChatGPT问世以来,已经出现了许多免费的人工智能工具,而且还有更多即将到来。
生成式人工智能工具并非一时流行。随着资金涌入这一领域,科技公司不断创新,更多服务变得可用,它们将在我们的日常生活中变得更加普遍。决定尝试哪些人工智能工具可能会让人不知所措,因此我们整理了一份易于尝试的应用程序和网站列表,帮助你入门。
通用搜索和聊天机器人
支持人工智能的聊天机器人是一种以对话形式搜索信息、集思广益工作想法甚至写诗的增强方式。请注意:这些自然语言处理器常常会犯错误或编造事实——这是生成式人工智能固有的问题,称为幻觉——所以不要将聊天机器人所说的一切当作绝对真理。
OpenAI的ChatGPT
ChatGPT是当前最著名的生成式AI工具,允许用户输入纯文本提示以获取纯文本回复。它基于互联网海量数据进行训练,因此擅长处理复杂问题和起草信件。使用前需创建OpenAI账户,或通过谷歌、微软或苹果账号登录。免费版面向所有用户,但响应较慢且在高峰时可能拒绝请求。每月20美元的ChatGPT Plus版无拥堵中断,并能优先获得底层更新。(官网, iOS版)
OpenAI的ChatGPT能通过纯文本回复解释复杂话题并激发创意。#### 微软Bing
新版Bing将OpenAI技术与微软搜索引擎结合,提供实时响应。您可通过输入提示获取文本、图片及视频搜索结果。当推荐菜谱不符合需求时,逐步指导视频会特别有用。该机器人会标注信息来源,但这不意味着它能完全避免AI幻觉。虽然免费使用,但要体验全部功能需下载Edge浏览器并使用微软账户登录。(官网, iOS版, 安卓版)
微软的必应聊天可以在回复中包含多媒体内容,例如YouTube视频。#### 谷歌的Bard
Bard非常适合直接获取要点。你可以用它来起草博客文章或给老板的电子邮件,甚至进行网络搜索。该公司正在开发一个更新,允许用户通过图片提示Bard,未来几个月内,Bard将能够使用Adobe的生成式AI图像工具Firefly生成图像。使用这款免费软件需年满18岁并拥有谷歌账户,支持多种浏览器。(官网)
谷歌的Bard提供文本和图像回复,并将在未来几个月内具备生成图像的能力。### 图像生成器
AI图像可以基于文本或视觉提示生成,例如“金刚滑旱冰下帝国大厦”。许多图像生成器难以准确再现人类形象,更适合抽象概念或创意。
OpenAI的DALL-E 2
OpenAI的DALL-E是最早的图像生成器之一,尽管有些笨拙,但仍是一个有趣的工具。它能根据文本描述(如“牛油果形状的椅子”)甚至照片生成四张图像。4月6日后注册的用户需购买积分才能使用。(官网)
OpenAI的DALL-E是最早的图像生成器之一。提示:一个形状像牛油果的扶手椅。#### 必应图像创建器
必应图像创建器由最新版本的OpenAI DALL-E驱动,但通过流畅的界面和快速获取免费结果的方式进行了改进。您需要使用微软账户登录,但可以使用任何浏览器。注册后,您将获得“加速”,即快速生成图像的代币。加速会随时间补充,但如果用完,图像生成可能需要更长时间。(网站)
用户可以通过任何浏览器访问必应图像创建器的独立网站。#### DreamStudio
必应和DALL-E不允许您创建公众人物的图像。Stability AI的DreamStudio可以。您可以输入“Ariana Grande穿着粉色连衣裙吃纸杯蛋糕”,然后得到她做这件事的图像——某种程度上。(Getty Images正在起诉Stability AI侵犯版权。)要使用该工具,请创建一个Stability AI账户或通过Google或Discord登录。每个人开始时都有25个积分。使用系统默认设置,每个积分大约可以得到一张图像,但这取决于您的设置。您可以支付1美元获得额外的100个积分。(网站)
Stability AI的DreamStudio允许用户生成公众人物的图像。#### Prisma Labs的Lensa
这款应用主要用于编辑照片和添加视频动画及特效。它可以作为一种创意方式生成在线个人资料图片,即“魔法头像”:你上传自己的照片,它会将你重新想象成各种角色,比如美人鱼或宇航员。与DreamStudio一样,Lensa也使用了Stability AI的Stable Diffusion文本转图像模型。订阅起价为每周3美元。(iOS, Android)
Lensa可以作为一种生成在线个人资料图片的方式,WSJ记者Dalvin Brown进行了测试。照片:Lensa#### Adobe Firefly
Adobe Firefly提供许多免费功能。你可以通过文本描述生成图像,为文本应用样式或纹理,并根据文本描述编辑图像。你还可以更改背景、移除对象或放大超出拍摄范围的图像。Adobe表示,Firefly使用Adobe Stock图片和其他数据集进行训练,以尊重艺术家的所有权。(网站, iOS, Android)
Adobe Firefly 可以根据文字描述生成图像。### 职业与效率
企业正寻求利用人工智能提升工作效率。这些工具能帮助减少撰写邮件、记录笔记甚至参加会议的时间。若要在工作中使用这些工具,可能需要获得公司批准。
GrammarlyGo
GrammarlyGo 结合自有技术与 OpenAI 的 GPT-3.5,可通过扫描邮件并总结回复内容,助您快速起草邮件。该工具还能调整措辞或语气,并会逐步学习您的偏好。免费用户每月可获得100次提示,Grammarly Premium 用户每月支付30美元(或年付144美元)可获得1000次提示。(官网)
OtterPilot
Otter.ai 的智能会议助手能自动进行实时笔记记录和行动项跟踪。使用时只需登录 Otter 账户并关联 Google 或 Microsoft 日历,OtterPilot 便会自动加入会议并做笔记——即使您本人未参会(需注意企业管理员可能禁用此工具)。免费版每月提供300分钟笔记时长(单次会议限30分钟),专业版每月16.99美元更适合长时间会议。(官网, iOS, Android)
如果您错过会议,OtterPilot可以自动为您做笔记——甚至能捕捉幻灯片内容。### 音频生成器
AI生成的音频可以模仿某人的声音或创造全新音色。目前主要面向不愿花时间在录音棚的内容创作者——不过自己尝试也很有趣。它还能根据文字提示创作音乐,生成体现特定情绪、风格或乐器的独特音频片段。#### ElevenLabs的Prime Voice AI
Prime Voice AI可将文本转为音频片段,既可使用您的真实声音,也能用工具技术创建新声线。输入文本后,可根据种族、性别和年龄调整AI生成的声音。无论是睡前故事还是新闻文章,这个声音都能为您朗读。免费版每月提供10,000字符额度并自动重置。要克隆您真实声音需订阅服务,起价每月5美元。(官网)
谷歌MusicLM
在谷歌MusicLM中,输入如"篝火旁弹奏的宁静吉他"等提示词,工具会生成多个相似风格的音乐片段。可无限创作并下载曲目,但需用谷歌账号注册AI测试厨房并排队等候。(官网, iOS版, 安卓版)
其他一切
在线旅行社 Priceline 和配送公司 Instacart 是众多开发人工智能工具的公司之一。内置在你已有应用中的AI优势在于它们能提供更个性化和易用的体验。
多邻国的角色扮演
法语和西班牙语学习者可以使用 多邻国的角色扮演文本聊天机器人 来练习语言技能,主题对话就像真实的聊天线程。遇到困难时,AI会提供应答建议,纠正错误并指导写作提升。该功能包含在每月30美元的 多邻国 Max订阅中。(iOS)
可汗学院的Khanmigo
这款由OpenAI驱动的聊天机器人专为需要个性化作业辅导的学生设计。其"辅导我"模式和测验模块涵盖数学、阅读、科学和历史等科目。虽对K-12主要学科问题最准确,但仍可能出错。加入候补名单需可汗学院账户,注册者须满18岁,但可为子女开通权限。入选后需每月捐赠20美元。(官网)
Snapchat中的My AI
Snapchat消息功能的新聊天机器人由ChatGPT驱动。用户可以自定义AI,为其命名、设置头像和服装。(在Snap因不当回应引发争议后,该公司为18岁以下用户添加了过滤功能。)Snapchat+订阅用户现在可以向AI发送照片,AI会以自己生成的图片回复。(iOS,Android)
Expedia应用内旅行规划
Expedia的AI助手同样由ChatGPT驱动,提供可直接在应用中预订的旅行推荐。当用户向机器人询问住宿建议时,它会将这些建议整理到应用的“行程”部分。请注意:该工具仍处于测试阶段,仅支持英语,且无法获取实时价格信息。(iOS)
—欲了解更多WSJ科技分析、评论、建议和头条新闻,请订阅我们的每周通讯。
联系Cordilia James,邮箱:[email protected]
刊登于2023年6月21日印刷版,标题为“AI应用妙用”。