科学家通过大脑活动重建平克·弗洛伊德乐队歌曲——《华尔街日报》
Daniela Hernandez
在一项科学突破中,研究人员在开发能大声说出人们想法的设备方面又近了一步。
随着进一步的发展,这可能会让因中风或其他脑损伤而失去说话能力的患者获得一种听起来更自然、不那么机械的交流方式。
加州大学伯克利分校的神经科学家利用29名患者在脑部手术中听平克·弗洛伊德经典摇滚歌曲《墙上的另一块砖,第一部分》时的大脑活动记录,重建了这首歌。虽然不如乐队的版本精致,但重建的曲调是可以辨认的。
这项研究于周二发表在《PLOS生物学》杂志上。
从大脑活动模式中重建复杂的音乐元素,推动了帮助患者恢复交流能力的治疗技术的发展。
“这非常令人兴奋。他们展示的是,他们可以用相对较少的数据获得相当高的性能,”加州大学旧金山分校威尔神经科学研究所研究音乐和语言感知的神经外科医生爱德华·张博士说。
张没有参与这项研究,但之前曾与研究的作者合作过。
随着计算机模型和人工智能变得更加复杂,使用脑机接口(与大脑交互的设备)的类似研究已经从神经数据中重新创建图像并生成了简单的语言。
去年,埃隆·马斯克旗下的Neuralink公司曾展示一段"心灵感应打字"视频:一只植入Neuralink脑机接口的猴子通过思维活动操控光标拼写字母。该设备采用穿透大脑的丝状电极(相当于神经活动的"麦克风")记录信号,猴子无需触碰键盘即可完成操作。
这项新研究中,科学家在耐药性癫痫患者接受手术时,通过覆盖在大脑表面的网格状电极垫,从不同脑区采集神经信号。每位受试者仅聆听平克·弗洛伊德乐队的歌曲一次。
研究人员随后锁定听觉皮层中负责声音处理的颞上回等关键区域。尽管仅用少量电极监测,这些脑区的神经活动与经典歌曲的声波特征最为吻合。团队发现即使屏蔽其他脑区数据,仍能获得虽略有失真但可辨识的音乐重现。
神经信号重建的歌曲波形(下三图)与原始音频(顶图)具有视觉相似性。图片来源:卢多维克·贝利尔原始歌曲与重建歌曲的视觉化呈现(结合热力图与声波形态的特征图谱)同样显示出高度相似性。这一结论不仅适用于单个受试者,29名参与者的整体数据也支持该发现。
“虽然重建音频在频率细节上有所损失,但无论是听觉效果还是视觉波形都堪称优秀的近似还原,“耶鲁大学与霍华德大学精神病学助理教授、音乐家AZA·奥尔索普博士评价道,他未参与此项研究。
他补充道,长远来看,“这能激发人们的想象力,思考未来可能实现什么”,包括直接从神经记录中创作音乐的能力。
根据新研究的作者之一、加州大学伯克利分校神经科学家罗伯特·奈特博士的说法,研究人员的目标是利用这项技术开发神经假体,帮助患者恢复更自然的说话能力。
目前,“这些设备的输出单调,带有一种机械感”,他说。“音乐因其强烈的情感和节奏成分,可以让我们为[计算机生成的]语音增添情感元素。”
新算法还能部分还原人声。例如,研究显示,一名患者大脑活动的回放中包含了一些可辨别的词语,如“全部”、“曾经”和“只是一块砖”。
奈特表示,研究人员选择《Another Brick in the Wall, Part 1》是因为他们是英国摇滚乐队Pink Floyd的粉丝,这首歌录制于20世纪70年代。Part 1是这首三部分作品的第一部分,不如大多数人熟知的Part 2那样广为人知,后者曾登顶排行榜。
“这首歌人们有点熟悉,但不是每个人都听过”,因此可能不会与之有太多记忆关联,研究的另一位作者、计算神经科学家卢多维克·贝利尔说。“它处于熟悉度的甜蜜点。”
阿尔索普表示,这种甜蜜点可能因年龄、个人偏好和文化而异。张指出,用于重建Pink Floyd音乐的算法可能需要针对其他音乐类型(如爵士或雷鬼)的不同旋律和节奏进行重新训练。
另一个考量——平克·弗洛伊德乐队歌词中提到的“我们不需要思想控制”——反映了部分神经伦理学家、神经科学家和法律专家对精神隐私的担忧。
算法已能通过打字搜索或点击"点赞"等身体活动,构建出相当精准的个人偏好模型。尽管人们高度期待通过神经活动重建语音和音乐能促进心理健康与社会连接,但读取思维被视为隐私保护的下一个前沿阵地。
“这或将标志着对大脑的全新探索方式,“神经伦理学研究所理事露西·纳尔巴赫·图纳斯表示,“也印证了音乐的强大影响力。”
开展这项研究后,奈特很快意识到音乐触动人心、激发好奇的独特力量。
“过去40年我的研究从未引起媒体兴趣,但平克·弗洛伊德让一切变得不同,“他说,“公众的热情有些超乎想象,这很棒。”
联系记者丹妮拉·埃尔南德斯请致信 [email protected]
本文发表于2023年8月16日印刷版,标题为《从脑活动中重建歌曲》。