专业观点:超越摩尔定律;半导体创新持续,但难度加大——《华尔街日报》
Steven Rosenbush
英伟达表示,其Grace Hopper超级芯片专为人工智能和高性能计算应用设计。图片来源:Walid Berrazeg/Zuma Press半导体行业在摩尔定律的指导下发展了几十年,这一原理描述了数字技术惊人进化的基础性进步,近年来更是支撑了深度学习等先进人工智能形式的发展。
摩尔定律实际上是一项观察结果,由英特尔联合创始人戈登·摩尔于1965年提出,认为芯片上的晶体管数量大约每年翻一番。1975年,他将公式调整为每两年翻一番。这一定律在数十年间始终成立,并帮助解释了当今世界的许多现象,包括智能手机等数字设备性价比为何能实现惊人提升——尤其是与其他许多商品相比。单个晶体管曾售价高达150美元。而2019年,一颗典型的英特尔微处理器包含50亿个晶体管,每个成本仅为0.0000001美元。
但随着晶体管尺寸已变得极其微小,有人认为,当某些尝试触及经济和物理学的极限时,摩尔定律所描述的稳定可预测的进步已走向终结。与深度学习及其他AI形式紧密相关的其他类型半导体创新正在进行中。但芯片创新的下一阶段已无法再用如此清晰、易于公众理解的方式来预测未来。
“那些日子已经一去不复返了,对吧?”半导体巨头英伟达的首席科学家比尔·达利说道。该公司设计的人工智能芯片市场需求最为旺盛。英伟达尤其以图形处理器(GPU)闻名,这是一种采用多核心并行计算的芯片。GPU在人工智能应用,尤其是具有密集层的神经网络中需求巨大。
虽然摩尔定律所描述的技术进步速度已不如从前,但英伟达、谷歌DeepMind等机构的研究人员正在多个领域持续推进创新。
“深度学习是由硬件驱动的。我们深感持续创新的压力,”曾任斯坦福大学计算机科学系主任、现仍担任该校兼职教授的达利表示。
“难度确实在增加,但我们仍有不错的创意…未来四年左右的发展路径我们已相当明确。之后的技术突破方向,我们也有大量探索性研究正在开展,”这位领导着300名博士研究团队的科学家补充道。
据达利透露,英伟达2022年推出的数据中心芯片"Hopper"先进架构虽然成功集成了更多晶体管,但芯片整体成本及单个晶体管成本均高于前代产品。“晶体管微缩带来的收益正在递减,”他坦言,“制程迭代已无法继续降低晶体管成本。”
尽管如此,考虑到摩尔定律之外的其他创新,Hopper的性价比仍有所提升。Dally表示,他相信至少在接下来的四年里,创新的道路是清晰的,这意味着与AI能力增长密切相关的硬件改进也将持续,对从医学、医疗保健到金融和电子商务等众多领域产生影响。
这项工作利用了稀疏性等概念,即将“小”数字舍入为零,从而减少芯片必须执行的乘法运算量。
八年前,Dally与现就职于MIT的Song Han等人在NeurIPS会议上发表了一篇论文,表明对于许多神经网络,他们可以将90%的数字变为零,而不会改变结果的准确性。
*“*我们仍在探索如何通过更好的硬件来利用这一点,”Dally说。
另一个创新领域涉及数字表示,即用各种方式表示一个数字,例如一串1和0。Dally表示,如果能用更短的字符串(比如8位而不是16或32位)来完成,那么在乘法等过程中芯片所需的工作量就会相应减少。这提高了芯片的整体性能和效率。
英伟达和谷歌一直在致力于为AI定制芯片。这使得他们的AI芯片性能提升速度超过了摩尔定律,尽管在芯片上集成更多晶体管变得越来越困难。2020年,《华尔街日报》专栏作家Christopher Mims创造了“黄氏定律”一词,以英伟达联合创始人兼首席执行官黄仁勋命名,该定律指出,驱动AI的硅芯片性能每两年翻一番以上。
然而,存在一个根本性矛盾:AI算法每隔几个月就会迭代更新,而芯片设计却需要两到三年时间。
通过运用先进AI技术,有望大幅缩短芯片设计周期并降低成本。部分研究者认为AI可将设计流程从数年压缩至数日。在软件层面,更高效的资源调度和更优化的代码能提升现有芯片设计的性能表现。
谷歌DeepMind数据中心与芯片研究总监Olivier Temam指出,芯片设计周期长、成本高还带来更深远的影响:这迫使AI研究者必须针对现有芯片设计算法,从而可能限制其构想的AI算法范围。若能更便捷经济地为新型AI算法定制芯片,或将释放该领域更多创造力。
Temam表示:“AI驱动的芯片设计最新进展与持续探索表明,我们或许终将实现芯片设计自动化,最终带来巨大的生产力提升,这可能会彻底改变整个行业。”
联系作者Steven Rosenbush请致信[email protected]