我国在超算并行计算芯片上的发力,已经站在了CPU发展的潮头了_风闻
密集雨-反器材并非不可战胜,用暴风机甲血战到底2022-09-02 07:35
【本文由“谁人笑我太疯癫”推荐,来自《美限制英伟达向中国出口GPU旗舰A100/H100,中方回应》评论区,标题为小编添加】
- 徐长根
- 我國正好要發展自主GPU架構,謝謝!
AI芯片跟GPU其实关系相对有限,倒是更接近于计算卡。
早前有业内人士评估认为,只有高端GPU有比较多的核心专属缓存,从而适应大规模并行计算的需求。但是这样的核心专属缓存对游戏的图形渲染领域几乎没什么用,因为图形渲染中没有那么多的变数需要频繁读缓存。而高端GPU用作计算卡时,虽然性能不错,但核心专属缓存则仍嫌小。
因此结果是高端GPU的单位功耗的图形性能并不算出色,反而是中端游戏显卡有比较强的性价比;而高端GPU用于大规模并行计算时则因缓存太小,不得不频繁读取内存而显得效率不够高。
基于此,我国专门研制了申威众核处理器,申威26010处理器就是采用了256+4的众核结构,更适合进行大规模并行计算,而不是图形计算。
顺带一提,按照目前的芯片发展趋势,采用异构加众核结构的CPU目前正在逐步发展,预计将成为未来计算机发展的主流。例如目前我工作中使用的CPU Corei9 12900KF,就是计算核心8+8的结构,一共24个线程,已经可以算是初步的异构芯片了。而Intel下一代据说还有32+8核48线程的型号,而我们需要知道的是,早些年的低端GPU也就是32个流处理器。
所以从这个角度看,无疑我国在超算并行计算芯片上的发力,已经站在了CPU发展的潮头了。
当然从产业生态的角度说,目前以往针对单线程编写的程序,在未来异构化、并行化的CPU面前将难以充分发挥其性能。而这,需要依赖与并行CPU相配套的新式编译器、运行库等配套核心软件来解决。而这些,我国无疑还有很多短板。例如申威26010的配套编译器,还是自行改写的Linux GCC编译器,称为SWGCC编译器,这样的编译器虽然开源,但未必有足够充分的优化,因此也未必能够充分发挥我国大规模并行CPU的性能。