我国在超算并行计算芯片上的发力，已经站在了CPU发展的潮头了_风闻

密集雨-反器材并非不可战胜，用暴风机甲血战到底2022-09-02 07:35

2022-09-02

【本文由“谁人笑我太疯癫”推荐，来自《美限制英伟达向中国出口GPU旗舰A100/H100，中方回应》评论区，标题为小编添加】

徐长根
我國正好要發展自主GPU架構，謝謝！

AI芯片跟GPU其实关系相对有限，倒是更接近于计算卡。

早前有业内人士评估认为，只有高端GPU有比较多的核心专属缓存，从而适应大规模并行计算的需求。但是这样的核心专属缓存对游戏的图形渲染领域几乎没什么用，因为图形渲染中没有那么多的变数需要频繁读缓存。而高端GPU用作计算卡时，虽然性能不错，但核心专属缓存则仍嫌小。

因此结果是高端GPU的单位功耗的图形性能并不算出色，反而是中端游戏显卡有比较强的性价比；而高端GPU用于大规模并行计算时则因缓存太小，不得不频繁读取内存而显得效率不够高。

基于此，我国专门研制了申威众核处理器，申威26010处理器就是采用了256+4的众核结构，更适合进行大规模并行计算，而不是图形计算。

顺带一提，按照目前的芯片发展趋势，采用异构加众核结构的CPU目前正在逐步发展，预计将成为未来计算机发展的主流。例如目前我工作中使用的CPU Corei9 12900KF，就是计算核心8+8的结构，一共24个线程，已经可以算是初步的异构芯片了。而Intel下一代据说还有32+8核48线程的型号，而我们需要知道的是，早些年的低端GPU也就是32个流处理器。

所以从这个角度看，无疑我国在超算并行计算芯片上的发力，已经站在了CPU发展的潮头了。

当然从产业生态的角度说，目前以往针对单线程编写的程序，在未来异构化、并行化的CPU面前将难以充分发挥其性能。而这，需要依赖与并行CPU相配套的新式编译器、运行库等配套核心软件来解决。而这些，我国无疑还有很多短板。例如申威26010的配套编译器，还是自行改写的Linux GCC编译器，称为SWGCC编译器，这样的编译器虽然开源，但未必有足够充分的优化，因此也未必能够充分发挥我国大规模并行CPU的性能。