设置

关灯

第513章 一块砖 (2 / 4)

《>为了网站长久运营 请在浏览器设置 *关闭广告屏蔽管理* 方可正常阅读 谢谢支持!!!!......》

        不管是a记的sp流处理器,还是n记的cuda通用并行计算单元,亦或是的x86核心,都不是单独的“核”。论起结构的复杂度,完全不能和马竞的ipu相比较。毕竟前面三者都要考虑量产成本的问题,太过复杂的电路设计会导致生产工序的冗长和低容错率,自然是智者不为的。

        实际上,马竞的ipu更像是威力加强版本的intel至强处理器。

        <下半年发布的,目前地球上最强大的量产cpu至强e5-2699v3拥有18个物理核心,每颗核心独享32+32kb高速l1缓存和256kb的l2缓存,再集体共享“高达”45b的l3缓存。

        芯片设计师们当然知道冯诺依曼瓶颈,于是很早就开始给cpu配置了cache高速缓存,且一般使用sra静态随机存储器,相比于内存条常用的dra动态存储器,前者的优点是不需要设置刷新电路,读写速度快,缺点则是电路集成度低、成本高。

        无论是高成本,还是低集成度,对于cpu来说都是要命的,因此也就不难解释为什么时至今日,cpu的l1/l2一二级缓存的容量依旧以kb为单位了,倒是使用dra的l3缓存,倒是可以做得大一点也不能太大,毕竟芯片面积上每一毫米都是珍贵的。

        当代u皇2699全部三-级缓存加起来也只有50b的容量,对于应用程序来说自然是不够用的,当没有在缓存中找到数据,系统还是得去内存甚至更慢的硬盘当中去搜寻,自然进一步拖慢了速度。

        而这些问题对于马竞来说,基本上都不是问题了。第一代ipu芯片的具体型号是128-16/16,指的自然是128颗运算核心,每颗都被分配了16b一级缓存,然后再集体共享2gb三-级缓存,即核均16b。

        之所以能够做到这一点,一来是某人掌握黑科技,可以熟练地制造碳基芯片,唯一的问题就是“人工生产”导致产量太低,二来也是因为ipu的设计思路是全新的,不论是cpu还是gpu,以及动物神经系统,都是其参考借鉴的对象。比如显卡领域目前研发热点的hb高带宽显存技术就被马竞借鉴了去。

        既然基于内存都3d堆栈了,处理器部分更加不能继续平面化。实际上马竞在3d晶体管方面比intel和三星还要激进,毕竟人家要考虑工艺实现问题,而马竞却可以随便开脑洞,失败也不过是浪费几天时间罢了。

        和动物们的神经系统相比,ipu128个自带“记忆”能力的计算核心并不算多,但是也基本够用了。马竞之前有测试过不同数量的方案,总得来说核心越少、“内存”越少效果越差,反之则约好。不过随着核心数的堆砌,以及“内存”的扩容,晶体管数目迅速增加,相应的芯片的厚度、面积和发热量也要增加,最终只能折衷选择了128-16/16这个方案。

        内容未完,下一页继续阅读