美股

美光科技(MU.US)这款产品能改变DRAM行业吗?

2020年9月9日 09:30:33

本文来自 “半导体行业观察”。

美光科技(MU.US)在上周的虚拟简报会上分享了有关Nvidia在GeForce RTX 30系列图形卡中使用的最新GDDR6X SGRAM的其他一些详细信息。该公司透露,它已经对启用新型存储器的技术进行了十多年的试验,并表示GDDR6X SGRAM尚未得到JEDEC的标准化。目前,只有Nvidia使用GDDR6X内存,但是Micron希望这种情况会随着时间而改变。

PAM4信令:自2006年以来一直在DRAM中探索

美光公司位于德国慕尼黑的图形DRAM设计中心拥有图形设计创新的历史,因为该设计中心隶属于奇梦达,而奇梦达则是从英飞凌分拆的。这个实验室的工程师推出业界首批GDDR5,GDDR5X和现在的GDDR6X芯片。实际上,美光科技是GDDR5X的唯一制造商,现在它是GDDR6X的唯一制造商。

四级脉冲幅度调制(PAM4)信令是GDDR6X存储器的关键功能。该技术使用四个信号电平在每个周期传输两个数据位,因此与上一代SGRAM类型相比,任何工作频率的有效带宽都增加了一倍。此外,PAM4为更高的数据传输速率(尽管需要付费)打开了大门。结果,PAM4提高了时钟效率和速度。 不过,有一点需要提醒的是。GDDR6的burst length为16字节(BL16),这意味着其两个16位通道中的每个通道每次操作都可以传送32个字节。GDDR6X的burst length为8字节(BL8),但是由于PAM4信令,其每个16位通道在每次操作中也将提供32个字节。为此,GDDR6X在同一时钟下并不比GDDR6快。

PAM4信令已用于数据中心网络标准(例如Infiniband)已有很多年了,四级编码本身并不是什么特别的新事物。与传统的PAM2 / NRZ调制相比,PAM4只是被应用到大型数据中心和超级计算机的主要原因是其实现成本。 但是高昂的成本并不能阻止实验室中技术的探索,这是美光美国分公司自2006年以来一直在做的事情。在此过程中,他们已获得45项专利。 美光公司图形部门主管拉尔夫·埃伯特(Ralf Ebert)说:“自2006年以来,美光公司的科学家就已经开始研究如何在内存中利用PAM4。”“我之所以说科学家是因为我要区分开发人员和科学家。这些人确实为创新做基础。他们基本上采用了PAM4技术,并试图弄清楚我们如何在DRAM中使用它。” 

经过多年的PAM4探索,美光公司认为是时候将该技术应用于图形内存了。GDDR从2007(GDDR5)到2018(GDDR6)的架构演变非常简单(尽管回到了BL8),因此引入新的信号方案需要美光将其美国科学家和德国工程师召集在一起。 埃伯特说:“科学家们必须与GDDR开发人员并肩工作。”“他们还与系统和产品工程师紧密合作,这可以让他们从系统和批量生产的角度了解挑战。” 我们今天所知的GDDR6X的开发工作可以追溯哦到三年前的2017年底。通常,将新型DRAM推向市场需要花费更长的时间,但由于这主要是内部项目(至少在存储设备级别)上,美光科技已经非常迅速地实施了技术。不过,这是有原因的。

与Nvidia紧密合作开发

开发新型存储器不仅要考虑某些应用程序,而且还要考虑某些客户。Nvidia是第一家使用GDDR5X和GDDR6(以及2000年代初期的GDDR2和GDDR3)的公司,因此也很早就与美光科技合作进行GDDR6X项目就不足为奇了。实际上,根据美光(Micron)的说法,英伟达(Nvidia)向美光(Micron)请求了一种可提供比GDDR6更高性能的离散存储解决方案。 Ebert说:“您必须要与客户合作,并且理想情况下,您需要依靠已经建立了多年的密切业务和技术合作。确认该产品从一开始就可以在应用中正常工作。” Nvidia必须为GDDR6X开发全新的内存控制器和PHY,因为PAM4信令改变了内存子系统的总体工作方式。基于迄今为止尚未有IP设计公司宣布其GDDR6X产品的事实,看来Nvidia已在内部设计了所有产品。 

 目前,英伟达在其基于GA102 GPU的GeForce RTX 3080/3090图形卡上使用GDDR6X,这个产品主要针对游戏玩家。该公司还将提供具有相同芯片和GDDR6X内存的Quadro RTX专业图形卡。同时,美光表示,该GDDR6X 是也用于AI和HPC应用程序,这两者都是NVIDIA的GeForce RTX的Quadro(因为这些卡中的AI FP16和FP32张量表现,以及FP64表现为HPC方面封顶)的重点。美光可能是假想的用法,或者暗示即将由GA102提供支持的Nvidia Titan系列卡可以为AI和HPC提供正确的性能(无上限)。 Nvidia是Micron唯一的GDDR6X推出合作伙伴,但Micron强调说,它并不是专门为GPU开发人员设计的新型内存。这家DRAM制造商计划也向其他公司提供GDDR6X。 Ebert说:“我们现在开始向行业提供并向业界开放,GDDR6X并不是特定于客户的。”“我们希望其他客户有兴趣向前发展,然后我们也将与他们互动。”

带有PAM4的GDDR6X:较难构建,但比HBM2便宜

美光表示,PAM4要求它重新设计其GDDR6X存储设备中的写数据捕获电路(接收器),以准确地采样和解析四个不同的信号电平。为此,每个GDDR6X DRAM的每个I / O和数据总线反相(DQ / DBI)引脚都包含三个输入子接收器。主机可以在写训练序列期间微调参考VREFD电压电平。GDDR6X的输出驱动器也必须重新设计,但美光表示,重新设计依赖于传统方法。  

美光承认,GDDR6X芯片的生产成本比上一代GDDR6器件高。此外,它们需要非常干净和稳定的信号,这就是为什么为GeForce RTX 3080/3090卡供电的Nvidia GA102 GPU的内存控制器现在位于其自己的powerrail上,以确保非常干净和稳定的电源。 就功耗而言,有必要指出的是,由于性能的显着提高,GDDR6X在设备级别的功耗效率比GDDR6高出15%(7.25 pj / bit与7.5 pj / bit)。 总体来说,GDDR6X芯片及其实现比GDDR6更昂贵,但仍比HBM2类存储器便宜得多。

GDDR6X不需要堆叠,它以分立芯片的形式出厂,可以在工厂焊接。离散DRAM的整个基础结构已经存在了数十年,所有过程都是熟悉且便宜的。相比之下,HBM2 KGSD(众所周知的堆叠die)必须在半导体工厂组装,然后放置在另一个工厂的洁净室中与GPU相邻的中介层上。 Ebert说:“高性能DRAM通常也要付出更高的代价。”“ GDDR6X的最大优势在于,我们可以将性能提高到更高的水平,同时仍保持在一定的成本范围内。这是因为GDDR6X仍然是离散存储解决方案。GDDR6X存储器可以像其他任何存储器一样组装板载制造商在其标准环境中的PCB上的内存。当您研究内存的不同速度等级时,通常会有成本增加器的范围;我们将GDDR6X的位置与典型范围保持一致。

对客户而言,这种方式的成本非常高,这主要是因为它仍然是离散存储解决方案。” 美光没有透露其8 Gb GDDR6X器件的die尺寸,也没有将其与8 Gb GDDR6器件进行比较。该公司强调,这是第一种使用PAM4信号的存储器,而后者是一项突破,为各种创新打开了大门。 美光公司图形DRAM主管说:“ PAM4是一个挑战,我们相信,有了这一突破,就可以向前迈进。”“我们相信,这将改变DRAM行业。我们是第一个这样做的公司,并且我们已经为此进行了一段时间的研究。”

GDDR6X可扩展密度和数据速率

目前,美光科技提供8 Gb GDDR6X芯片,额定速率分别为19 Gbps和21 Gbps。新的存储设备是使用该公司成熟的第四代10 nm级工艺技术(也称为1αnm)生产的。该公司制定了在容量和速度容器方面扩展GDDR6X的路线图。 明年,美光科技计划在产品阵容中增加16 Gb密度,并随着时间的推移提供更快的芯片。目前,美光科技是GDDR6X的唯一生产商,而英伟达是唯一的客户,因此GDDR6X的发展取决于英伟达的需求和美光的批量生产能力。这里的关键信息是GDDR6X将设置为在超过21 Gbps的性能方面进行扩展。

GDDR6X:不是JEDEC标准,但不是专有的

为了尽快完成GDDR6X并使其与Nvidia的Ampere GPU一起使用,两家公司几乎以隐形的模式工作。两家公司从未将规范提交给JEDEC进行标准化,因此GDDR6X是目前只有Micron可提供的专有存储器。 Ebert说:“目前,它尚未提交给JEDEC进行标准化。” GDDR5X很大程度上是由美光开发的,几乎没有其他行业的投入。JEDEC在美光开始批量生产GDDR5X之前正式发布了该标准,并将其提供给该组织的成员。但是,除Nvidia以外,没有其他人使用GDDR5X,除Micron以外,没有人生产这种类型的内存。

传统上,GDDR类型的内存几乎仅用于图形卡和游戏机。通过GDDR6,美光及其行业同行开始为其他需要高带宽的应用推广图形DRAM。在潜在的用例中,它们针对汽车,网络和FPGA应用。美光希望GDDR6X能够解决非GPU市场,但在此并未做出任何真正的承诺。 今天的GPU已广泛用于各种AI应用程序,因此自然而然,在美光公司的简报中,当公司谈论用于非图形垂直领域的GDDR6X时,就提到了训练和推理应用。同时,由于Nvidia将其Titan系列显卡面向游戏玩家,AI发烧友和各种专业消费者,因此,如果Nvidia推出Amprere架构的Titan型号,美光的GDDR6X将在技术上针对这些市场。 

为了应对新兴市场,美光不仅需要提供内存本身,还需要提供内存控制器IP,PHY IP和验证IP。IP设计公司(如Avery,Cadence,Rambus和Synopsys)提供了这些类型的东西。由于GDDR6X的旅程才刚刚开始,因此,假设IP厂商看到行业对GDDR6X的潜在需求,它们就必须迎头赶上。不能完全保证,特别是考虑到GDDR6X不是JEDEC支持的行业标准。 美光做了一个有趣的评论,说CPU可以使用GDDR6X: Ebert说:“从历史上看,没有什么可以阻止整个行业使用带有CPU的GDDRDRAM的。” “在这种情况下相同。但这是CPU公司必须做出的决定。”

图形内存的未来:即使对于HBM,PAM4也将保留

对于Micron来说,GDDR6X不仅是一种高度竞争的产品,而且是将PAM4信号带入DRAM的工作的高潮。尽管这种编码类型不会用于DDR5 SDRAM,但美光科技相信,从长远来看,这是内存的未来。 美光公司图形内存总监说:“因此,GDDR6X是我们引入PAM4的地方,我们肯定可以看到它的发展。” “潜在地,PAM4可以用在其他内存标准中。这种类型的技术可能或可能会被具有CPU或我们其他处理器的公司使用。”

实际上,PAM4在业界的使用范围将比今天广泛得多。PCIe 6.0将于2021年面世,它使用PAM4信令提取更高的效率和更高的数据速率。考虑到PCIe的广泛采用,CPU和ASIC公司最终必将同时支持PCIe6.0和PAM4。一旦业界学习到如何使用PCIe 6.0进行四级脉冲幅度调制,它肯定会在其他地方应用。 美光公司表示,它首先将PAM4实施到LPDDR测试芯片中以对该技术进行实验。此外,在我们准备这个故事时发现的一项专利说,美光三年前就获得了带有PAM4和PAM8信号的堆叠式HBM级存储器的专利。 HBM类型的内存还必须采用分立DRAM设备(QDR,BL8 / BL16等)使用的负载,因此何时可以采用新信令很难做出预测。但是,如果当前可用的HBM2E 3.6 Gbps芯片采用四级脉冲幅度调制,则每设备带宽将增加一倍,达到922GB / s。这意味着六模块6144位DRAM子系统将提供高达5.5 TB / s的带宽。不过,这只是纯粹的推测。

总结

美光的GDDR6X是业界首款采用四级脉冲幅度调制信号(PAM4)的量产存储器。新型编码使用四个信号电平(在PAM2情况下为1)在每个周期传输两个数据位,并为更高的频率打开了大门。自2006年以来,美光公司一直在尝试使用PAM4,因此PAM4不仅是GDDR的演进,而且是整个DRAM的演进。尽管DDR5不使用PAM4,但美光科技已经为PAM4甚至启用PAM8的HBM存储器申请了专利。 DRAM制造商承认,与GDDR6相比,GDDR6X的构建和实施难度更大(并且可能更昂贵)。但是,即使在婴儿期,GDDR6X也比成熟的HBM2E便宜,因为我们在这里处理离散存储芯片。同时,由于GDDR6X返回的burst length为8字节(对于GDDR6,则为16字节),因此在相同的每引脚数据速率下,它不比其前身GDDR6快。 GDDR6X目前最大的诟病是它是由Micron独家开发,并获得了Nvidia的一些支持。美光尚未向JEDEC提交该标准,目前尚不清楚GDDR6X是否会成为行业标准。美光希望将GDDR6X用于非图形应用,但是如果没有其他公司的支持,将很难推广这种新型的内存。

(编辑:玉景)

(更多最新最全港美股资讯,请点击下载智通财经App

香港交易所资讯服务有限公司、其控股公司及/或该等控股公司的任何附属公司均竭力确保所提供信息的准确和可靠度,但不能保证其绝对准确和可靠,且亦不会承担因任何不准确或遗漏而引起的任何损失或损害的责任(不管是否侵权法下的责任或合约责任又或其它责任)

相关阅读

取消评论