4月9日,在拉斯维加斯举办的 Google Cloud Next 25 大会上,谷歌推出了第七代TPU---Ironwood。该芯片专为支持大规模思考和 AI 推理模型设计,是谷歌迄今为止性能最强的TPU。
TPU (Tensor Processing Unit)即张量处理单元,是一种专门为加速深度学习任务而设计的人工智能芯片,由谷歌公司在2015 年首次提出,第一代TPU于2016 年正式发布。
官方表示,Ironwood 的推出标志着人工智能及其发展基础设施,从提供实时信息供人类解读的响应式人工智能模型,到能够主动生成洞察和解读的模型的转变。
在推理时代,Agent将主动检索和生成数据,以协作的方式提供洞察和答案,而不仅仅是数据。而实现这一点,需要同时满足巨大的计算和通信需求的芯片,以及软硬协同的设计。
Ironwood 最高配集群可拥有9216个液冷芯片,峰值算力42.5 ExaFlops,也就是每秒运算42500000000000000000次。
据nextplatform介绍,该芯片是谷歌首款在其张量核心和矩阵数学单元中支持 FP8 计算的 TPU。
Ironwood的FP8算力为4614 TFlops,略高于英伟达B200标称的4500 TFlops。内存带宽7.2TBps,略低于B200的8TBps。
此外,Ironwood 芯片中使用到的第三代 SparseCore 加速器编码了各种算法,可以实现加速金融和科学计算的目的。
SparseCore 加速器首次亮相于 TPU v5p,并在去年的 Trillium 芯片中得到了增强。它的最初设计目的是加速推荐模型,而这些模型利用嵌入来跨用户类别进行推荐。
官方数据显示,Ironwood的每瓦性能是去年发布的第六代 TPU Trillium 的两倍。每芯片容量达到192 GB,是 Trillium 的 6 倍,能够处理更大的模型和数据集,减少频繁数据传输的需求,并提升性能。
谷歌计划在不久的将来把TPU v7整合到谷歌云AI超算,持包括推荐算法、Gemini模型以及AlphaFold在内的业务。
据悉,OpenAI联合创始人兼首席科学家Ilya Stutskever的AI初创公司Safe Superintelligence 正在利用Google Cloud的TPU芯片来支持其AI研究。
本文系观察者网独家稿件,未经授权,不得转载。
⚠️羞羞漫画在线观看 | 7天前 |
91➕国产➕爽爽黄➕在线 |
国产精品🈲久久久精品岩沢美穗 | 6天前 |
91娇喘⭕⭕❌❌白丝动漫 |
🍌伸进去🍑里动漫无打码 | 7天前 |
朵丽亚裸乳被爆❌白将 |
不知火舞魅语被❌视频 | 2天前 |
杨幂裸被❌视频无码20021 |
色㊙️虎下载 | 4天前 |
chin70e❌Ⅹ性老女人 |
拳皇库拉被❌到爽模组 | 2天前 |
扒开老师❌狂揉❌桃花岛火影忍者 |
脱👙让学生🐻 | 6天前 |
成人🔞高潮片挤奶 |
扒开腿添18禁🔞免费视频喷水 | 9天前 |
女生脱👙r让男生揉🐻小说 |
动漫美女隐私㊙️黄 | 1天前 |
曰本美女裸体㊙️放屁 |
成人扒开🍑伸进🍌❌91b站 | 9天前 |
小🐤🐤戳进去动漫 |