当前位置:首页 > 服务与支持 > 工业知识 > 正文内容

Graphcore新推出的GC200 AI处理器有何特点?

2022-06-06 03:34:49工业知识1

7月15日消息,Graphcore今日正式发布第二代IPU以及用于大规模系统级产品IPU-Machine: M2000(IPU-M2000)。新产品比第一代Graphcore IPU性能提升8倍。中国很可能成为Graphcore最新推出的第二代处理器技术最先实现商业化落地的区域之一。

据介绍,IPU-M2000是一款即插即用的机器智能刀片式计算单元,由Graphcore全新的7纳米 Colossus 第二代 GC200 IPU提供动力,并由Poplar软件栈提供全面支持。其设计便于部署,并支持可扩展至大规模的系统。这款纤薄的1U刀片机可提供1个PetaFlop的机器智能计算,并集成了针对AI扩展优化的网络技术。

Graphcore第二代Colossus IPU处理器:GC200

Graphcore IPU-M2000

IPU-M2000可构建成IPU-POD64这一Graphcore全新模块化机架规模解决方案,可用于极大型机器智能横向扩展,提供前所未有的AI计算可能性,以及完全的灵活性和易于部署的特性。它可以从一个机架式本地系统扩展到高度互连的超高性能AI计算设施中的1000多个IPU-POD64系统。

“随着IPU-M2000和IPU-POD64的推出,Graphcore进一步扩大了我们在机器智能领域的产品竞争优势。”Graphcore首席执行官Nigel Toon指出:“Graphcore通过技术创新实现更强有力的产品线,这些创新能够提供客户所期望的行业领先性能。对于寻求将机器智能计算添加到数据中心的客户而言,Graphcore最新推出的IPU-M2000凭借其强大的算力、易于扩展的灵活性和突出的易用性,将具有极强的可行性和价值提升潜力。”

Mk1 IPU产品的用户可以确信,他们现有的模型和系统可以在这些新的Mk2 IPU系统上无缝运行。与第一代Graphcore IPU产品相比,第二代产品的性能还将提高8倍。

Mk1 IPU产品与Mk2 IPU产品性能对比

IPU-M2000的设计使客户可以在IPU-POD配置中构建多达64,000个IPU的数据中心规模系统,提供16ExaFlops的机器智能计算能力。新的IPU-M2000甚至能够处理最艰巨的机器智能训练或大规模部署工作负载。

Graphcore全新的IPU-Fabric技术使大规模连接IPU-M2000和IPU-POD成为可能,该技术是专为机器智能通信而从头设计的,并提供了专用的低时延结构,可在整个数据中心内连接IPU。

Graphcore IPU-Fabric技术

Graphcore的Virtual-IPU软件与工作量管理和编排软件集成在一起,可以轻松地为许多不同的用户提供训练和推理服务,并允许根据工作情况调整和重新配置可用的资源。

Graphcore的最新产品线是通过三大颠覆性技术创新实现的,这些创新可提供客户期望的行业领先性能:

计算:每个IPU-M2000的核心都是Graphcore新的Graphcore ColossusMk2 GC200 IPU。该芯片采用台积电最新的7纳米工艺技术开发,每个芯片在一个823平方毫米的裸片上包含超过594亿个晶体管,使其成为有史以来最复杂的处理器。数据:每个IPU都有大量的In-Processor Memory。Graphcore新型Mk2 GC200在处理器内部具有史无前例的900MB超高速SRAM,在每个处理器内核旁边都设有大量RAM,以实现每位最低能量的访问。Graphcore的Poplar软件还允许IPU通过Graphcore独特的Exchange-Memory通信访问Streaming Memory。这甚至可以支持具有数千亿个参数的最大模型。每个IPU-M2000都可以支持密度高达450GB的Exchange-Memory,以及前所未有的180TB/秒的带宽。通信:IPU-M2000具有内置的专用AI联网IPU-Fabric。Graphcore创建了一个新的Graphcore GC4000 IPU-Gateway芯片,该芯片可提供令人难以置信的低时延和高带宽,每个IPU-M2000均可提供2.8Tbps。在从数十个IPU扩展到数以万计个IPU的过程中,IPU-Fabric技术使通信时延几乎保持恒定。

“将强劲算力与网络能力相结合,我们能够处理全球最先进、最复杂的算法模型。”Graphcore高级副总裁兼中国区总经理卢涛表示:“这样的算法模型,对中国本地的AI算法落地场景,如云计算、互联网和通信等场景都会产生推动作用,并将为AI产业者提供巨大的价值。”

Graphcore是一家英国AI芯片硬件设计初创公司,成立于2016年,总部位于英国布里斯托,Graphcore的主要业务是设计用于AI应用程序的处理器,为云服务等应 用提供产品支持。其16纳米IPU GC2处理器已量产。

Graphcore 是一家资金雄厚且志向高远的英国芯片设计企业。

其于近日发布了世界上最复杂的 Colossus MK2(又名 GC200 IPU)处理器,宣称拥有 594 亿个晶体管,性能是上一代 Colossus MK1 芯片的八倍。

作为对比,英伟达在今年早些时候宣布的 A100 人工智能芯片,晶体管数量为 540 亿个。

【GC200 IPU 采用 7nm 制程,拥有 594 亿个晶体管。来自:Graphcore】

据悉,每颗 GC200 芯片具有 1472 个独立的运算核心 / 8832 个独立的并行线程,所有这些均由内置的 900MB 随机存取器(RAM)提供支撑。

Graphcore 将为自家最新的 IPU 机型(M2000)配备 GC200 芯片,其在一个披萨盒大小的盒子中包含了四颗 GC200 芯片,总算力 1 Peta-Flops 。

宣布这一消息的同时,人工智能正在对芯片世界产生重大的影响。因为 AI 模型的训练需要借助高度并行的处理器,除了催生新的市场参与者(Graphcore),还激励谷歌等科技巨头加速采用自研芯片。

该公司称,新硬件完全支持即插即用,允许客户将多达 64000 个 IPU 节点连接到一起,以达成 16 Exa-Flops 的算力。

截止目前,英伟达已经抢占了 AI 计算的大部分市场。该公司起初专为视频游戏提供加速的 GPU,已被证明相当适合 AI 运算。

即便如此,Graphcore 仍试图向英伟达的市场主导地位发起挑战,并且已经吸引了微软、戴尔等科技巨头的资金和支持。

今年早些时候,Graphcore 宣布已在新一轮融资中吸引 1.5 亿美元的研发资金,总估值也达到了 19.5 亿美元。

作为一家成立于 2012 年的企业,当时深度学习的趋势刚刚开始兴起。不过该公司最大的优势,就是其芯片在设计之初就完全考虑到了 AI 应用。

Moor Insights & Strategy 分析师 Karl Freund 在接受 TheVerge 采访时称,其对 Graphcore 的最新产品感到印象深刻。而软件方面的升级,对正确利用 AI 所需的巨大并行处理能力显得尤为重要。

Graphcore 不仅将重心放在了 AI 芯片上,还考虑到了系统层面的整合。因为训练有意义的神经网络,不能只依赖于单颗芯片,而是必须在成千、乃至上万的芯片平台上完成,但可扩展性让 Graphcore 真正脱颖而出。

karl Freund 补充道:对于初创企业来说,Graphcore 的软件支持已经相当完备。其不仅能够与各种 AI 框架进行交互,还提供了使工作人员能够充分利用其硬件性能的工作负载监视工具。

本网站文章仅供交流学习 ,不作为商用, 版权归属原作者,部分文章推送时未能及时与原作者取得联系,若来源标注错误或侵犯到您的权益烦请告知,我们将立即删除.

本文链接:http://www.lengcanghe.com/fwyzc/gyzs/16801.html