intel独立gpu虽然是后起之秀,但正在无处不在!
今天,intel正式发布了全新的数据中心gpu flex系列(曾用代号arctic sound-m),主要用于视频转码与传输、视觉ai推理、云游戏、桌面虚拟化等领域。
早在2020年11月,intel就发布了,基于xe lp低功耗架构的dg1核心,面向的就是高密度、低时延的安卓云游戏、流媒体服务。
全新的flex系列则是基于arc a系列独立显卡同款的xe hpg高性能架构、dg2核心,支持h.264、h.265(hevc)、av1硬件编解码,vp4解码与传输。
该系列包括两款型号:
一是flex 170,满血的32个xe核心(512个执行单元/512个xmx引擎)、32个光追核心,基准频率1950mhz,最高加速2050mhz,搭配256-bit 16gb gddr6显存,等效频率18ghz,带宽576gb/s。
整卡功耗150w,单插槽设计,pcie 4.0 x16系统接口。
二是flex 140,一半的16个xe核心(256个执行单元/256个xmx引擎)、16个光追单元,基准频率、最高加速分别降低至1600mhz、1950mhz,搭配192-bit 12gb gddr6显存,等效频率14ghz,带宽336gb/s。
整卡功耗也减半来到75w,系统接口同样减半至pcie 4.0 x8。
这样的规格,应该分别对应桌面顶级型号arc a770、主流型号arc a580的水平,当然它们俩是没有视频输出接口的,频率、功耗估计也会不太一样。
flex gpu系列集成最多四个xe媒体引擎,相比于nvidia a10,可提供5倍的媒体转码吞吐性能、2倍的媒体解码吞吐量,而且只需要一半的功耗,开源的av1硬件编码器还能节省30%以上的带宽。
它单卡即可支持多达36路视频流的1080p60转码吞吐量、8路视频流的4k60转码吞吐量。
在4u服务器中扩展到10卡配置时,可以支持多达360路视频流的h.265-h.265 1080p60转码吞吐量。
搭配deep link超级编码功能,flex 140可在单卡上配备两套编解码设备,满足“一秒时延”要求,同时提供8k60实时转码,适用于av1、h.265 hdr格式。
安卓云游戏方面,flex 170、140分别支持多达68路、46路720p30数据流,flex 140 6卡可以做到216路720p30数据流。
目前,google play商店中热门的近90款游戏都已经得到支持。
另外,intel还提供了一整套开放式、包括开源组件和工具的软件堆栈(open software stack),以有效实现flex gpu面向视觉云工作负载的功能,包括对oneapi、openvino的支持。
戴尔、慧与(hpe)、新华三、浪潮、联想、超微等将陆续推出搭载flex gpu的系统。
应用方面,首先从媒体传输、安卓云游戏开始,随后扩展到windows云游戏、ai、vdi(虚拟桌面基础架构)。