欧宝体育官网登录:智能网卡势在必行可编程、平台化加速行业部署
业务,过去一年的年增长率达到24%,季度增长率达到92%。基于UltraScale+架构,赛灵思已经推出了Alveo四大加速卡系列(U50U200U250U280),在计算加速、存储加速、网络加速三方面助力数据中心的发展,同时也构建起庞大的数据中心系统,既有戴尔、HPE、浪潮、
现阶段,不断增长的联网需求与不断上涨的成本正在成为数据中心的新挑战,基于此,赛灵思推出了Alveo家族最新的一体化SmartNIC平台Alveo U25,在单颗器件上实现了一体化的网络、存储、计算加速能力,以提供更高的效率和更低的总拥有成本(TCO)。赛灵思大中华区销售副总裁唐晓蕾(Maria Tang)、数据中心事业部产品及平台营销副总裁Donna Yasay,共同介绍了这一创新平台所传递的价值。
赛灵思数据中心事业部产品及平台营销副总裁Donna Yasay数据中心的联网危机数据中心正在面临联网危机,云基础设施饱受服务器I/O所造成的数据瓶颈的困扰。首先,进出数据中心联网的流量在迅速增长,内部的横向流量年负荷增长率在25%以上。其次,随着网络数据爆炸式地增长,额外的工作涌入云数据中心服务器,大量地挤占了CPU资源。边缘的一级云服务商(如亚马逊、微软)多年前已经注意到了这个问题,采取将联网功能转移到SmartNIC上的做法来为CPU减负,但是,由于超出80%的云服务器节点目前无法提供 SmartNIC 接入,因此联网卸载一时难以实现。
端口的联网问题为何会如此严峻?这是因为端口基于的是模拟技术和调制技术的创新,速度持续以几何级倍数增长,将远超摩尔定律和Dennard缩放比例定律(Dennard’s scaling)计算周期速率。如果这一问题没有得到足够的重视,未来将越来越严重,甚至导致服务器中所有CPU资源遭到挤占,而无暇顾及应用级处理。
Donna Yasay补充,一些云服务器厂商并非不需要对服务器上的联网功能进行卸载,他们通常仍在采用传统的NIC,特别是二级、三级云服务厂商,没有足够雄厚的研发资源,很难通过一己之力采用SmartNIC并做到大规模部署。因此,他们更加需要现成的、便捷的、开箱即用的解决方案。SmartNIC究竟“Smart”在哪?事实上,早有业内人士预测,SmartNIC将成为主流的云计算技术。对裸机云和安全性的需求,将推动软件定义的功能进入可编程SmartNIC中,而非增加昂贵的通用服务器CPU。
市场调研机构Dell’Oro集团研究总监Baron Fung表示:“预计到 2024 年,SmartNIC 市场规模将超过6亿美元,占据全球市场的23%。随着云服务提供商的纵向扩容,他们正在不断增加 SmartNIC 的部署,以便为业务应用释放宝贵的CPU核,优化服务器利用率。而电信服务提供商则是另一大具有强劲增长潜力的市场,他们正考虑将 SmartNIC 从核心网集成到边缘网,为 NFV 和AI推断等应用提供服务。”
基于FPGA的Alveo U25 SmartNIC迎合了这一不断增长的市场机遇。据介绍,Alveo U25是业界首款“一体化 SmartNIC 平台”,通过将高度优化的 SmartNIC 平台与FPGA引擎相结合,实现了全可编程与一站式加速应用,可用于业界具有一定挑战的需求与工作负载中,如:SDN、虚拟交换、NFV、NVMe-oF、电子交易、AI推断、视频转码和数据分析等。
为什么能够做到一体化的平台加速?Donna Yasay介绍了来自FPGA的核心属性:计算应用方面,FPGA在机器学习、推断数据库、加速视频转码等方面表现突出;联网方面:能够迅速进行信息包的处理和查询;存储方面,能够支持如压缩、加密和重复数据的删除等工作。
此外,还有FPGA灵活应变的特性,云服务商不论是开发新功能还是进行扩展,都比ASIC产品更有优势。
与基于SoC的NIC相比,Alveo U25 SmartNIC 平台可以提供更高的吞吐量和更强大的灵活应变引擎,支持云架构师快速为多种类型的功能与应用提速。Alveo U25支持“bump-in-the-wire (线缆内的块)”式无缝嵌入网络、存储和计算卸载及加速功能,可以避免不必要的数据传输和 CPU 处理,从而最大限度提高效率。而这也显著降低了 CPU的负担并释放更多资源,以运行更多应用。嵌入式ARM处理器提供了独特、关键的控制层处理功能,可以支持新兴的裸机服务器用例。基本型NIC可提供超高吞吐量、小数据包性能与低时延。标准型全功能 NIC 解决方案与驱动程序采用获得专利的 Onload应用加速软件,时延降幅高达80%,并且在云应用中为基于传输控制协议( TCP )的服务器应用提高了效率,最高可达 400%。
Alveo U25 所提供的首个开箱即用型加速应用,是对 Open vSwitch ( OVS )卸载与加速的支持。这个即插即用型解决方案将从服务器卸载90%以上的 OVS 处理,从而将数据包吞吐量提升 5 倍以上。
未来,赛灵思还计划推出针对安全功能的一站式解决方案,这些安全功能诸如 IPSec、SSL/TLS、AES-256/128,同时还有分布式防火墙和 AI 推断。目前,Alveo U25 SmartNIC 平台正为早期试用客户提供样品。预计将于 2020 年第三季度开始批量供货。
针对高性能电子交易环境与企业级数据中心,赛灵思还推出了XtremeScale X2562 10/25Gb 以太网适配器卡,该卡符合 OCP Spec 3.0外形尺寸规格,可提供亚微秒级时延、高吞吐量,以及可将实时数据包和信息流连接到数千个虚拟 NIC 的超大规模连接能力。X2562 目前已经开始提供样品,将于 2020 年第二季度批量供货。
同时发布的还有基于 FPGA 的开放计算加速器模块( OAM )的概念验证板。该夹层卡基于赛灵思UltraScale+ VU37P FPGA 并搭载 8GB HBM存储器,符合开放加速器基础设施( OAI )规格,可支持七条 25Gbps x8 链路,为分布式加速提供了丰富的模块间系统拓扑。一站式软硬件协同的加速平台根据DellOro最新报告,整体控制器和适配器市场将以7%的年复合增长率增长,其中25Gbps和100Gbps的销售将是主要增长驱动力。同时,SmartNIC市场的年复合增长率将达到25%,这为适配器供应商提供了以更高价格推出创新产品的机会。反过来,这可以降低数据中心TCO。
唐晓蕾表示,在Alveo系列产品研发和推出策略上,赛灵思从客户TCO角度来分析,希望能真正解决数据中心客户的痛点。数据中心需要加速卡是确定趋势,随着摩尔定律的终结、数据的指数级爆发,数据中心对加速卡的需求会越来越大,现在仅是黎明开始的阶段。未来加速卡的市场格局分布,可以从几个维度看待:一是计算,特别是在云端上要去努力提升;二是网络方面,实现可扩展性、可视化、智能化;三是存储,在带宽的占用、成本方面,加速卡发展潜力很大。
为什么要推出平台型的产品?唐晓蕾表示主要是希望企业在数据加速方面能够更快面向市场。Alveo U25与赛灵思去年推出的Vitis统一软件平台是有机结合。由于之前FPGA开发有一定的门槛,而随着数据中心应用场景的不断扩展,新的客户群体在增加,必须在软硬件协同做更多提升,才能让整个客户群体受益。Alveo U25实现了一站式加速应用,可以助力非一级云数据中心运营商更加方便地部署,同时,还支持赛灵思和独立软件提供商提供的一站式应用。其编程模型既支持 HLS 和 P4 等高级网络编程抽象,也支持 Vitis统一软件平台等计算加速框架,以便实现赛灵思和第三方所提供的加速应用。
本电台基于软件无线电体制架构,具有多波形加卸载功能,适用于灵活的远距离组网应用。产品可支持多基站接入....
PDIUSBD12 的读写操作都各自有一个读写控制信号 WR_N 和 RD_N,每次读写操作都在对应....
因此可通过结合最新的HLS优化(例如用于脉动阵列的PolySA和用于模板的SODA与数据流体系结构)....
一些自旋电子存储器已经面世。MRAM(磁性随机存储器)已经商业化,在某些情况下可以取代电子存储器,但....
FPGA 大家应该都听过,那么我们能用它做什么,我们学会它之后在未来我可以从事哪些领域的工作?
我们在实现FPGA逻辑电路时,时常会在Verilog代码里添加一些约束原语。 前言 我们在描述FPGA电路时,我们经常会在电路...
以Xilinx Vivado设计套件中提供的FFT IP为例,简要说明如何进行FFT IP配置和设计....
今天给大家介绍一下FPGA上部署深度学习的算法模型的方法以及平台。希望通过介绍,算法工程师在FPGA....
普通的 FPGA 一般是可以从 flash 启动,或者被动加载,但是ZYNQ不行,ZYNQ必须PS端....
阶段0,主要是运行芯片内部固化的BootROM程序,这个BootROM主要是识别启动模式(spi/s....
在之前的设计开发时,利用modelsim得出中间某单元的数据,并且输入也是设计者在testbench....
图像是用各种观测系统以不同形式和手段观测客观世界而获得的,可以直接或间接作用于人眼进而产生视知觉的实....
引言:7系列FPGA具有多个时钟路由资源,以支持各种时钟方案和要求,包括高扇出、短传播延迟和极低的偏....
图像是用各种观测系统以不同形式和手段观测客观世界而获得的,可以直接或间接作用于人眼进而产生视知觉的实....
7系列FPGA拥有丰富的时钟资源。各种缓冲器类型、时钟输入管脚和时钟连接,可以满足许多不同的应用需求....
FPGA传统上被用作设计新数字芯片的早期验证原型已经很久了,但随着机器学习技术的出现,FPGA体现出....
最早的ML应用实现是软件导向的,并对CPU和GPU产生了巨大影响。但CPU和GPU面临的挑战在于其巨....
南海产业园创新地对园区内各项目进行数字化和智能化设计,建成全国第一家数字化垃圾焚烧发电厂、智能收运系....
为了在越来越复杂的系统设计中,FPGA工程师之间保持高效沟通和工作推进,这就需要找到一个适合的设计方....
在5G无线、卫星通信、雷达探测、航天测控等复杂系统设计中,FPGA工程师扮演着重要角色。
这是云计算的突出优势。举个例子,如果客户需要建立一台虚拟机,过去可能需要2~3个月才能完成(购买硬件....
ALINX公司研发团队在疫情期间全部居家办公,研发工作有序推进,为了感谢所有客户对ALINX的支持,研发团队4名工程师在疫...
自适应计算能够从云端部署到边缘再部署到终端,将最新的架构创新提供给端到端应用的每一个部分。并且借助当....
使用Laplacian算子滤波是将模板与图像做卷积运算,然后将得到的结果取绝对值后,再进行防治溢出(....
FPGA型号 : ALTERA的飓风4 问题: 由于我的使用特性,在某段时间内必须连续的读DDR2(1280次),且读取的相邻地址不...
西部数据22TB WD Gold™、WD Red™ Pro 和 WD Purple™ Pro HDD....
当前,5G、人工智能、自动驾驶等技术快速发展,应用场景也愈加广泛,这背后,有着灵活高效、高性能、低功....
RT,求助 自己做了一个PL核 获取时钟和数据 并输出 如何把数据传入DDR中,有现成的IP核还是有相关的教程吗 开发工具 ...
在FPGA研发及学习过程中,有一个关键步骤就是下板实现,做硬件“硬现”很重要,一般来说用JTAG口比....
什么是FPGA原型? FPGA原型设计是一种成熟的技术,用于通过将RTL移植到现场可编程门阵列(F....
我在FPGA中调用了一个RAM 并把经过FPGA处理的程序存入了RAM中 现在需要用DSP读取这些数据 希望能有程序参考 ...
近年来,随着数据中心的迅猛发展,数据中心的能耗问题也越来越突出,有关数据中心的能源管理和供配电设计已....
本系列将带来FPGA的系统性学习,从最基本的数字电路基础开始,最详细操作步骤,最直白的言语描述,手把....
使用PCAM和Display Port添加IP内核展示FPGA处理图像的能力
在这个项目中,我们将探索使用 PCAM(FMC扩展板) 和 Display Port 建立和运行图像....
人工智能的怀疑论者批评了当前技术中存在的内存瓶颈,认为无法加速处理器和内存之间的数据移动阻碍了有用的....
本系列将带来FPGA的系统性学习,从最基本的数字电路基础开始,最详细操作步骤,最直白的言语描述,手把....
今天给大侠带来基于FPGA的以太网控制器(MAC)设计,由于篇幅较长,分三篇。今天带来第三篇,下篇,....
今天给大侠带来基于FPGA的数字视频信号处理器设计,由于篇幅较长,分三篇。今天带来第三篇,下篇,程序....
DPU(数据处理器)是一种新型的可编程处理器,专门用于围绕数据中心的数据移动,现在与 CPU 和 G....
今天给大侠带来的是一周掌握FPGA Verilog HDL 语法,今天开启第二天。上一篇提到了整数型....
今天给大侠带来的是一周掌握FPGA Verilog HDL 语法,今天开启第一天,下面咱们废话就不多....
对于图像处理的知识,个人仅限于研究生时上过的数字图像处理课程,而对于FPGA的数字图像处理,一直仅限于略(yan)有(gao)耳(s...
fpga 上电时,默认是从 flash 的 0x00 地址开始读数据。如 UG470 文档 page....
fpga 上电时,默认是从 flash 的 0x00 地址开始读数据。
本系列将带来FPGA的系统性学习,从最基本的数字电路基础开始,最详细操作步骤,最直白的言语描述,手把....
高效的架构和实现应尽可能利用供应商的现有IP核。确定可以在整个体系结构中重用的模块也是明智的,例如控....
先谈谈第二点关于思维习惯。我发现有些人会有这样一种习惯,先用一段式状态机实现功能,仿真ok后,再将其....
数字增强型高速ADC用于低功耗无线 还具有内置抽取滤波器,用于提高 SNR、分数延迟恢复 (FDR)、相位....
引言:本文我们介绍一下全局时钟资源。全局时钟是一个专用的互连网络,专门设计用于到达FPGA中各种资源....
只有在脑海中建立了一个个逻辑模型,理解FPGA内部逻辑结构实现的基础,才能明白为什么写Verilog....
Zynq 就是两大功能块,PS 部分和 PL 部分, 说白了,就是 ARM 的 SOC 部分,和 F....
与将数据处理集中在云计算设施或数据中心进行云端训练和推理的模式不同,边缘AI在本地就能给终端设备提供....
康普近日推出全新高速光纤平台Propel,旨在赋能数据中心管理者应对当前算力需求的指数级增长。随着各....
1、使用FPGA产生脉冲调制(PWM)信号 编写程序,使用FPGA产生脉冲调制(PWM)信号,且信号的周期和占空比可通过按...
前言 近年来伴随着数字经济的蓬勃发展,数据中心在新型基础设施体系的支撑作用愈发凸显,其在赋能千行百业....
高云软件支持在线逻辑分析仪功能,可以通过波形来分析时序是否正确,这极大的方便了硬件调试工作,能够快速定位问题,下面拿comb...
利用Vivado, VHDL实现任意大小的矩阵乘法运算,matlab生成任意的测试数据,将仿真结果与matlab结果进行对比,最终实现全部匹...
1、实现一个24进制加法计数器的设计 本实验设计实现一个24进制的加法计数器,它由晶体振荡器、分频器、计数器和数码管显示器组成...
TMP411 ±1°C Programmable Remote/Local Digital Out Temperature Sensor
TMP411设备是一个带有内置本地温度传感器的远程温度传感器监视器。远程温度传感器,二极管连接的晶体管通常是低成本,NPN或PNP型晶体管或二极管,是微控制器,微处理器或FPGA的组成部分。 远程精度为1 C适用于多个设备制造商,无需校准。双线串行接口接受SMBus写字节,读字节,发送字节和接收字节命令,以设置报警阈值和读取温度数据。 TMP411器件中包含的功能包括:串联电阻取消,可编程非理想因子,可编程分辨率,可编程阈值限制,用户定义的偏移寄存器,用于最大精度,最小和最大温度监视器,宽远程温度测量范围(高达150C),二极管故障检测和温度警报功能。 TMP411器件采用VSSOP-8和SOIC-8封装。 特性 1C远程二极管传感器 1C本地温度传感器 可编程非理想因素 串联电阻取消 警报功能 系统校准的偏移寄存器 与ADT7461和ADM1032兼容的引脚和寄存器 可编程分辨率:9至12位 可编程阈值限...
TMP468器件是一款使用双线 C兼容接口的多区域高精度低功耗温度传感器。除了本地温度外,还可以同时监控多达八个连接远程二极管的温度区域。聚合系统中的温度测量可通过缩小保护频带提升性能,并且可以降低电路板复杂程度。典型用例为监测服务器和电信设备等复杂系统中不同处理器(如MCU,GPU和FPGA)的温度。该器件将诸如串联电阻抵消,可编程非理想性因子,可编程偏移和可编程温度限值等高级特性完美结合,提供了一套精度和抗扰度更高且稳健耐用的温度监控解决方案。 八个远程通道(以及本地通道)均可独立编程,设定两个在测量位置的相应温度超出对应值时触发的阈值。此外,还可通过可编程迟滞设置避免阈值持续切换。 TMP468器件可提供高测量精度(0.75C)和测量分辨率(0.0 625C)。该器件还支持低电压轨(1.7V至3.6V)和通用双线制接口,采用高空间利用率的小型封装(3mm×3mm或1.6mm×1.6mm),可在计算系统中轻松集成。远程结支持-55C至+ 150C的温度范围。 特性 8通道远程二极管温度传感器精度:0.75&...