- 近期焦点
近日,2021世界人工智能大会(WAIC2021)“AI·智能计算引领变革”前沿论坛成功举办。与会嘉宾深入探讨了AI芯片技术的发展趋势,展望未来人工智能在数字化转型中的引领作用。随着智能化时代人工智能技术逐步渗透到社会生活的方方面面,人们对算力的需求也在不断提升。以强算力、大存储、高带宽、强互联、低能耗为特征的第二代AI芯片有望成为支撑普惠算力需求的主要技术。而在WAIC2021举办前夕,燧原科技率先发布了国内第二代人工智能训练产品“邃思2.0”芯片,以及基于邃思2.0的“云燧T20”训练加速卡和“云燧T21”训练OAM模组。何为第二代AI芯片?它有哪些特征?中国企业如何才能建立起强大的产业生态支撑其持续发展?
算力成产业进一步发展突破口
目前,人工智能的发展正在进入一个新的阶段,一方面视觉语音类算法与应用相对成熟,对低成本算力的诉求从未如此强烈;另外一方面NLP的发展与应用相对不成熟,超大模型的技术路线带来了更超强算力的需求。GPU作为人工智能算力的主力军,在这两方面都出现了瓶颈,因此,产业急需通过更加符合人工智能运算特点的算力芯片与算力平台基础设施搭建,提供性能优异且成本可控的普惠算力,加速各类行业和各类型企业更大范围的数字化转型。
“先前,人工智能要做什么,需要专家将人类已经存在的信息变成算法,留在计算空间中,让计算机自动执行人类已经设计好的程序。而现在的云端大型运算,更像是一个自动计算机,自动执行程序,人类程序员形似‘天启’为其注入智力,人们为其提供行为数据。因此,未来的AI领域需要人机混合的群体智能,把算力、数据、工具有效地连接起来,实现人、机、物体系的大规模协同。”中国科学院院士、之江实验室项目首席科学家王怀民先生在“AI·智能计算引领变革”前沿论坛中表示。
可见,人工智能领域正经历着巨大的变革,对算力的需求也将越来越强。第二代AI芯片正在成为人工智能技术进一步发展的突破口。2017年,国务院发布《新一代人工智能发展规划》以来,人工智能出现一些新特点,包括深度学习、跨界融合、人机协同、群智开放和自主智能等。AI芯片作为人工智能算力的依托,对其性能上的需求也在不断提高,比如更强的算力、更大的存储容量、更高的带宽,以及更强的互联能力等。
浪潮人工智能与高性能产品部副总经理赵帅认为,随着人工智能的发展,行业呈现出多元化、巨量化趋势。人工智能已经从早期纯粹的计算演变成AI训练、AI推理等不同的业务应用,对算力的需求也有着很大的不同。如今人工智能的浮点计算力参数已经达到6000亿FLOPS,在这当中带来了巨量数据、巨量模型、巨量参数及巨量计算力需求。面对如今人工智能领域的巨大变革,产业亟待需要新一代人工智能芯片提供算力上的支撑。
架构创新加速技术进步
相比第一代产品,第二代AI芯片无论在架构创新升级、通用性以及绿色化等方面都将有着极大的提升。
燧原科技创始人兼COO张亚林介绍,邃思2.0在架构上进行了大规模的升级,意在全方位打造智算集群。架构升级实现了算力提升,新一代全自研的GCU-CARA全域计算架构,针对人工智能计算的特性进行深度优化,夯实了支持通用异构计算的基础;支持全面的计算精度,涵盖从FP32、TF32、FP16、BF16到INT8,并成为中国首款支持单精度张量TF32数据精度的人工智能芯片。单精度FP32峰值算力达到40 TFLOPS,单精度张量TF32峰值算力达到160 TFLOPS,均为国内第一。同时,邃思2.0搭载了4颗HBM2E片上存储芯片,高配支持64GB内存,带宽达1.8TB/s,是中国第一个支持HBM2E和单芯片64GB内存的产品。燧原开发GCU-LARE全域互联技术提供双向300GB/s互联带宽,支持数千张云燧CloudBlazer加速卡互联,实现更强的线性加速比。张亚林表示,燧原科技将采取类似“Tick-Tock”的策略,即每2年为一个周期,Tick阶段升级工艺,Tock阶段升级处理器架构,而此次邃思2.0便是处于Tock阶段。
为了使得平台能够广泛地支持更多的领域,新一代AI芯片在架构的通用性方面也应有极大地提升。
目前人工智能企业主要是以定制化的综合解决方案创造营收。在此次2020人工智能大会的“AI·智能计算引领变革“的主题论坛上,赛迪顾问高级分析师杜欣泽表示,采用定制化的综合解决方案意味着收入难以形成规模增长。然而,人工智能是高投入型产业,企业大规模的研发费用投入会导致许多AI企业处于亏损状态,造成商业化困难。与此同时,现阶段造成AI产品定制化程度高的主要原因,是由于主流的人工智能算法无法适应客户特定的长尾数据,需要用较高的成本获取和训练客户的长尾数据。
因此,杜欣泽认为,为了能够有效解决此类商业化困境,通用型平台的生态理念是目前AI产业的发展思路,可利用简单易行且价格较低的通用方案吸引长尾客户主动适应标准化的AI系统,构建大使用量覆盖成本的商业模式,有助于快速提升系统能力。
比起上一代产品,邃思2.0在通用性方面也有了大大的提升。
“人工智能的应用领域已经变得越来越广泛,作为AI的平台而言,需要持续广泛地支持不同的领域,从而能够为行业起到极大的推动作用,因此,AI平台的通用性非常重要。作为AI芯片而言,需要做到完全可编程,包括计算的完全可编程、数据传输的完全可编程,以及整个系统架构在整个应用加载下的完全应用适配。同时,在软件方面,整个软件站需要做到更大的泛化,能够支撑不同的应用,保证在不同的应用场景下依然能获得足够好的性能。”张亚林说道。
此前,多部委联合颁布了《全国一体化大数据中心协同创新体系算力枢纽实施方案》,在这其中,有三个关键词最为抢眼——绿色集约、自主创新、安全可靠。因此,对于AI芯片而言,在提升技术的同时,也需要向绿色数字化发展。此次发布的邃思2.0中,对于能耗问题也有了大大改善。数据显示,邃思2.0液冷的PUE可以降到1.15以下,大力提升整个集群的能效比。同时,它拥有每张单精度算力160T的训练卡,以及80%的集群线性度。张亚林介绍道:“燧原科技也将通过与合作伙伴的联合开发,一起构建超大规模的液冷智能数据中心,以顺应国家‘低碳算力’和‘绿色一体化智能计算’的战略方向。”
双轮驱动搭建强大的产业生态
未来,中国AI芯片企业面临着生态上的挑战。随着AI芯片的落地,需要在更大的层面进行大量的推广和采用,因此需要依托更强大的生态才可实现。
在此次前沿论坛上,赵帅认为,AI正在向各个行业渗透,从AI产业化到产业AI化具有很大的鸿沟,不同业务应用、不同应用类型对于计算设施、网络、存储、场景都有非常大的差别。而芯片、计算框架、数学库多元化,甚至应用接口也多元化,又会造成整个生态离散化发展。如何快速定位,找到最适合企业业务发展的体系架构和芯片架构是个重大挑战,需要更加完善的产业生态给予支持。
那么,中国企业如何才能建立起强大的产业生态支撑AI芯片的可持续发展呢?张亚林表示,未来,AI芯片企业应会从产品生态以及技术生态两方面,用双轮驱动的方式来搭建强大的产业生态。在产品生态方面,AI芯片企业与行业内的算法提供商,系统集成商、应用提供商等产品合作伙伴一起,提供一个全套的解决方案,服务更广阔的市场。
“从产品的角度来看,燧原能够提供板卡系统软件,但是在未来,需要与整个的服务器、云端部署算法应用集成在一起,形成一个整体的解决方案,从整个行业的解决方案角度去铺开整个行业的生态链。”张亚林说道。
从技术生态而言,可分为软件生态和硬件生态。张亚林认为:“软件生态方面在于怎么能让用户真正喜欢用你的软件,这个用户不仅要从学校教育的角度培育原创性的软件生态,还要利用我们在商业客户方面的落地,通过应用不断打磨软件生态。”硬件生态方面,张亚林认为,需要从芯片的封装、芯片制程、高速的连接等各方面全面发展,形成一个广泛的硬件技术生态。