5月10日,后摩智能正式发布首款存算一体智驾芯片——鸿途?H30,最高物理算力256TOPS,典型功耗35W,成为国内率先落地存算一体大算力AI芯片的公司。
(资料图片仅供参考)
后摩智能创始人兼CEO吴强
过去二十年中,算力发展速度远超存储,“存储墙”成为加速学习时代下的一代挑战,原因是在后摩尔时代,存储带宽制约了计算系统的有效带宽,芯片算力增长步履维艰。
因此存算一体有望打破冯诺依曼架构,是后摩时代下的必然选择,鸿途?H30的发布是存算一体的重要实践。
存算一体优势显著,被誉为AI芯片的“全能战士”,具有高能耗、低成本、高算力等优势;存算一体按照计算方式分为数字计算和模拟计算,应用场景较为广泛,SRAM、RRAM有望成为云端存算一体主流介质。
AI引爆存算一体发展
2月中旬ChatGPT出现崩溃,只是算力紧张的一个缩影。随着百度、京东、腾讯等国内厂商宣布参与大模型领域的AI竞争,未来类似ChatGPT这样的大模型将越来越多。可以预见,人工智能大模型的发展是大势所趋,全球市场对于算力的需求也将出现快速的增长。
存算一体的优势是打破存储墙,消除不必要的数据搬移延迟和功耗,使用存储单元提升算力。存算一体主要AI的算力需求、并行计算、神经网络计算等,因此存算一体需求旺盛;以数据中心为例,百亿亿次(E级)的超级计算机成为各国比拼算力的关键点。
2017年,英伟达、微软、三星等提出存算一体原型;同年起,国产存算一体芯片企业开始“扎堆”入场,例如后摩智能、亿铸科技等。
高性能计算引擎
后摩智能联合创始人兼研发副总裁陈亮告诉芯榜记者,鸿途?H30以存算一体创新架构实现了六大技术突破,即大算力、全精度、低功耗、车规级、可量产、通用性。鸿途?H30基于SRAM存储介质,采用数字存算一体架构,拥有极低的访存功耗和超高的计算密度,在Int8数据精度条件下,其AI核心IPU能效比高达15Tops/W,是传统架构芯片的7倍以上。
后摩智能联合创始人兼研发副总裁陈亮
陈亮称,为了更好地实现车规级,后摩智能基于鸿途?H30自主研发了硬件增强机制和检测机制,在提升芯片可靠性的同时,进一步保障了功能安全性。
为了充分发挥存算一体带来的高计算效率,后摩智能面向智能驾驶场景打造了专用IPU(处理器架构)——天枢架构,采用多核、多硬件线程的方式扩展算力,实现了计算效率与算力灵活扩展的完美均衡,AI计算可以在核内完成端到端处理,保证通用性。
天枢架构的设计理念源自于庭院式的中国传统住宅,以大布局设计保障计算资源利用效率的同时,再进一步结合现代住宅多层/高层的设计优势,以多核/多硬件线程的方式灵活扩展算力。得益于灵活、高效的硬件架构设计,鸿途?H30实现了性能2倍提升的同时,还降低了50%功耗。
后摩智能联合创始人兼产品副总裁信晓旭对鸿途?H30的产品性能与优势向芯榜记者做了详细介绍。得益于存算一体的架构优势,鸿途?H30基于12nm工艺制程,在Int8数据精度下实现高达256TOPS的物理算力,所需功耗不超过35W,整个SoC能效比达到7.3Tops/W,具有高计算效率、低计算延时、低工艺依赖等特点。
后摩智能联合创始人兼产品副总裁信晓旭
信晓旭分析,在实际性能测试中,鸿途?H30基于Resnet50模型的Benchmark,在BatchSize等于1和8的条件下分别达到了8700帧/秒和10300帧/秒的性能。
赋能智能驾驶
当下消费电子对半导体拉动区域颓势,汽车芯片成为拉动半导体领域的中流砥柱,据了解每台新能源汽车所用到的芯片高达1400块。
为了坐上新能源的“快车”,后摩智能同步推出了基于鸿途?H30芯片打造的智能驾驶硬件平台——力驭?。有赖于鸿途?H30极高的计算效率和计算密度,力驭?平台CPU算力高达200Kdmips,AI算力高256Tops,支持多传感器输入,能够为智能驾驶提供更充沛的算力支持,进一步提升了系统的可靠性。力驭?平台功耗仅为85W,可采用更加灵活的散热方式,实现更低成本的便捷部署,有利于推动大算力智能驾驶场景的普及应用。
为了让客户拥有更好的产品使用体验,后摩智能还基于鸿途?H30芯片自主研发了一款软件开发工具链——后摩大道?,支持PyTorch、TensorFlow、ONNX等主流开源框架,编程兼容CUDA前端语法,同时支持SIMD和SIMT两种编程模型,兼顾运行效率和开发效率,以无侵入式的底层架构创新保障了通用性的同时,进一步实现了鸿途?H30得高效、易用。
信晓旭透露,鸿途?H30将于6月份开始给Alpha客户送测。同时,后摩智能的第二代产品鸿途?H50已经在全力研发中,将于2024年推出,支持客户2025年的量产车型。
后摩智能创始人兼CEO吴强表示:“2年前,后摩智能成立,我们坚定地选择以存算一体的底层架构创新,来实现AI计算效率的极致突破。存算一体架构将存储和计算功能融合,比传统架构更接近人脑的计算方式,具备远高于传统方式的计算效率。随着GPT等大模型的出现,存算一体芯片越来越受到行业关注。”
本文首发于微信公众号:芯榜。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。
关键词: