国产大模型推理引擎“赤兔”开源

内容摘要本报讯(记者赵广立)3月14日,清华大学高性能计算研究所教授翟季冬团队与清华系科创企业清程极智联合宣布,开源大模型推理引擎“赤兔Chitu”。据介绍,该引擎首次实现在非英伟达Hopper架构图形处理器(GPU)及各类国产芯片上原生运行FP8

本报讯(记者赵广立)3月14日,清华大学高性能计算研究所教授翟季冬团队与清华系科创企业清程极智联合宣布,开源大模型推理引擎“赤兔Chitu”。据介绍,该引擎首次实现在非英伟达Hopper架构图形处理器(GPU)及各类国产芯片上原生运行FP8精度模型,为国产人工智能(AI)芯片的广泛应用和生态建设扫除了障碍。

当前,FP8精度模型长期依赖英伟达H系列高端GPU,这使得国内企业在部署大模型时受到AI芯片的限制。为打破这一困境,清华大学与清程极智联合开源的赤兔推理引擎通过底层技术革新,首次实现了非H卡设备对原生FP8精度模型的高效部署,摆脱对特定硬件的依赖,极大降低了企业部署AI模型的门槛和成本。

翟季冬介绍说,赤兔凝结了团队多年并行计算与编译优化技术的积累,目标是弥合先进模型与多样化硬件之间的差距,让国产算力真正“跑起来”。

“赤兔的定位是成为连接多元算力与大模型应用的桥梁。”清程极智CEO汤雄超表示,“我们的引擎不仅支持英伟达全系列GPU,还针对国产芯片深度优化,未来将陆续开源适配版本。”

据悉,在首期开源版本中,赤兔引擎部署DeepSeek-R1-671B满血版时相比部分国外开源框架,在GPU使用量减少50%的情况下推理速度仍有3.15倍提速。

另据了解,清程极智还推出了基于赤兔的“推理一体机”,提供开箱即用部署方案及专业运维服务,进一步简化企业AI落地流程。

 
举报 收藏 打赏 评论 0
今日推荐
浙ICP备2021030705号-9

免责声明

本网站(以下简称“本站”)提供的内容来源于互联网收集或转载,仅供用户参考,不代表本站立场。本站不对内容的准确性、真实性或合法性承担责任。我们致力于保护知识产权,尊重所有合法权益,但由于互联网内容的开放性,本站无法核实所有资料,请用户自行判断其可靠性。

如您认为本站内容侵犯您的合法权益,请通过电子邮件与我们联系:675867094@qq.com。请提供相关证明材料,以便核实处理。收到投诉后,我们将尽快审查并在必要时采取适当措施(包括但不限于删除侵权内容)。本站内容均为互联网整理汇编,观点仅供参考,本站不承担任何责任。请谨慎决策,如发现涉嫌侵权或违法内容,请及时联系我们,核实后本站将立即处理。感谢您的理解与配合。

合作联系方式

如有合作或其他相关事宜,欢迎通过以下方式与我们联系: