news 2026/4/16 16:17:28

AMD Nitro-E:304M轻量AI绘图,4步39.3张/秒极速体验

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AMD Nitro-E:304M轻量AI绘图,4步39.3张/秒极速体验

AMD Nitro-E:304M轻量AI绘图,4步39.3张/秒极速体验

【免费下载链接】Nitro-E项目地址: https://ai.gitcode.com/hf_mirrors/amd/Nitro-E

AMD近日发布了一款突破性的轻量级文本到图像生成模型Nitro-E,以仅304M的参数量实现了高效AI绘图能力,尤其在推理速度上展现出惊人表现——其蒸馏版本在单张AMD Instinct MI300X GPU上可达到每秒39.3张图像的生成速度,且仅需4步推理即可完成,为AI图像生成领域带来了效率革命。

当前AI图像生成领域正面临着模型规模与性能之间的平衡难题。主流模型如Stable Diffusion系列参数量普遍在数十亿级别,不仅对硬件资源要求高,且生成速度难以满足实时应用需求。行业正迫切寻求轻量化、高性能的解决方案,以推动AI绘图技术在边缘设备、实时交互等场景的普及应用。在此背景下,AMD Nitro-E的推出恰逢其时,以"轻量高效"为核心定位,重新定义了轻量级文本到图像模型的性能标准。

Nitro-E的核心优势体现在三大维度:极致轻量化架构、突破性推理速度与创新技术设计。该模型采用全新的Efficient Multimodal Diffusion Transformer(E-MMDiT)架构,通过多重创新技术实现了效率突破。其采用高度压缩的视觉tokenizer和多路径压缩模块,显著减少了计算令牌数量;创新的Alternating Subregion Attention(ASA)技术通过子区域内注意力计算降低开销;而AdaLN-affine模块则实现了transformer块中调制参数的高效计算。这些技术共同造就了仅304M参数的轻量化模型体量。

在性能表现上,Nitro-E创造了新的效率纪录:基础版本在单张MI300X GPU上实现18.8张/秒的吞吐量(512px图像,批处理大小32),而蒸馏版本更是将这一数字提升至39.3张/秒,且将推理步骤从标准的20步大幅缩减至仅需4步。更值得关注的是其训练效率,Nitro-E从 scratch 训练仅需1.5天,在配备8张AMD Instinct MI300X GPU的单节点上即可完成,显著降低了模型开发成本。该模型系列包含三个版本:基础版Nitro-E-512px(20步推理)、蒸馏版Nitro-E-512px-dist(4步推理)以及采用Group Relative Policy Optimization (GRPO)策略优化的Nitro-E-512px-GRPO版本,满足不同场景需求。

Nitro-E的推出将对AI图像生成领域产生多重影响。首先,其极致的推理效率为实时图像生成应用铺平道路,有望推动AI绘图在直播、游戏、AR/VR等交互式场景的深度集成。其次,304M的轻量化模型为边缘设备部署提供了可能,使智能手机、嵌入式系统等终端设备也能运行高质量AI绘图模型。对于企业用户而言,Nitro-E极低的训练和推理成本将显著降低AI图像生成技术的采用门槛,尤其利好内容创作、设计、广告等行业的中小企业。

从技术趋势看,Nitro-E印证了AI生成模型"轻量化、高效率"的发展方向。AMD通过创新架构设计而非单纯增加参数量来提升性能的思路,可能成为未来模型优化的主流路径。该模型采用MIT开源许可,并已开放源代码和技术博客,这将加速高效扩散模型技术的研究与应用。随着硬件与软件协同优化的深入,我们有理由期待轻量级AI生成模型在保持质量的同时,实现更惊人的速度突破,推动AI创意工具向实时化、普及化方向加速发展。

【免费下载链接】Nitro-E项目地址: https://ai.gitcode.com/hf_mirrors/amd/Nitro-E

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 14:22:19

Fansly批量下载工具完整使用指南:轻松管理离线内容

Fansly批量下载工具完整使用指南:轻松管理离线内容 【免费下载链接】fansly-downloader Easy to use fansly.com content downloading tool. Written in python, but ships as a standalone Executable App for Windows too. Enjoy your Fansly content offline any…

作者头像 李华
网站建设 2026/4/16 15:47:34

BooruDatasetTagManager终极使用指南:10倍提升AI训练效率

BooruDatasetTagManager终极使用指南:10倍提升AI训练效率 【免费下载链接】BooruDatasetTagManager 项目地址: https://gitcode.com/gh_mirrors/bo/BooruDatasetTagManager 在AI模型训练和内容创作的浪潮中,高质量的数据集标签管理已成为决定项目…

作者头像 李华
网站建设 2026/4/16 14:27:01

BetterJoy 3步速通:Switch控制器PC连接终极方案

BetterJoy 3步速通:Switch控制器PC连接终极方案 【免费下载链接】BetterJoy Allows the Nintendo Switch Pro Controller, Joycons and SNES controller to be used with CEMU, Citra, Dolphin, Yuzu and as generic XInput 项目地址: https://gitcode.com/gh_mir…

作者头像 李华
网站建设 2026/4/15 15:35:42

如何免费微调IBM 32B Granite-4.0大模型?

导语:借助Unsloth平台提供的免费工具和资源,普通开发者和企业现在也能高效微调IBM最新发布的32B参数大模型Granite-4.0-H-Small,无需昂贵硬件即可解锁企业级AI能力。 【免费下载链接】granite-4.0-h-small 项目地址: https://ai.gitcode.c…

作者头像 李华
网站建设 2026/4/16 13:35:36

ReTerraForged终极教程:轻松打造专业级Minecraft地形世界

ReTerraForged终极教程:轻松打造专业级Minecraft地形世界 【免费下载链接】ReTerraForged a 1.19 port of https://github.com/TerraForged/TerraForged 项目地址: https://gitcode.com/gh_mirrors/re/ReTerraForged 想要让你的Minecraft世界告别单调乏味的地…

作者头像 李华
网站建设 2026/4/16 15:07:17

Windows优化工具深度指南:系统性能提升与视觉体验全面解析

Windows优化工具深度指南:系统性能提升与视觉体验全面解析 【免费下载链接】mactype Better font rendering for Windows. 项目地址: https://gitcode.com/gh_mirrors/ma/mactype 为何系统响应迟缓?怎样解决字体模糊问题?本指南将带您…

作者头像 李华