news 2026/6/9 22:03:18

谷歌LiteRT框架新增高级硬件加速能力

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
谷歌LiteRT框架新增高级硬件加速能力

谷歌从TensorFlow Lite演进而来的现代化端侧推理框架LiteRT,引入了基于下一代GPU引擎ML Drift的高级加速能力。

这一里程碑在1月28日宣布,巩固了LiteRT作为通用端侧框架的地位,并代表着相对前身TFLite的重大飞跃。谷歌表示,LiteRT提供比TFLite快1.4倍的GPU性能,为边缘平台上的GPU和NPU加速提供统一工作流程,支持生成式AI模型的卓越跨平台部署,并通过无缝模型转换提供对PyTorch和JAX的一流支持。该公司在去年5月预览了LiteRT的新加速能力。

谷歌表示,可在GitHub上找到的LiteRT为数十亿台设备上每天使用的应用程序提供支持,提供低延迟和高隐私保护。通过新的ML Drift GPU引擎,LiteRT支持OpenCL、OpenGL、Metal和WebGPU,使开发者能够在移动设备、桌面和网页端部署模型。在Android平台上,LiteRT会自动优先选择可用资源以获得峰值性能,同时回退到OpenGL以实现更广泛的设备覆盖。此外,根据谷歌的说法,LiteRT提供了统一简化的NPU部署工作流程,抽象化了底层的供应商特定SDK,并处理了众多SoC(片上系统)变体之间的碎片化问题。

LiteRT的文档可在ai.google.dev上找到。

Q&A

Q1:LiteRT相比TensorFlow Lite有哪些性能提升?

A:LiteRT相比前身TensorFlow Lite实现了显著的性能提升,GPU性能提升了1.4倍。同时,它提供了统一的GPU和NPU加速工作流程,支持更好的跨平台部署能力,特别是对生成式AI模型的支持,并且通过无缝转换提供了对PyTorch和JAX框架的一流支持。

Q2:LiteRT的ML Drift GPU引擎支持哪些平台?

A:LiteRT的ML Drift GPU引擎支持多种主流图形API,包括OpenCL、OpenGL、Metal和WebGPU,使开发者能够将模型部署到移动设备、桌面和网页端等不同平台。在Android平台上,系统会自动优先选择可用资源以获得最佳性能,同时也能回退到OpenGL以支持更广泛的设备。

Q3:LiteRT如何解决不同硬件芯片的兼容性问题?

A:LiteRT提供了统一简化的NPU部署工作流程,将底层供应商特定的SDK进行了抽象化处理,有效解决了众多SoC(片上系统)变体之间的碎片化问题。这意味着开发者不需要针对不同芯片厂商编写特定代码,就能实现跨硬件平台的模型部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 17:58:22

科技成果转化的破局之道——构建区域创新生态的新引擎

当前,科技创新已成为推动经济社会高质量发展的核心驱动力。然而,在科技成果转化过程中,诸多瓶颈问题仍然存在,如供需信息不对称、转化渠道不畅、专业化服务能力不足等,这些问题严重制约了科技成果向现实生产力的转化效…

作者头像 李华
网站建设 2026/6/10 1:05:07

Thinkphp和Laravel框架的毕业设计论文选题管理系统 质量分析系统28ro95f4

目录 选题背景与意义系统功能概述技术架构分析质量评估指标创新点与优势应用价值 开发技术源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式! 选题背景与意义 随着高校教育信息化的发展,毕业设计论文选题管理系统的需求日益增…

作者头像 李华
网站建设 2026/5/3 3:09:35

基于深度学习的酒店客服聊天机器人系统[python]-计算机毕业设计源码+LW文档

摘要:随着酒店行业的竞争加剧和客户对服务质量要求的提高,智能客服聊天机器人成为提升酒店服务效率和质量的重要手段。本文提出了一种基于深度学习的酒店客服聊天机器人系统。阐述了深度学习技术在自然语言处理中的应用原理,分析了酒店客服业…

作者头像 李华
网站建设 2026/6/10 13:13:28

Mac照片传输到Android

很多人都想把Mac电脑上的精美照片传输到Android手机上,但真正知道如何将照片从Mac传输到Android人却不多。通常来说,有很多方法可以轻松实现,例如使用云存储服务、 Android助手等等。如果您也为此困扰,那么这篇文章将帮助您成功地…

作者头像 李华
网站建设 2026/6/9 22:12:15

大模型推理不确定性的根因和解决方法

根因: 不确定性是浮点运算导致的 浮点运算中顺序不同,计算结果会有微小差异,即 a + b ≠ b + a 推理过程由于需要加速运算,导致计算顺序不是固定的 解决方法: api调用层面:设置确定性相关的参数 服务端层面:控制底层的模型部署 https://zhuanlan.zhihu.com/p/196119262…

作者头像 李华
网站建设 2026/5/25 14:19:51

基于stm32的数控恒流源设计

基于STM32的数控恒流源设计 第一章 绪论 传统恒流源多采用模拟电路搭建,存在输出精度低、调节范围窄、无法数字化控制与参数读取、适配场景有限等问题,难以满足电子设备测试、传感器标定、实验室研发等场景下对精准、可编程恒流输出的需求。STM32单片机…

作者头像 李华