news 2026/4/16 12:45:32

云原生研发突破,国际顶会认可!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
云原生研发突破,国际顶会认可!

近日,由天翼云与中国电信云计算研究院联合完成的论文《gShare: Efficient GPU Sharing with Aggressive Scheduling in Multi-tenant FaaS platform》,获计算机系统领域国际顶级会议ASPLOS 2026长文收录。该研究面向AI智能应用场景,提出了一套针对GPU FaaS云函数的高效资源共享与调度机制,标志着天翼云在Serverless GPU的细粒度算力供给与多租户资源优化领域实现重要突破。

ASPLOS(International Conference on Architectural Support for Programming Languages and Operating Systems)是国际计算机体系结构四大旗舰会议之一,获中国计算机学会(CCF)最高推荐级别A类认证,在全球学术界与产业界享有极高声誉。本届ASPLOS夏季评审轮次共收到840篇投稿,仅录用89篇,录取率低至10%,论文质量与创新性要求极为严苛。此次联合研究成果成功入选,彰显了中国电信天翼云在“AI+云”融合创新上的前瞻布局与自主攻坚能力。

gShare GPU动态共享技术

破解Serverless场景GPU供给难题

随着大语言模型、AI智能体等应用加速落地,算力需求正呈现“泛在化、动态化、碎片化”新特征。传统云计算GPU资源供给模型普遍存在资源分配粒度粗、弹性不足、租户成本高等痛点,难以适应中小模型推理、边缘智能等场景对高性价比、灵活弹性的GPU算力需求。

天翼云公有云事业部与基础架构事业部,携手中国电信云计算研究院,基于目前流行的Serverless函数式编程范式,共同开展了面向AI智能应用的高效GPU云函数课题研究,并基于自研evGPU技术研发出面向多租户的低成本GPU函数共享调度系统gShare。该系统以微虚拟机作为安全隔离环境与函数运行载体,通过三大核心技术创新实现GPU资源的“时空动态”高效利用

01基于vGPU的细粒度算力分配——精确匹配用户资源需求

该系统底层设计采用近乎零开销的自研虚拟化技术,实现对VM到物理GPU设备间任意粒度的算力切片供给,租户函数实例可根据自身业务实际消耗按需申请vGPU资源,彻底告别传统GPU整卡独占的粗放模式,降低资源浪费。

02基于超售的资源定价与调度策略——释放用户函数闲置算力
该系统资源创新性地采用了GPU与CPU和内存资源管理的解耦设计,通过vGPU热插拔和快速显存交换技术,允许函数到GPU切片间映射关系的运行时动态调整,同时结合deadline感知的延迟调度设计以实现资源超售。租户可根据需要选择不同共享粒度并享受相应价格折扣,从而实现闲置GPU算力的高效回收利用和成本-性能最优平衡

03跨资源池的统一调度与管理架构——支撑泛在智能业务场景

该系统可适配包括TensorFlow Serving, PyTorch, vLLM, and SGLang在内的主流AI推理框架,其设计也天然兼容跨异构资源池的统一调度与管理架构,除可部署在传统的数据中心集中式GPU资源池之外,还能够部署在分布广泛、具有零散和碎片化资源的边缘分布式算力节点,为构建中国电信“中心-边缘”协同的分层多级泛在算力供给体系提供核心技术支撑。

基于vGPU重映射的动态共享GPU云函数设计

测试结果表明,gShare相关成果可显著提升Serverless平台内部的GPU资源利用率,降低企业采购与运营成本。同时,云租户可根据实际GPU共享力度享受对应的价格折扣,真正实现“用得省、用得好”。

目前,gShare相关研究成果已在天翼云函数计算产品中实现落地部署。依托中国电信的泛在云网基础设施与息壤算力互联调度平台,该技术可进一步拓展至边缘大模型推理、云游戏等边缘计算场景,实现从中心到边缘的全场景算力灵活供给。未来,天翼云将持续深化泛在算力与智能调度等领域的探索,通过提供无处不在、弹性高效、成本可控的AI算力,推动智能算力走向普惠,赋能各行业智能化转型。

[论文信息:Yanan Yang, Zhengxiong Jiang, Meiqi Zhu, Hongqiang Xu, Yujun Wang, Liang Li, Jiansong Zhang, Jie Wu. gShare: Efficient GPU Sharing with Aggressive Scheduling in Multi-tenant FaaS platform. International Conference on Architectural Support for Programming Languages and Operating Systems (ASPLOS) 2026. Pittsburgh, USA. (Accepted)]

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/15 18:11:16

3步完成PDF转Excel:Python自动化数据提取终极指南

3步完成PDF转Excel:Python自动化数据提取终极指南 【免费下载链接】Python_pdf2Excel提取PDF内容写入Excel Python_pdf2Excel是一个高效的开源工具,专为自动化处理大量PDF文件并将其关键数据提取至Excel表格而设计。该项目通过Python脚本实现&#xff0c…

作者头像 李华
网站建设 2026/4/2 6:16:56

Coze开源入门:零基础也能快速上手的AI开发工具

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个Coze开源项目的入门教程应用,包含安装指南、基础功能介绍和简单示例项目(如天气查询机器人)。应用应提供交互式学习环境和实时反馈功能。…

作者头像 李华
网站建设 2026/4/16 13:59:00

FaceFusion自动镜头切换检测优化多角度处理

FaceFusion自动镜头切换检测优化多角度处理在如今的视频内容创作中,从直播带货到虚拟偶像演出,再到影视后期制作,人脸编辑技术正以前所未有的速度渗透进每一个视觉交互场景。而像FaceFusion这类开源换脸工具,凭借其高画质输出和灵…

作者头像 李华
网站建设 2026/4/12 18:48:43

效率对比:scrcpy与传统安卓模拟器的性能实测

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 编写一个自动化测试脚本,对比scrcpy和主流安卓模拟器(Genymotion/BlueStacks)在以下指标的表现:1) 启动时间 2) CPU/内存占用 3) 触控响应延迟 4) 视频流帧率…

作者头像 李华
网站建设 2026/4/1 23:26:45

FaceFusion支持AR实时叠加人脸特效

FaceFusion支持AR实时叠加人脸特效在短视频和直播平台激烈竞争的今天,用户对“变脸”特效的要求早已不再满足于简单的贴纸或美颜滤镜。他们想要的是戴上虚拟兔耳后能随头部自然摆动、画上赛博朋克妆容时光影依旧真实、甚至张嘴说话时虚拟胡须也会跟着颤动的效果——…

作者头像 李华
网站建设 2026/4/13 16:11:22

比手动调试快10倍:AI自动化处理数组错误的方法

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个效率对比工具,左侧显示传统调试流程(打印数组、逐步检查、查阅文档),右侧展示AI辅助流程(自动错误诊断、智能修复建议、一键应用)。针对ValueError:…

作者头像 李华