news 2026/4/15 23:28:56

Dataflow优化(一)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Dataflow优化(一)

一、函数无优化

void top(a,b,c,d){
func_a(a,b,i1);
func_b(c,i1,i2);
func_c(i2,d);
}

上述代码在没有任何优化的时候,top的三个子函数是串行顺序的执行的。

二、对函数进行pipeline优化

void top(a,b,c,d){
#pragram pipeline ii =1
func_a(a,b,i1);
func_b(c,i1,i2);
func_c(i2,d);
}

上述代码对函数使用了pipeline优化后

func-a,func-b,func-c这三个函数函数顺序执行的,但是后和完全没有优化有差异,就是第二轮的func-a不需要等待func-c执行了才执行,而是,在func-a第一轮完成后,立马就开始第二轮func-a了。

三、对函数进行dataflow优化

void top(a,b,c,d){
#pragram dataflow
func_a(a,b,i1);
func_b(c,i1,i2);
func_c(i2,d);
}

上述代代码进行了dataflow优化

进行了dataflow优化后,可以看出func-a,func-b,func-c不在串行执行了,而是并行的,只要func-a提供了有效数据给到func-b了,func-b就开始执行了,func-c只要收到了func-b的输出有效数据,就开始执行了。

四、推荐看博客

https://blog.csdn.net/kanhao100/article/details/146267921?spm=1001.2101.3001.6650.5&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogOpenSearchComplete%7ERate-5-146267921-blog-156366068.235%5Ev43%5Epc_blog_bottom_relevance_base4&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogOpenSearchComplete%7ERate-5-146267921-blog-156366068.235%5Ev43%5Epc_blog_bottom_relevance_base4&utm_relevant_index=5

这篇博客的dataflow优化写的不错,可以看看。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 12:22:19

SSH远程访问PyTorch-CUDA-v2.6镜像,实现高效模型训练

SSH远程访问PyTorch-CUDA-v2.6镜像,实现高效模型训练 在AI研发日益工程化的今天,一个常见的困境是:研究人员手握前沿算法,却卡在“环境配不起来”或“本地显卡太弱”的瓶颈上。尤其当团队协作开发时,“在我机器上能跑”…

作者头像 李华
网站建设 2026/4/16 13:04:11

GitHub项目复现困难?用PyTorch-CUDA镜像统一实验环境

GitHub项目复现困难?用PyTorch-CUDA镜像统一实验环境 在深度学习领域,你是否经历过这样的场景:从GitHub克隆了一个热门项目,满怀期待地运行python train.py,结果却卡在了第一行——“ImportError: libcudart.so.11.0: …

作者头像 李华
网站建设 2026/4/11 2:17:33

Linux线程错误调试指南:从原理到实践

Linux线程错误调试指南:从原理到实践1. 线程调试概述2. 基础调试工具2.1 GDB调试器2.2 Valgrind工具集2.3 strace和ltrace3. 高级调试技术3.1 死锁检测3.2 竞态条件检测4. 实战案例分析4.1 案例一:资源泄漏4.2 案例二:条件变量误用5. 性能分析…

作者头像 李华
网站建设 2026/4/15 5:56:07

清华镜像源加速PyTorch安装,配合CUDA环境更流畅

清华镜像源加速PyTorch安装,配合CUDA环境更流畅 在深度学习项目启动的前48小时里,你是否曾经历过这样的场景:凌晨两点,服务器终端卡在 pip install torch 的第37%进度条上,反复超时、重试、清理缓存?又或者…

作者头像 李华
网站建设 2026/4/16 2:04:10

数据科学与DevOps:构建自动化数据处理流水线

数据科学与DevOps:构建自动化数据处理流水线 标题选项 《数据科学DevOps:手把手教你构建自动化数据处理流水线》《从手动到自动:用DevOps思维优化数据科学工作流》《构建可复用的自动化数据流水线:数据科学与DevOps的碰撞》《自…

作者头像 李华