news 2026/4/16 10:19:13

IO重定向

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
IO重定向

第一部分:重定向的本质

1. 核心规则:最小分配原则

Linux 在open一个文件时,有一个铁律:

给新文件分配的 fd,永远是当前files_struct数组中 最小的、未被占用的 下标。

2. 手动实现重定向 ( The "Hack" Way )

利用这个规则,我们可以玩一个魔术:

  1. 我们知道printf默认是往stdout(也就是fd 1) 打印数据。
  2. 如果我们先close(1),把 1 号下标空出来。
  3. 然后立刻open("log.txt", ...)
  4. 根据“最小分配原则”,系统会把1 号下标分配给log.txt
  5. 此时,printf依然傻傻地往 fd 1 写数据,但 fd 1 已经不再指向显示器,而是指向了log.txt

代码验证

#include <stdio.h> #include <unistd.h> #include <fcntl.h> int main() { // 1. 关闭标准输出 (显示器) close(1); // 2. 打开新文件 // 系统发现 1 号坑是空的,于是把 fd 1 给到了 log.txt int fd = open("log.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666); // 3. 正常打印 // printf 底层是 write(1, ...),它不知道 1 号变了 printf("fd: %d\n", fd); printf("hello redirection\n"); // 4. 刷新缓冲区 (重要!如果是文件,默认是全缓冲,不刷新可能写不进去) fflush(stdout); close(fd); return 0; }

现象:屏幕上什么都没有,但cat log.txt会发现内容都在里面。这就是>的雏形。


第二部分:dup2系统调用

手动closeopen这种方法有风险(比如多线程环境下可能有竞争,或者代码写起来麻烦)。Linux 提供了一个专门的系统调用来做这件事:dup2

1. 函数原型
#include <unistd.h> int dup2(int oldfd, int newfd);
2. 核心逻辑 (面试必问)

很多人容易搞混参数顺序。记忆口诀:newfd成为oldfd的副本

  • 动作
    1. 如果newfd已经被打开了,先把它close掉。
    2. 把内核数组中oldfd指向的那个file结构体指针,复制newfd的下标位置。
    3. 结果newfdoldfd现在同时指向同一个文件(原来oldfd打开的那个文件)。
    4. 通常我们会让oldfd是刚打开的文件(如 fd 3),newfd是 1。这样 1 就指向了 3 指向的文件。
3. 代码实战
#include <stdio.h> #include <unistd.h> #include <fcntl.h> int main() { int fd = open("log.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666); if (fd < 0) { perror("open"); return 1; } // 【核心】把 fd(3) 的内容复制给 1 // 此时 1 号下标也指向了 log.txt dup2(fd, 1); printf("This will go to file!\n"); fprintf(stdout, "This too!\n"); // 现在 1 和 3 都指向 log.txt,关闭 3 不影响 1 close(fd); return 0; }

第三部分:标准输出 (1) vs 标准错误 (2)

我们在 Linux 命令中常看到> log.txt 2>&1,这是什么意思?

  • stdout (1):正常的打印信息。
  • stderr (2):专门用于打印错误信息。
  • 区分意义
    • 当我们执行./program > log.txt时,Shell 只把fd 1重定向到了文件。
    • 此时fd 2依然指向显示器。
    • 好处:程序正常跑的日志写文件里,程序报错的信息直接打在屏幕上让你看到。

如何把错误也写进文件?./program > log.txt 2>&1

  • 先把 1 重定向到文件。
  • 再把 2 重定向到 1(也就是 2 也指向文件)。

第四阶段: 缓冲区 (Buffer) 的坑

1. 现象:Fork 导致的“双倍快乐”

看下面这段诡异的代码:

#include <stdio.h> #include <string.h> #include <unistd.h> int main() { // C库函数 const char *s1 = "hello printf\n"; printf("%s", s1); // 系统调用 const char *s2 = "hello write\n"; write(1, s2, strlen(s2)); // 创建子进程 fork(); return 0; }

实验:

  1. 直接运行(./test):屏幕上打印两行,非常正常。
  2. 重定向运行(./test > log.txt):打开log.txt,你会发现:
  • hello write出现1 次
  • hello printf竟然出现了2 次
2. 原理揭秘:缓冲策略的改变

这跟fork无关,跟C 语言标准库 (FILE) 的缓冲策略有关。

  • C 库缓冲区策略
  • 无缓冲:立刻刷新。
  • 行缓冲 (Line Buffered):遇到\n才刷新。(显示器默认是行缓冲)。
  • 全缓冲 (Full Buffered):缓冲区填满才刷新。(普通文件默认是全缓冲)。

分析案发现场

  1. 直接运行时(向显示器写):
  • printf遇到\n,触发行缓冲,立马把数据刷给内核(write)。
    • fork时,C 库缓冲区是空的。父子进程各自退出,没啥可刷的。
    • write是系统调用,直接写内核。

重定向时(向文件写):

  • printf虽然有\n,但因为目标变成了普通文件,策略变为全缓冲。数据暂存在 C 库的用户级缓冲区里,没有刷给内核。
    • 退出时
    • 写时拷贝:子进程复制了父进程的内存,包括那个没刷新的 C 库缓冲区
    • Fork 发生:父进程创建子进程。
    • write直接写内核,不受影响(先写进去了)。
  • 父进程退出,刷新自己的缓冲区 -> 写入一次 "hello printf"。
    • 子进程退出,刷新自己的缓冲区 ->写入一次 "hello printf"。

结论

  • 库函数(printf,fwrite)自带用户级缓冲区,操作文件时是全缓冲。
  • 系统调用(write)没有用户级缓冲区。
  • fork会拷贝用户级缓冲区的数据。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 10:16:07

别再怕数学了:从《现代数学之旅》第10版,看数学如何成为理解世界的“底层操作系统”

别再怕数学了&#xff1a;从《现代数学之旅》第10版&#xff0c;看数学如何成为理解世界的“底层操作系统” 数学不是为了考试存在的&#xff0c;它是世界运行的底层逻辑。 在程序员、工程师、数据分析师乃至产品经理的职业生涯中&#xff0c;我们或多或少都会遇到一个尴尬的问…

作者头像 李华
网站建设 2026/4/11 2:05:37

如何做到数据防泄密?国内防泄密软件排行榜推荐

在数字化时代&#xff0c;数据泄密已成为企业面临的重大风险。无论是敏感文档、商业机密还是核心系统数据&#xff0c;一旦泄露都可能对企业造成巨大损失。下面为您盘点2025年最新国内防泄密软件排行榜。一、互成软件作为终端安全一体化解决方案的代表&#xff0c;互成软件以 &…

作者头像 李华
网站建设 2026/4/10 18:14:19

前端写好了,后端也联调完了,为什么上线还是这么难?

前端写好了&#xff0c;部署却要一下午&#xff0c;到底是谁的问题&#xff1f;我名义上是个全栈开发者&#xff0c;但最近感觉自己更像个“全栈救火队员”。一个前端组件&#xff0c;我可能半小时就写完了。但为了把它上线&#xff0c;我可能需要花一下午的时间&#xff0c;去…

作者头像 李华
网站建设 2026/4/8 19:33:04

jQuery EasyUI 树形菜单 - 创建复杂树形网格

jQuery EasyUI 树形网格&#xff08;TreeGrid&#xff09; - 创建复杂树形网格 jQuery EasyUI 的 TreeGrid 支持许多高级功能&#xff0c;使其成为显示复杂层级数据的强大工具。复杂 TreeGrid 通常包括以下特性&#xff1a; 多列显示复杂数据&#xff08;如任务名称、人员、日…

作者头像 李华
网站建设 2026/4/5 15:44:50

智慧农业ELK落地方案:数据驱动精准农业

对于智慧农业领域的ELK&#xff08;Elasticsearch, Logstash, Kibana&#xff09;落地方案&#xff0c;其核心在于构建一个能处理海量、多源、地理空间数据的监测与分析平台。根据研究&#xff0c;ELK不仅可用于日志分析&#xff0c;也特别适合处理物联网传感器数据&#xff0c…

作者头像 李华