C语言union使用技巧：内存复用的高效玩法-编程阁

在C语言的自定义类型家族中，struct（结构体）早已是大家耳熟能详的“老熟人”，而它的“孪生兄弟”union（共用体/联合体）却常常被忽略。

很多初学者觉得union“无用且危险”，实则是没掌握它的核心逻辑——内存复用。在内存资源紧张的场景（如嵌入式、单片机开发），union能凭借“同一块内存存储不同类型数据”的特性，帮你写出更高效、更简洁的代码。

今天就带大家吃透union的使用技巧，从基础原理到实战场景，再到避坑指南，一篇搞定！

一、先搞懂：union的核心本质

union的核心规则只有两条，记住这两条，就能避开80%的坑：

1.所有成员共享同一块内存空间，起始地址完全相同；

2.union的大小 = 最大成员的大小（需满足内存对齐规则）。

举个简单例子，对比struct和union的内存差异，一看就懂：

#include <stdio.h> // 结构体：成员独立占内存 struct S { char c; // 1字节 int i; // 4字节 }; // 共用体：成员共享内存 union U { char c; // 1字节 int i; // 4字节 }; int main() { printf("struct S大小：%zd\n", sizeof(struct S)); // 输出8（含3字节对齐填充） printf("union U大小：%zd\n", sizeof(union U)); // 输出4（取最大成员int的大小） return 0; }

这里要注意：union的大小不仅要看最大成员，还要满足内存对齐。比如若成员是char[5]（5字节）和int（4字节，对齐数4），union大小会是8字节（5不足4的2倍，补充3字节填充）。

二、3个核心使用技巧，解决实际问题

union的价值不在于“存储多个数据”，而在于“灵活复用内存”。以下3个场景是它的高频用法，直接套用即可。

技巧1：内存优化——互斥数据的“空间复用”

当多个数据不同时使用（互斥关系）时，用union替代struct能大幅节省内存。这在嵌入式、单片机等内存受限场景中尤为重要。

比如传感器数据存储：同一时刻，传感器要么输出温度（int类型），要么输出电压（float类型），二者不会同时有效。

反例（浪费内存）：用struct存储，无论哪种数据有效，都会占用int+float=8字节（32位系统）；

正例（优化内存）：用union存储，仅占用4字节（最大成员大小）：

#include <stdio.h> // 传感器数据：温度和电压互斥 union SensorData { int temp; // 温度（℃） float voltage;// 电压（V） }; int main() { union SensorData data; // 读取温度时使用temp成员 data.temp = 25; printf("当前温度：%d℃\n", data.temp); // 输出：25℃ // 读取电压时复用同一块内存 data.voltage = 3.3f; printf("当前电压：%.1fV\n", data.voltage); // 输出：3.3V return 0; }

核心逻辑：用时间上的“先后使用”，替代空间上的“同时占用”，实现内存高效利用。

技巧2：类型双关——不拷贝实现数据格式转换

利用“成员共享内存”的特性，union能实现无内存拷贝的类型转换（也叫“类型双关”），比如将int的二进制数据直接解析为float，或拆分int的字节（常用于数据解析、字节序判断）。

场景1：拆分int的4个字节（如网络协议解析中，将4字节整数拆分为单字节传输）：

#include <stdio.h> // 拆分int为4个char字节 union Int2Bytes { int num; char bytes[4]; // 对应int的4个字节（小端/大端影响顺序） }; int main() { union Int2Bytes conv; conv.num = 0x12345678; // 16进制整数 // 输出每个字节的值（验证系统字节序） printf("字节0：%x\n", conv.bytes[0]); printf("字节1：%x\n", conv.bytes[1]); printf("字节2：%x\n", conv.bytes[2]); printf("字节3：%x\n", conv.bytes[3]); // 小端系统输出：78 56 34 12（低地址存低位） // 大端系统输出：12 34 56 78（低地址存高位） return 0; }

场景2：int与float的二进制格式互转（无需强制类型转换，直接复用内存）：

#include <stdio.h> union TypePun { int i; float f; }; int main() { union TypePun pun; pun.i = 0x41424344; // 16进制值，对应float的特定二进制格式 printf("float值：%f\n", pun.f); // 输出：6.928346e-34（具体值由IEEE754标准决定） return 0; }

注意：这种转换依赖数据的二进制存储规则（如IEEE754浮点数标准），跨平台需谨慎，但在同一架构下是高效且安全的。

技巧3：嵌套结构体——实现“多类型数据”的灵活封装

单独使用union时，无法确定当前哪个成员有效，容易出错。实际开发中，常用“struct嵌套union”的模式，用一个“类型标记”（枚举/整数）标识当前有效的union成员，实现安全的多类型数据管理。

场景：处理不同类型的消息（文本/图片），用类型标记区分消息类型：

#include <stdio.h> #include <string.h> // 消息类型标记（枚举更清晰） typedef enum { TEXT_MSG, // 文本消息 IMG_MSG // 图片消息 } MsgType; // 消息结构体：嵌套union实现多类型复用 typedef struct { MsgType type; // 类型标记：当前有效成员 union { // 文本消息：长度+内容 struct { int len; char content[100]; } text; // 图片消息：宽+高+像素数据 struct { int width; int height; char pixels[1024]; } img; } data; // 共用体：存储不同类型的消息内容 } Message; // 处理消息的函数 void process_msg(Message* msg) { switch (msg->type) { case TEXT_MSG: printf("文本消息（长度：%d）：%s\n", msg->data.text.len, msg->data.text.content); break; case IMG_MSG: printf("图片消息（%d×%d像素）\n", msg->data.img.width, msg->data.img.height); break; default: printf("未知消息类型\n"); } } int main() { // 1. 处理文本消息 Message text_msg; text_msg.type = TEXT_MSG; text_msg.data.text.len = 11; strcpy(text_msg.data.text.content, "Hello Union!"); process_msg(&text_msg); // 2. 处理图片消息 Message img_msg; img_msg.type = IMG_MSG; img_msg.data.img.width = 640; img_msg.data.img.height = 480; process_msg(&img_msg); return 0; }

这种模式是工业级开发的常用写法，既保证了内存复用，又通过类型标记避免了“访问无效成员”的错误，安全性和可读性都大幅提升。

三、避坑指南：使用union必须注意的4点

union虽好用，但“内存共享”的特性也暗藏陷阱，这4个注意事项一定要记牢：

1. 避免访问被覆盖的成员

给union的一个成员赋值后，其他成员的值会被覆盖（可能变成随机无效值），此时访问被覆盖的成员会导致未定义行为。

反例：

union U { int i; float f; }; union U u; u.i = 100; u.f = 3.14f; printf("%d\n", u.i); // 错误：i已被f覆盖，值为无效随机数

2. 初始化只能针对第一个成员

C语言标准规定，union只能初始化第一个成员；若要初始化其他成员，需用C99及以上的“指定初始化器”（.成员名=值）。

union U { int i; float f; }; union U u1 = {10}; // 正确：初始化第一个成员i union U u2 = {.f = 3.14f};// 正确：C99指定初始化f（推荐） union U u3 = {10, 3.14f}; // 错误：不能同时初始化多个成员

3. 注意内存对齐的影响

union的大小不仅取决于最大成员，还需满足内存对齐规则。若忽略对齐，可能导致内存浪费或跨平台兼容性问题。

如需强制取消对齐（仅特殊场景，如硬件寄存器访问），可使用编译器指令（如GCC的#pragma pack(1)）：

#pragma pack(push, 1) // 强制对齐1字节 union PackedUnion { char c[3]; // 3字节 int i; // 4字节 }; #pragma pack(pop) // 恢复默认对齐 printf("大小：%zd\n", sizeof(union PackedUnion)); // 输出4（而非7）

4. 不要嵌套动态内存

避免在union中嵌套指针（尤其是指向动态内存的指针），因为成员覆盖时，指针可能被破坏，导致内存泄漏或野指针错误。若必须使用，需严格管理指针的生命周期。

四、总结：union的适用场景与核心价值

最后用一张表总结union与struct的核心差异，帮你快速判断使用场景：

特性	struct（结构体）	union（共用体）
内存分配	成员独立，总大小=成员和+填充	成员共享，总大小=最大成员（含对齐）
数据共存	所有成员同时有效	同一时刻仅一个成员有效
核心用途	封装对象属性（如学生信息）	内存优化、类型转换、协议解析