高级 gawk 编程指南
1. 重新认识 gawk
gawk 是一种功能强大的编程语言,可用于处理原始数据文件并生成格式化报告。它提供了丰富的功能,让你能够编写高级程序来处理各种数据格式化任务。如果你从其他编程语言转向 shell 脚本编程,gawk 会让你感到熟悉和舒适。
2. 使用变量
在任何编程语言中,使用变量存储和检索值都是一项重要功能。gawk 支持两种类型的变量:内置变量和用户自定义变量。
2.1 内置变量
gawk 使用内置变量来引用程序数据中的特定特征。下面介绍几种常见的内置变量及其使用方法。
- 字段和记录分隔符变量
- 数据字段变量:可以使用美元符号和数据字段在记录中的数字位置来引用数据记录中的各个数据字段。例如,
$1引用记录中的第一个数据字段,$2引用第二个数据字段,依此类推。 - 默认情况下,字段分隔符是空格或制表符。可以通过
-F命令行参数或FS内置变量来更改字段分隔符。 - 表 1 列出了控制 gawk 处理输入和输出数据中字段和记录的内置变量。
- 数据字段变量:可以使用美元符号和数据字段在记录中的数字位置来引用数据记录中的各个数据字段。例如,
| 变量 | 描述 |
|---|---|
| FIELDWIDTHS |