awk命令详解

基本概念

awk 是一种强大的文本处理工具，主要用于对文本文件进行模式扫描和处理。它得名于其三位创始人Alfred Aho、Peter Weinberger和Brian Kernighan的姓氏首字母。

1awk 'pattern {action}' file

其中：

awk 默认以空格或制表符分隔字段：

示例：

1awk '{print $1}' file.txt  # 打印每行的第一个字段

示例：

1awk 'NR==5{print}' file.txt  # 打印第5行

支持正则表达式和条件判断：

1awk '/error/{print}' log.txt  # 打印包含"error"的行
2awk '$3 > 100 {print $1}' data.txt  # 第三个字段大于100时打印第一个字段

awk支持基本的数学运算：

1awk '{sum += $1} END {print sum}' numbers.txt  # 计算第一列的总和

示例：

1awk 'BEGIN{FS=":"} {print $1}' /etc/passwd  # 以冒号为分隔符打印第一列

支持if-else结构：

1awk '{if ($1 > 50) print "High"; else print "Low"}' data.txt

支持for和while循环：

1awk '{for(i=1;i<=NF;i++) print $i}' file.txt  # 打印每个字段

awk支持关联数组：

1awk '{count[$1]++} END {for (item in count) print item, count[item]}' data.txt

可以定义自己的函数：

1awk 'function myfunc(x) {return x*2} {print myfunc($1)}' numbers.txt

1awk '{ip[$1]++} END {for (i in ip) print i, ip[i]}' access.log

1awk -F, '{sum += $5; count++} END {print sum/count}' data.csv

1awk '/202[0-9]-[0-1][0-9]-[0-3][0-9]/ {print}' logfile.txt

awk功能强大且灵活，可以处理各种文本处理任务，是Linux/Unix环境下不可或缺的工具。