一.grep命令常用参数
(1)-A NUM
#grep -A 1 aa test.txt
说明:从test.txt中搜寻有aa样式的行,并显示该行的后1行
(2)-B NUM
#grep -B 1 aa test.txt
说明:从test.txt中搜寻有aa样式的行,并显示该行的前1行
(3) -C NUM
#grep -C 2 aa test.txt
说明:列出file中除包含panda样式的行外并列出其上下2行
(4) -a或--test
#grep -a aa *.tar.gz
说明:如果不加-a,找到后,一般会显示“匹配到二进制文件 tp_smapi-0.40.tgz”,找不到
不显示任何内容。加-a后,可将二进位档案视为文字档案搜寻,找到后,可以显示乱码等。
(5)-b, --byte-offset
#grep -b aa test.txt
说明:列出样式查找到的位置到文件开始有多少个字节(也可以认为是偏移)
(6)--binary-files=TYPE
说明: 此参数TYPE预设为binary(二进位),若以普通方式搜寻,只有2种结果:
*若有符合的地方:显示Binary file 二进位档名 matches
*若没有符合的地方:什麽都没有显示。
*若TYPE为without-match,遇到此参数,grep会认为此二进位档案没有
包含任何搜寻样式,与-I 参数相同。
*若TPYE为text, grep会将此二进位档视为text档案,与-a 参数相同。
注意: --binary-files=text 若输出为终端机,可能会产生一些不必要的输出
(7) -c 或--count
#grep -c aa test.txt
说明:显示匹配到的总行数
(8)-d ACTION, --directories=ACTION
grep -d recurse aa *
说明:将递归查找包含aa的文件
若输入的档案是一个资料夹,使用ACTION去处理这个资料夹。ACTION可以为以下几种值
*预设ACTION是read(读取),也就是说此资料夹会被视为一般的档案;
*若ACTION是skip(略过),资料夹会被grep略过:
*若ACTION是recurse(递),grep会去读取资料夹下所有的档案,
此相当於-r 参数。
(9) -E, --extended-regexp
说明:采用规则表示式去解释样式。
(10) -e PATTERN, --regexp=PATTERN
把样式做为一个partern,通常用在避免partern用-开始
(11) -f FILE, --file=FILE
事先将要搜寻的样式写入到一个档案,一行一个样式。
然後采用档案搜寻。
空的档案表示没有要搜寻的样式,因此也就不会有任何符合。
ex: (newfile为搜寻样式档)
$grep -f newfile file
(12). -G, --basic-regexp
将样式视为基本的规则表示式解释。(此为预设)
(13). -H, --with-filename
在每个符合样式行前加上符合的档案名称,若有路径会显示路径。
ex: (在file与testfile中搜寻panda样式)
$grep -H panda file ./testfile
file:panda
./testfile:panda
$
(14). -h, --no-filename
与-H参数相类似,但在输出时不显示路径。
(15). -I
grep会强制认为此二进位档案没有包含任何搜寻样式,
与--binary-files=without-match参数相同。
ex: $ grep -I panda mv
(16). -i, --ignore-case
忽略大小写,包含要搜寻的样式及被搜寻的档案。
ex: $ grep -i panda mv
(17). -L, --files-without-match
不显示平常一般的输出结果,反而显示出没有符合的档案名称。
(18). -l, --files-with-matches
不显示平常一般的输出结果,只显示符合的档案名称。
(19). --mmap
如果可能,使用mmap系统呼叫去读取输入,而不是预设的read系统呼叫。
在某些状况,--mmap 能产生较好的效能。 然而,--mmap
如果运作中档案缩短,或I/O 错误发生时,
可能造成未定义的行为(包含core dump),。
(20). -n, --line-number
在显示行前,标上行号。
ex: $ grep -n panda file
显示结果相似於下:
行号:符合行的内容
(21). -q, --quiet, --silent
不显示任何的一般输出。请参阅-s或--no-messages
(22). -r, --recursive
递地,读取每个资料夹下的所有档案,此相当於 -d recsuse 参数。
(23). -s, --no-messages
不显示关於不存在或无法读取的错误讯息。
小: 不像GNU grep,传统的grep不符合POSIX.2协定,
因为缺乏-q参数,且他的-s 参数表现像GNU grep的 -q 参数。
Shell Script倾向将传统的grep移植,避开-q及-s参数,
且将输出限制到/dev/null。
POSIX: 定义UNIX及UNIX-like系统需要提供的功能。
(24). -V, --version
显示出grep的版本号到标准错误。
当您在回报有关grep的bugs时,grep版本号是必须要包含在内的。
(25). -v, --invert-match
显示除搜寻样式行之外的全部。
(26). -w, --word-regexp
将搜寻样式视为一个字去搜寻,完全符合该"字"的行才会被列出。
(27). -x, --line-regexp
将搜寻样式视为一行去搜寻,完全符合该"行"的行才会被列出
二. grep正则表达式
( 1 ) grep正则表达式元字符集:
^ 锚定行的开始 如:'^grep'匹配所有以grep开头的行。
$ 锚定行的结束 如:'grep$'匹配所有以grep结尾的行。
. 匹配一个非换行符的字符 如:'gr.p'匹配gr后接一个任意字符,然后是p。
* 匹配零个或多个先前字符 如:'*grep'匹配所有一个或多个空格后紧跟grep的行。 .*一起用代表任意字符。
[] 匹配一个指定范围内的字符,如'[Gg]rep'匹配Grep和grep。
[^] 匹配一个不在指定范围内的字符,如:'[^A-FH-Z]rep'匹配不包含A-R和T-Z的一个字母开头,紧跟rep的行。
\(..\) 标记匹配字符,如'\(love\)',love被标记为1。
\< 锚定单词的开始,如:'\<grep'匹配包含以grep开头的单词的行。
\> 锚定单词的结束,如'grep\>'匹配包含以grep结尾的单词的行。
x\{m\} 重复字符x,m次,如:'0\{5\}'匹配包含5个o的行。
x\{m,\} 重复字符x,至少m次,如:'o\{5,\}'匹配至少有5个o的行。
x\{m,n\}重复字符x,至少m次,不多于n次,如:'o\{5,10\}'匹配5--10个o的行。
\w 匹配文字和数字字符,也就是[A-Za-z0-9],如:'G\w*p'匹配以G后跟零个或多个文字或数字字符,然后是p。
\b 单词锁定符,如: '\bgrep\b'只匹配grep。
(2) 实例:
关于匹配的实例:
grep -c "48" test.txt 统计所有以“48”字符开头的行有多少
grep -i "May" test.txt 不区分大小写查找“May”所有的行)
grep -n "48" test.txt 显示行号;显示匹配字符“48”的行及行号,相同于 nl test.txt |grep 48)
grep -v "48" test.txt 显示输出没有字符“48”所有的行)
grep "471" test.txt 显示输出字符“471”所在的行)
grep "48<tab>;" test.txt 显示输出以字符“48”开头,并在字符“48”后是一个tab键所在的行
grep "48[34]" test.txt 显示输出以字符“48”开头,第三个字符是“3”或是“4”的所有的行)
grep "^[^48]" test.txt 显示输出行首不是字符“48”的行)
grep "[Mm]ay" test.txt 设置大小写查找:显示输出第一个字符以“M”或“m”开头,以字符“ay”结束的行)
grep "K…D" test.txt 显示输出第一个字符是“K”,第二、三、四是任意字符,第五个字符是“D”所在的行)
grep "[A-Z][9]D" test.txt 显示输出第一个字符的范围是“A-D”,第二个字符是“9”,第三个字符的是“D”的所有的行
grep "[35]..1998" test.txt 显示第一个字符是3或5,第二三个字符是任意,以1998结尾的所有行
grep "4\{2,\}" test.txt 模式出现几率查找:显示输出字符“4”至少重复出现两次的所有行
grep "9\{3,\}" test.txt 模式出现几率查找:显示输出字符“9”至少重复出现三次的所有行
grep "9\{2,3\}" test.txt 模式出现几率查找:显示输出字符“9”重复出现的次数在一定范围内,重复出现2次或3次所有行
grep -n "^$" test.txt 显示输出空行的行号
ls -l |grep "^d" 如果要查询目录列表中的目录 同:ls -d *
ls -l |grep "^[^d]" 在一个目录中查询不包含目录的所有文件(开头为非d)
ls -l |grpe "^d…..x..x" 查询其他用户和用户组成员有可执行权限的目录集合