Sed是非交互式的行编辑器. 它即可以从stdin中接收文本输入, 也可以从文件中接收文本输入,
它对输入中的指定行进行特定的操作, 一行操作一次, 然后将结果输出到stdout, 或输出到文件中.
在shell脚本中使用的话, sed通常都是作为管道工具链中的一个处理部分来使用.
Sed会决定它需要处理那些行, 因为sed的参数就包含有地址范围. 既可以通过行号来指定地址范围,
也可以通过模式匹配来决定地址范围. 比如, 3d表示sed会删除输入的第3行, /windows/d表示sed会删除掉所有匹配"windows"的输入行.
对于sed工具包的所有操作来说, 我们最关心的其实就是3个最主要的操作. 分别是printing(打印到stdout), deletion(删除), 和substitution(替换).
表格 C-1. 基本sed操作
操作符 |
名字 |
效果 |
[地址范围]/p |
打印 |
打印[指定的地址范围] |
[地址范围]/d |
删除 |
删除[指定的地址范围] |
s/pattern1/pattern2/ |
替换 |
将指定行中, 将第一个匹配到的pattern1, 替换为pattern2. |
[地址范围]/s/pattern1/pattern2/ |
替换 |
在地址范围指定的每一行中, 将第一个匹配到的pattern1,
替换为pattern2. |
[地址范围]/y/pattern1/pattern2/ |
transform |
在地址范围指定的每一行中,
将pattern1中的每个匹配到pattern2的字符都使用pattern2的相应字符作替换. (等价于tr命令) |
g |
全局 |
在每个匹配的输入行中, 将每个模式匹配都作相应的操作. (译者注: 不只局限于第一个匹配)
|
|
除非在替换命令的后边明确指定选项g (全局), 否则的话,
替换操作只会替换掉每行上的第一个模式匹配实例. |
如果在命令行或脚本中使用这个命令, sed操作可能还需要某些选项和引用.
1 sed -e '/^$/d' $filename
2 # -e选项, 将会使得后边的字符被看作为编辑指令.
3 # (如果只给"sed"传递了单个指令, 那么"-e"是可选的.)
4 # "强"引用('')将会保护指令中的RE(正则表达式)字符串,
5 #+ 也就是防止脚本将RE重新解释为特殊字符.
6 # (这会为sed命令, 保存指令的RE表达式.)
7 #
8 # 将会对文件$filename中的文本进行操作. |
在某些特定的情况下, sed编辑命令将不会和单引号的强引用一起工作.
1 filename=file1.txt
2 pattern=BEGIN
3
4 sed "/^$pattern/d" "$filename" # 工作正常.
5 # sed '/^$pattern/d' "$filename" 就会出现异常的结果.
6 # 在这个实例中, 被强引用(' ... ')引起的
7 #+ "$pattern"就不会扩展为"BEGIN". |
|
Sed命令的-e 选项表示后续的字符串是一个指令, 或指令集. 如果后续的字符串中只有一个指令,
那么-e 选项可以被省略. |
1 sed -n '/xzy/p' $filename
2 # -n选项会让sed只打印那些匹配模式的行.
3 # 否则所有的输入行都会被打印.
4 # 这里可以省略-e选项, 因为这里只有一个编辑指令. |
表格 C-2. sed操作符举例
表示法 |
效果 |
8d |
删除输入的第8行. |
/^$/d |
删除所有空行. |
1,/^$/d |
从输入的开头一直删除到第1个空行(第一个空行也删除掉). |
/Jones/p |
只打印那些包含"Jones"的行(使用-n选项).
|
s/Windows/Linux/ |
在每个输入行中, 将第一个出现的"Windows"实例替换为"Linux". |
s/BSOD/stability/g |
在每个输入行中, 将所有"BSOD"都替换为"stability". |
s/ *$// |
删除掉每行结尾的所有空格. |
s/00*/0/g |
将所有连续出现的0都压缩成单个的0. |
/GUI/d |
删除掉所有包含"GUI"的行. |
s/GUI//g |
将所有"GUI"都删除掉, 并保持剩余部分的完整性.
|
在输入行中, 将一个字符串替换为空字符, 等价于删除这个字符串. 剩余部分会保持完整. 比如s/GUI//, 拿下边这句为例:
The most important parts of any application are its GUI and sound effects |
结果为:
The most important parts of any application are its and sound effects |
反斜线将会强制sed替换命令延续到下一行. 类似于,
在第一行的结尾使用换行作为替换字符串.
这将每行开头的空格用换行来替换.
最后的结果就是将每段的缩进替换为一个空行.
地址范围后边可以加上一系列操作, 这些操作可能需要放到大括号对中, 并且需要重起一行.
1 /[0-9A-Za-z]/,/^$/{
2 /^$/d
3 } |
这只会删除连续空行中的第一行. 对于单行间距的文本文件来说, 这很有用,
但是会保留段落间的空行.