vim - 一个用vi/shell使用正则表达式进行文本处理的问题

浏览:48日期:2023-07-26

问题描述

需求如下:

输入文件input.txt:a1a2a3a4b1b2a5b3b4b5

要求输出文件output.txt为:a1a4b1b2a5b3b5

即去掉第N行,N满足的条件是:第N行与第N-1、第N+1行的首字母都相同(不去掉首行与末行)。

请问使用vi的替换命令或shell能完成此需求吗,给点提示也行,谢谢。(我用C++已经实现了,现在就是想知道能不能用正则表达式实现)

问题解答

回答1:vim的正则

%s/v((.).*n)((2.*n)+)(2.*$)/15/g分成三段解释一下

((.).*n)匹配第一行,外层分组用于替换的时候反向引用,内层分组用于后面判断

((2.*n)+) 匹配接下来 以上一行第一个字母开头的行(1行或多行)

(2.*$) 匹配一行以第一行第一个字母开头的行

最后 15 把上面匹配到的所有的行 替换成第一行和最后一行,即删除中间的行

注:最开始的v是切换到perl正则模式,这样括号、加号就不需要转义了

BTW 这种文本处理的工作用perl脚本完成是最方便的,vi的好处是可视化调试,但是遇到大文件就GG了

相关文章: