|
本帖最后由 惟吾无为 于 2012-5-2 20:45 编辑
问题通过qq解决, 由于文件格式已经做过很好的排版, 所以直接使用grep.- time grep -x -f /dt/vocabulary\ .txt /dt/4朗文英汉双解第四版.TXT -A 3 | grep -v "^--$" > /dt/new4.txt
复制代码 以上命令在cygwin utf-8环境下运行. 文本预先转换为utf-8编码, unix换行符.
保证在linux平台下gnu grep可运行. 不保证其他平台的效果.
time是计时命令, grep查找文本.
-x 进行整行匹配
-f 指定关键字列表文件
-A 3 显示匹配行的后3行.
由于输出中含有--的分隔符, 所以需要过滤掉.
^--$ 匹配整行为--的行.
-v 反向匹配.
由于使用了管道, 导致速度慢了点. 总共花了19秒多. 但比ue人工替换又快多了. |
|