文本处理常用书单

无锋之刃

来自: 无锋之刃 (上海)
创建时间: 2011-11-21 13:36:32 最后修改时间: 2011-11-25 11:48:51

  罗列UNIX/Linux下常用的文本处理工具相关的书籍和工具,附简短推荐理由等。


1人
全部图书(6)


出版社 : 开明出版社

评语 : ●眼镜猴书,最新版本为第7版,中文版本已出版; ●轻量级字符界面文本编辑工具vi/vim的经典学习用书,配以适当外部工具和语法高亮,编写任何程序/配置文件/测试数据当属行云流水(Lisp可能除外); ●任何现代UNIX/Linux上均默认配备某个版本的vi/vim编辑器。

2011-11-21 13:52:28添加 2. sed与awk

作者 : (美)多尔蒂/(美)罗宾斯
出版社 : 机械工业出版社

评语 : ●狐猴书,最新版本为第2版,中文版已出版; ●两者均为轻量级文本处理工具/编程语言,提供基于“文本行”的编程框架,非常适宜快速开发特定场合使用的文本处理程序; ●sed偏向于“流式文本编辑处理”,而awk侧重于“行级数据结构变换处理”。 ●任何现代UNIX/Linux上均默认配备某个版本的sed/awk实用程序。

2011-11-22 21:06:40添加 3. Perl语言编程

作者 : [美] Larry Wall/Tom Christiansen/Jon Orwant
出版社 : 中国电力出版社

评语 : ●骆驼书,最新版本为第2版,中文版已出版; ●轻重两相宜的文本处理军刀级工具,其自创的Perl流派正则表达式强大无比,并有名为PCRE(Perl Compatible Regular Expressions)的C函数库; ●任何现代UNIX/Linux上均默认配备某个版本的Perl解释器。

2011-11-23 12:14:32添加 4. 精通正则表达式:第3版

作者 : (美)Jeffrey E.F.Friedl
出版社 : 电子工业出版社

评语 : ●猫头鹰书,最新版本为第3版,中文版已经出版; ●正则表达式是文本处理的另一军刀级“微型”工具,配合以适当的编程语言及其实现,绝大部分问题都能迎刃而解; ●具备强大力量的器物往往同时具备强大杀伤力——正则表达式非常好用,真正把它用对却十分困难——即便专家级程序员编写正则表达式时也往往会引入十分隐晦的Bug,或者在处理某些特例/异常情况时陷入效率泥淖里,这本书就是为解决这些困境而准备的; ●值得一年复读一次的好书; ●任何现代编程语言应该都提供某种形式的正则表达式处理能力。

2011-11-25 11:23:40添加 5. Shell脚本学习指南

作者 : Arnold Robbins/Nelson H.F.Beebe

评语 : ●乌龟书,最新版本为第1版,中文版已经出版; ●侧重于介绍如何以经典Shell脚本作为胶水,粘合各种实用程序,从而实现快速文本处理程序开发; ●书中最有趣的一个实例是“tr -cs A-Za-z\' '\n' | tr A-Z a-z | sort | uniq -c | sort -k1,1nr -k2 | sed ${1:-25}q”,提取词频统计前n条记录(n默认为25); ●任何现代UNIX上均默认配备某个版本的Shell程序,或其它替代实现如Bash等。

2011-11-25 11:48:51添加 6. 学习 bash (第二版)

作者 : Cameron Newham/Bill Rosenblatt
出版社 : 机械工业出版社

评语 : ●鲈鱼书,最新版本为第3版,第2版的中文版已经出版; ●对标准shell的好的替代实现Bash进行了细致得当的介绍和描述,在缺少某些标准外部实用程序的情况下可以作为简单的替代品; ●某些内建的文本处理功能有意想不到的便利性; ●绝大部分Linux默认配备某个版本的Bash程序。