本书以简单、实用、易于理解为原则,内容力求全面、新颖,涵盖了中文信息处理的主要相关技术和研究成果。读者阅读本书之后,能够系统地了解汉字的编码、字形压缩与还原、光学汉字识别、中西文兼容处理、汉语自然语言处理等技术,以及中文信息处理技术的典型应用系统的原理与使用,如电子排版印刷系统、办公自动化系统、Internet搜索引擎、智能检索系统等,最终达到对中文信息处理技术的系统性了解。本书附录中还提供了该领域常用的各项国家标准。
本书可作为大专院校计算机、信息管理、系统工程等专业的本科教材,也可以供从事中文信息系统研发工作的科研人员参考。
-------
目录
第1章 中文信息处理技术概论
1.1 信息处理的实质
1.1.1 信息和信息技术
1.1.2 文字信息处理
1.1.3 中文的文字信息处理的特点
1.2 汉字编码的种类与中文信息处理过程中汉字编码的变换
1.3 中英文兼容技术
1.4 ASCII体系的汉字内码
1.4.1 概述
1.4.2 未占用C1区的编码方式
1.4.3 覆盖C1区的编码方式
1.5 Unicode与Unicode汉字
1.5.1 背景
1.5.2 替代标准
1.5.3 方法与状态
1.5.4 设计思想
1.5.5 Unicode字集
1.5.6 未来扩展与字符收录
1.5.7 代码赋值
1.5.8 细目
1.5.9 Unicode汉字
1.6 中文信息处理系统五层结构模型
1.7 中文信息处理技术发展概况
1.7.1 汉字标准代码
1.7.2 汉字操作平台
1.7.3 汉字输入方法
1.7.4 文字处理和文字编辑排版系统
1.7.5 中文信息检索系统技术
1.7.6 翻译系统技术
1.7.7 汉语自然语言理解
习题1
第2章 汉字编码输入原理
2.1 汉字和汉字属性
2.1.1 汉字发展及其分级
2.1.2 汉字的结构分析
2.1.3 汉字的字音和字义
2.1.4 汉字的排序
2.1.5 汉字的属性
2.2 汉字编码输入方法
2.2.1 概述
2.2.2 汉字键盘码的笛卡儿积集分析
2.2.3 汉字信息的熵值
2.2.4 海曼公式与汉字编码的键盘特性
2.2.5 汉字编码输入方法的简易评测方法
2.2.6 汉字编码输入方法专业评测方法
2.2.7 汉字键盘码的译码问题
2.3 有关中文输入技术现状与发展的几个问题
习题2
第3章 汉字字形存储与压缩技术
3.1 汉字字形存储与字形码
3.1.1 汉字字形的数字化
3.1.2 整字存储与压缩存储
3.2 汉字压缩存储常见方法
3.3 衡量压缩与还原技术的重要指标
3.4 汉字字形压缩的方法与技术
3.4.1 汉字笔画矢量存储方法
3.4.2 部件组字压缩方法
3.4.3 子信息块哈夫曼树压缩
3.4.4 字形轮廓压缩
3.4.5 黑白段与线性增量压缩
3.4.6 笔画轮廓压缩
习题3
第4章 汉字识别技术
4.1 OCR技术概况
4.1.1 概述
4.1.2 汉字识别应用领域
4.1.3 印刷体文字识别的研究
4.2 汉字识别种类
4.3 汉字识别原理
4.4 汉字识别一般方法
4.4.1 印刷体文字识别研究方法简介
4.4.2 联机手写文字识别研究方法
4.5 汉字识别产品介绍
4.5.1 汉王数字化档案馆解决方案概述
……
第5章 中西文兼容处理技术
第6章 汉语自然语言理解
第7章 中文信息处理技术的应用
附录
参考文献
1 有用 词客哀时且未还 2025-04-27 20:53:42 北京
大部分内容草草翻阅,缺乏高数基础,很多内容想看也看不了。 过于过时,整本书非常明显就是不知道从各种资料中东摘一句西摘一句凑出来的,前文说从下面的XX例子可见,后面根本就没那个直接开始了另外一个章节,诸如此类的情况比比皆是。 很多句子都是假话空话套话,很多段落根本不说人话,没有任何引导性的东西直接罗列句子都不通的知识点,幸好有AI,我经常一边查这到底说的啥一边骂这书里写得都是什么鬼,他是怎么做到的能... 大部分内容草草翻阅,缺乏高数基础,很多内容想看也看不了。 过于过时,整本书非常明显就是不知道从各种资料中东摘一句西摘一句凑出来的,前文说从下面的XX例子可见,后面根本就没那个直接开始了另外一个章节,诸如此类的情况比比皆是。 很多句子都是假话空话套话,很多段落根本不说人话,没有任何引导性的东西直接罗列句子都不通的知识点,幸好有AI,我经常一边查这到底说的啥一边骂这书里写得都是什么鬼,他是怎么做到的能把书写成这垃圾样子的。 真是一个国家教育的缩影与悲哀。 (展开)
0 有用 mark 2011-12-08 13:31:48
中文信息处理技术,原理,应用