豆瓣
扫码直接下载
《古籍汉字字频统计》的编写源于五年前书同文公司向国家语委申请的古籍汉字信息处理攻关研究成果。该成果以ISO/IEC 10646 CJK标准与《康熙字典》字头建立一一对应作为字频统计的基础纲目,以《文渊阁四库全书》和《四部丛刊》全文数码数据作为统计对象(超过八亿古籍汉字语料),最终得出每个汉字的字频排序、出现次数、出现频率,同时也揭示了中文古籍汉字用字量、用字临界点等奥秘,使过去一直模糊不清的技术和应用参数得到明确的验证。
该书的成书发行将为海内外古籍出版业者、中文数字化工程、中文信息处理工作者提供强有力的帮助以及权威性的理论和实用性依据。
第一次看这方面的书,这个书同文公司以后关注一下。
类似还有《现代汉语频率词典》。“连同前N-1个高频字的累计覆盖率”这个统计项有意思。索引做的简直坑爹,排列顺序没有规则不说,连页码都搞错了,翻了好久才意识需要在索引提供的数字上再加27。
真是没想到用的是四库全书和四部丛刊,太笼统了,不过也能看个趋势。
> 更多短评 3 条
> 更多书评 1篇
> 9人读过
> 31人想读
订阅关于古籍汉字字频统计的评论: feed: rss 2.0
0 有用 密斯.W. 2019-09-07 20:26:47
第一次看这方面的书,这个书同文公司以后关注一下。
0 有用 momo 2020-11-15 13:51:57
类似还有《现代汉语频率词典》。“连同前N-1个高频字的累计覆盖率”这个统计项有意思。索引做的简直坑爹,排列顺序没有规则不说,连页码都搞错了,翻了好久才意识需要在索引提供的数字上再加27。
0 有用 清禾明月 2024-04-27 17:48:10 北京
真是没想到用的是四库全书和四部丛刊,太笼统了,不过也能看个趋势。
0 有用 清禾明月 2024-04-27 17:48:10 北京
真是没想到用的是四库全书和四部丛刊,太笼统了,不过也能看个趋势。
0 有用 momo 2020-11-15 13:51:57
类似还有《现代汉语频率词典》。“连同前N-1个高频字的累计覆盖率”这个统计项有意思。索引做的简直坑爹,排列顺序没有规则不说,连页码都搞错了,翻了好久才意识需要在索引提供的数字上再加27。
0 有用 密斯.W. 2019-09-07 20:26:47
第一次看这方面的书,这个书同文公司以后关注一下。