作为入门书籍,还不错。分别介绍了信息检索领域的几个重要概念:倒排索引、检索引擎;tf-idf权重计算技术;向量空间模型,信息检索的评价,有序检索结果的评价MAP,ROC曲线,NDCG等等;相关反馈技术,伪相关反馈;概率检索模型,BM25算法;基于语言建模的信息检索模型,各种文本分类的技术,NB的,VSM的,SVM的;各种文本聚类技术,扁平的,层次的,LSI的;以及最后三章的关于web搜索的,不过关于web的都很基础很浅,没什么太深入的内容。重点推荐的中间部分的章节(第6,7,8,9,11,12章)。
有关键情节透露