lgjut的读书主页

读过   · · ·  ( 9本 )

  • 使用C#开发搜索引擎
  • 使用C#开发搜索引擎
  • 解密搜索引擎技术实战
  • 实用语音识别基础
  • 机器学习
  • 统计自然语言处理基础
  • 集体智慧编程
  • 自己动手写网络爬虫
  • 自己动手写搜索引擎

lgjut的书评   · · ·  ( 21篇 )

自己动手写网络爬虫

繁体版本

http://www.topteam.cc/02-shop-detail.php?cid=47&pid=236 當你在飆網時,是否知道還有一類特殊的網路使用者也再網際網路上默默的工作著,他們就是網路爬蟲。這些網路爬蟲按照設計者預定的方式,在網路中穿梭,同時自動蒐集有用的資訊,進行分類和整理,將整理結果提供給使用者,方便使用者尋找他們感興趣的內容。由...(0回应)

使用C#开发搜索引擎

来自读者的真实评价

用C#开发搜索引擎,配合Lucene.NET 业界的第一本书啊!太需要了!希望有更深入的相关书籍 用C#开发搜索引擎,配合Lucene.NET 业界的第一本书啊!太需要了!希望有更深入的相关书籍(0回应)

使用C#开发搜索引擎

本书的购买地址

互动出版网: http://product.china-pub.com/59225 或者当当网 http://product.dangdang.com/product.aspx?product_id=22602706(0回应)

使用C#开发搜索引擎

最不好的结果

不是讨厌,或者最讨厌,或者是菜! 而是没人理。 讨厌这本书的人,也许只是因为他的蛋糕被人动了,所以他不爽。 他的采集器卖不出去了。 但是我们不能做一个屁股决定脑袋的人。 要做一个对社会有益的人。(0回应)

lgjut的笔记   · · ·  ( 19篇 )

解密搜索引擎技术实战 (14)

罗刚 / 电子工业出版社 / 2011-5 / 69.80元

  • 第188页
    09:59:43 罗老师,好啊。 请教两个问题 1、在你的书搜索引擎技术实战中188页,提到过用动态规划计算出最佳前驱词。但是我找不到怎么用动态规划去实现它。我也对动态规划不熟悉。 2、前驱词是否就是以某个字符..
  • 第543页
    相关的jar包下载地址: www.lietu.com/train/lib.tar.bz2
  • 第426页
    lucene 3.4 版本支持层次分类统计。 代码在contrib/facet 索引阶段: /代码内容已省略/ 搜索阶段: /代码内容已省略/

自己动手写网络爬虫 (2)

2010-10 / 43.00元

  • 第一章
    我是买了您的那本《自己动手网络爬虫》的读者,在第一章的代码我已经添加了相应的.jar文件了,也正常了,可是在运行的时候却出了问题,而我不是很明白,希望您可以给我解答一下。 > java.io.FileNotFoundExcepti... (1回应)
  • 第8页
    HttpClient4.0的例子: /代码内容已省略/

自己动手写搜索引擎 (3)

罗刚 / 2009-11 / 55.00元

  • 第1页
    自己动手写搜索引擎 使用codec来定制编码和索引的结构。 和其他的codec写入到压缩的二进制文件不一样,SimpleText codec写到可读的文本文件。像这样: field contents term file doc 0 pos ...
  • 第3页
    Lucene 3.3新的创建索引的方法: /代码内容已省略/
  • 第28页
    爬虫一般是宽度遍历或者按目录遍历。

lgjut关注的人  · · ·  ( 全部4 )

创业者俱乐部
创业者俱乐部
wwfking
wwfking
windshow
windshow
小松鼠
小松鼠

最近阅读   · · ·