集体智慧编程的笔记(44)

>我来写笔记

按有用程度 按页码先后 最新笔记

  • 烟火人间

    烟火人间 (谦卑,认真生活)

    代码中错误的返回值 1 /代码内容已省略/ 英文版此处返回值为 0 /代码内容已省略/

    2012-06-02 11:00   2人喜欢

  • 小马甲

    小马甲

    第四章 此间的网页评价机制已经相当成熟了.比如单词频度,文档位置以及单词距离甚至后面的外部指向链接,链接文本这些方式现在来看算是非常原始的了. 本章的重点在于建立一个初级的神经网络.还有非常有用的s型函数(sigmoid function). 此处的方式是将神经网络的置于输入和输出之间,并记录了所有相关的信息.每次反馈之后都对相关的数值进行修正,以达到渐进的效果. 这本书号称实战性极强,将数学原理性的东...

    2011-08-07 20:34   1人喜欢

  • voler

    voler

    **分级聚类**的结果为我们返回了一棵树, 但有两个缺点: 在没有额外投入的情况下, 树形视图是不会真正将数据拆分成不同组的, 而且该算法的计算量非常惊人. **K-均值聚类算法**首先会随机确定k个中心位置(位于空间中代表聚类中心的点), 然后将各个数据项分配给最临近的中心点. 一直分配下去, 直到分配过程不再产生变化为止. 具体实现代码如下: ```python ```

    2016-03-24 20:45

  • voler

    voler

    需要的绘图库: PIL /代码内容已省略/ 首先, 我们要得到树的总高度: /代码内容已省略/ 还有, 每个节点的宽度: /代码内容已省略/ 然后, 我们生成一张图片: /代码内容已省略/ 最后, 我们进行节点的绘制: /代码内容已省略/

    2016-03-24 19:41

  • voler

    voler

    **原理**: 通过连续不断的将最为相似的群组两两合并, 来构造出一个群组的层级结构. 在每次迭代的过程中,分级聚类算法会计算每两个群组间的距离, 并将距离最近的两个群组合并成一个新的群组. 这个过程会一直重复下去, 直到只剩下一个群组为止. **示例图**: **树状图** **** 首先, 我们先读取文件: /代码内容已省略/ 我们使用皮尔逊相关度来计算两个博客之间的差别: ...

    2016-03-23 18:54

  • voler

    voler

    需求如下: 1. 统计指定范围的词汇(在10%~50%博客中出现的词汇), 在博客中出现的次数 首先, 获取博客的所有单词统计数: /代码内容已省略/ 然后, 我们统计每篇博客的单词统计, 以及出现这些单词的博客数目: /代码内容已省略/ 我们要保证统计的单词出现在10%~50%的博客中: /代码内容已省略/ 最后, 记录针对每个博客的所有单...

    2016-03-22 20:38

  • voler

    voler

    结合皮尔逊相关度评价 + 相似度列表 + 进行推荐, 完整的一个推荐代码如下: /代码内容已省略/

    2016-03-22 19:29

  • voler

    voler

    **总体思路**: 为每件物品预先计算好最为相近的其他物品.然后,当我们想为某位用户提供推荐时,就可以查看他曾经评过分的物品,并从中选出排位靠前者,再构造出一个加权列表,其中包含了这些选中物品最为相近的其他物品. 首先, 我们需要将人员和物品的数据结构调换一下: /代码内容已省略/ 实际上, 如果使用DataFrame结构,我们只要转置即可: /代码内容已省略/ 其次...

    2016-03-21 20:41

  • voler

    voler

    我们需要通过一个经过加权的评价值来为影片打分, 评论者的评分结果因此而形成了先后的排名.具体操作步骤: 1. 获取关联评论者的相似度和自己未看影片的名字. 2. 将相似度和影片的打分相乘, 结果为**假设自己看这部影片,自己的评分** 3. 获取所有看了这部影片的相似度的和(**用总计值来保证评分的合理性**) 4. 将所有的评分和 / 总相似度 = 自己预期的评分 使用numpy/pandas实现的版本(**实现代码上比书本上啰嗦**):

    2016-03-20 20:46

  • voler

    voler

    原理: 判断两组数据与某一直线拟合的一种度量. 如果两个人对物品的分值之差始终保持一致,则说明他们存在很好的相关性. 皮尔逊相关度评价算法首先会找出两位评论者都曾评价过的物品,然后计算两者的评分总和与平方和, 并求得评分的乘积之和.最后,算法利用这些计算结果计算出皮尔逊相关系数: /代码内容已省略/

    2016-03-20 18:48

<前页 1 2 3 4 5 后页>

笔记是你写在书页留白边上的内容;是你阅读中的批注、摘抄及随感。

笔记必须是自己所写,不欢迎转载。摘抄原文的部分应该进行特殊标明。

集体智慧编程

>集体智慧编程