从零开始大模型开发与微调:基于PyTorch与ChatGLM 短评

热门
  • 1 Deerhunter 2023-12-22 23:07:08 山东

    能看出来作者水平很高,对于刚入门的我来说后面的内容还挺难的,也学到了一些东西。但是书的小错误有点多啊,明显是赶时间没有仔细校审。时不时冒出一段tensorflow和keras的代码让我懵逼半天。

  • 0 pansin 2024-01-11 09:37:20 广东

    从了解大模型的嬗变历史,懂得其算法逻辑与实现技术栈的角度而言,这绝对是一本最佳入门参考书,从CNN,RNN的神经网络讲起,对神经网络的概念,框架,算法以及实践可以跟着复现有助于理解和掌握。对transformer模型的encode,decode实现的算法以及大模型微调的步骤进行了分解,使我在复习的基础上有所提升。清华的chatglm大模型在int8,int4进行优化下7b模型可以在消费级显卡进行微调训练,LoRA算法的旁路微调有一句话对我比较有启发,构建向量数据知识库之外,具备微调大模型能力是应用不可或缺的部分。虽然,应用没有讲langchain的应用,但学理论更扎实,有志于此的年轻人,不防研读实践,相信一定收获满满。

  • 0 lu4nx 2025-04-09 19:39:39 四川

    书的英文名挺创新的

<< 首页 < 前页 后页 >