豆瓣
扫码直接下载
作为麻瓜看了第一部分讲Transformer,虽然不会计算,但是理解了计算机科学家的数学技巧:它主要是三个转换,第一次转换用高维矩阵把单词变成向量表示。第二次转换是计算点积来挖掘目标单词与上下文其他单词的关系。第三次转换是用了一个函数把那个关系转成概率!这就产生了注意力层的输出。 简单来讲就是把一个语言问题,转成了一个纯数学问题,然后通过一系列眼花缭乱的数学技巧,让不易察觉的语言内秉属性显现,并将之变成语言处理的强大工具集!
微信读书搜到,找本教程好好了解下BERT
嗯……BERT也还是可以学的,虽然有种49年入国军的感觉
一共就200页的内容,里面还有代码充数,而且这书的原作者是个印度人......
不像别的技术书前18页都是走过场,本书从第一章就是硬核知识,后续每章亦是。受益匪浅,酣畅淋漓。
> BERT基础教程:Transformer大模型实战
0 有用 魔云兽 2023-11-12 14:05:55 北京
作为麻瓜看了第一部分讲Transformer,虽然不会计算,但是理解了计算机科学家的数学技巧:它主要是三个转换,第一次转换用高维矩阵把单词变成向量表示。第二次转换是计算点积来挖掘目标单词与上下文其他单词的关系。第三次转换是用了一个函数把那个关系转成概率!这就产生了注意力层的输出。 简单来讲就是把一个语言问题,转成了一个纯数学问题,然后通过一系列眼花缭乱的数学技巧,让不易察觉的语言内秉属性显现,并将之变成语言处理的强大工具集!
0 有用 旅行者 2025-02-25 21:42:52 上海
微信读书搜到,找本教程好好了解下BERT
0 有用 Gatsby&祥林嫂 2023-04-01 13:25:38 北京
嗯……BERT也还是可以学的,虽然有种49年入国军的感觉
0 有用 frank 2023-02-28 22:26:48 中国台湾
一共就200页的内容,里面还有代码充数,而且这书的原作者是个印度人......
0 有用 伯潜 2023-03-02 16:46:44 湖南
不像别的技术书前18页都是走过场,本书从第一章就是硬核知识,后续每章亦是。受益匪浅,酣畅淋漓。