种南瓜记
看到这篇文章的标题,你是不是以为我要归隐田园,种瓜南山下? 哈哈哈,当然不会。这篇“种南瓜记”是站在责任编辑(简称“责编”)的角度,介绍一下人民邮电出版社近期的畅销图书“南瓜书”(《机器学习公式详解》)整个出版过程中的故事。
一、选种(选题) 二、育苗(论证) 三、除草(编辑加工) 四、定植(定版式) 五、搭架(定书名) 六、整枝(设计封面) 七、灌溉(定价) 八、授粉(营销) 九、收获(销售及业界认可)
周志华老师是中国最著名的机器学习和人工智能领域的专家之一。 周老师的《机器学习》一书很受读者的欢迎,据估计,它已印刷超过70万册,并因封面而获得了一个爱称——“西瓜书”。 在周老师的支持和帮助下,我们出版了Datawhale团队编写的“西瓜书”配套手册。 这本书在 3 个月内印刷了近 3万册。 对应“西瓜书”,读者也给它起了一个可爱的名字“南瓜书”。

2020年,我还是入社3年的编辑,当听分社领导说想把这本书交给我做的消息,内心其实是矛盾的,欣喜能够做“西瓜书”的配套手册,但是没做过这种全是高难公式的书,所以是既想做,又怕做不好。很后来与分社领导沟通后,看到了分社对于咱们这本书寄予的厚望,于是又一次暗暗下决心一定不能辜负厚爱,接下了这本书。(“又一次”是因为之前准备担任《UNIX传奇》那本书的责编时也有同样的心情~)
一、选种(选题)
先来说说“南瓜书”是怎么从无到有,逐步变为落地生根的。
阶段1:无意识→有意识
正如前文所提到的,周志华老师的《机器学习》(俗称“西瓜书”)是机器学习领域的经典入门教材之一。“南瓜书”的缘起,是作者在读“西瓜书”学习机器学习的时候,深受算法公式的推导之苦,于是,养成了一边“啃西瓜”,一边自己进行公式推导并记读书笔记的习惯。久而久之,读书笔记就成了“南瓜书”最初的素材。
独乐乐不如众乐乐。作者通过Datawhale的平台,将“南瓜书”作为一个开源项目。没想到一发而不可收,众多面临同样困扰的初学者加入到这个队伍中来,“南瓜书”的下载量一度累计到了3万多。
作者编写“南瓜书”的初衷,就是为了帮助初学者搭建一个学习“西瓜书”的方便的“脚手架”,借助Datawhale,这种作用得到了很好的实现和放大。于是,创作团队就产生了想要出版纸质图书,进一步扩大传播和影响的想法。
人民邮电出版社信息技术分社的编辑(也就是我的同事)很早以前就关注到了开源的“南瓜书”项目,但之前由于“南瓜书”篇幅比较小,内容也在不断充实和成熟之中,出版纸书的想法被暂时搁置了起来。
阶段2:抓住机遇
2020年10月17日, Datawhale团队创始人范晶晶参加了异步社区5周年大会,并且提出了将南瓜书变成正式印刷版的建议。中心领导和分社领导经过慎重的考虑和评估,觉得“南瓜书”虽然定位于“西瓜书”的学习伴侣和配套辅导书,但是市场需求非常明确,具有出版价值。双方一拍即合,决定尝试联系“西瓜书”的作者周志华老师,先表示一下出版“南瓜书”的意向。
没想到,周志华老师非常理解和体谅年轻读者学习机器学习的迫切心情和辛苦努力,也一直在默默关注和支持“南瓜书”项目。在他的帮助和支持下,我们很顺利地得到了“西瓜书”出版社的许可,“南瓜书”终于有了正式出版并和广大读者见面的机会。
二、育苗(论证)
很快,Datawhale的写作团队就将PDF版正式交到我手里了,经过调研、评估,一周左右时间我这边就报了选题。
小插曲——选题
在出版领域,选题是指经多方面分析、考量而选中主题后拟实施的出版项目。在出版工作实践中,有时还用以指代出版物本身。 在出版物准备正式进入生产流程时,责编首先要提出选题,经过集体论证,一般是本部门论证、中心论证、出版业务管理部论证后才能进入三审三校环节。如果想要申报重点书,责编还需要进行一次重点选题论证会,展现该选题有哪些市场潜力。
当时由于“西瓜书”几十万册销量的好成绩,以及“南瓜书”在GitHub 3万的下载量,可以初步判断大家对“南瓜书”的知识需求较大,于是分社开了讨论会决定将其推荐为一季度的重点选题候选产品。
小插曲——重点选题论证会
社级重点选题,指经过预期年销、作者影响力、营销资源、领域热点性与趋势性等指标的综合考量,指标结果出色的选题。
社级重点选题论证会原则上每季度召开一次,各出版中心/下属公司的责编需从选题概况、市场分析、成本预算、营销计划等方面进行阐述说明;选题论证委员会成员从选题内容、形式、可行性、资源保障等方面对选题进行论证,以投票方式确定社级重点选题。
我们出版中心在召开社级重点选题论证会之前,还要集中召开一次中心级的重点选题论证会。分社内谈论后先选出较为重点的选题到出版中心,全中心的策划编辑、营销编辑以及中心领导集中进行PPT答辩,60多号编辑给16个汇报的责编不留名在线打分,经过大家认可的前6-8个选题才能进入社级重点选题论证会的候选名单。如果入选社级重点选题,不仅出版中心的营销部会大力配合,社里的营销中心和市场部也会分派顶级人手全力辅助这本书的后期销售与营销。
从我们中心的重点选题论证会机制可以看到,2轮集中答辩对于责编其实是件好事,这样有改进的机会,社级重点选题的入选率会提高,全中心的编辑也能了解中心内好的产品;2轮集中答辩对于责编也是挑战,第1轮表现的好坏决定了是否有机会进入第2轮展示。所以对于每一位责编来说,尤其第1轮的集中答辩压力还是蛮大的。
记得当时被通知召开中心级重点选题论证会比较着急,周五通知让周一交在中心答辩的PPT,为了充分了解、深度挖掘亮点,于是周六和作者之一谢文睿老师做了小小的采访,包括南瓜书的下载量等代表影响力的数据、读者对南瓜书的反馈以及大咖推荐人、编委会8个成员的背景,甚至当时怎么取名叫“南瓜书”、何时落笔创作的,等等。
这次交流谢老师不仅提供了很多可视化的数据图片,还帮助我更深入了解咱们这个选题的来龙去脉,使得我能够快速进行大量的调研与对比,提炼出这本书的卖点,并且提出了初步的产品策划和营销思路。直至周一凌晨3点,答辩PPT得以成行,周一经过同事的意见,再修改部分细节后发给中心。



中心级选题论证会在接下来的一周就召开了,第一个上台的我有些紧张,不过好在“西瓜书”名气够大,“南瓜书”PDF版的影响力数据足够有说服力,再加上产品形态、内容特色以及营销思路讲得很清楚,最后顺利进入了社级重点选题的候选名单。
经过几位同事在答辩时提出的意见,我进一步完善了答辩PPT,这个选题最终顺利入选2021年一季度社级重点选题。这样一来由出版中心的策划编辑、营销编辑,以及市场部的运营经理、营销中心的营销经理组成的“南瓜书”营销小团队就顺理成章地配齐了。
三、除草(编辑加工)
正式讲这本书的内容是如何审核的之前,插播一下出版行业从作者写稿到图书出版的流程,帮助大家先有个整体的印象。
小插曲——选题立项及图书出版流程
1. 确定合作意向 ① 作者本人有出书意向,主动联系出版社; ② 编辑主动策划选题,寻找作者实现。 2. 讨论目录样章,申报选题 ① 作者提供目录,双方就选题思路、切入点、目标读者、写作体例、区别于竞品的差异点等内容进行讨论,不断优化目录,直到双方满意为止; ② 目录确定后,作者提供某章或某节内容作为样章; ③ 申报选题,经过3级审核后获批选题。 3. 撰稿与中耕 ① 作者撰写全书,写作过程中遇到问题可随时联系责编,也可以陆续交稿,责编陆续反馈意见(中耕); ② 全书写完后进行统稿,统一体例。 4. 初审全稿,提出意见 ① 责编审读全稿,提出修改意见给作者; ② 作者根据审读意见修改书稿。 5. 进入出版流程 ① 历经审稿(3次)、校对(3次)、通读(1次)、确定书名、版式设计、封面设计、质量检查、印刷、装订、上架等,所有环节责编整体协调沟通,把控质量和节奏; ② 其中“三审三校一读”:审稿3次,包括编辑加工(也就是精细修改)、二审、三审(这两个审次是有编审资质的老编辑审核,有权利退稿);校对3次,包括一校、二校、三校。三审三校期间至少6位老师审核/校对;通读1次,一般责编进行印前审读,以消灭遗漏差错。每一次审核/校对后,责编需要认真处理每位老师的意见后才能发到下一个环节。 6. 签订图书出版合同 出版合同涉及稿酬支付,因此这个环节可在上述1-5步任意时间进行。 7. 图书上市,营销与推广 ① 上市后,结合作者与出版社的资源,共同推广图书; ② 后遇到适合推广的场合,积极推广。
现在回到“南瓜书”。她的PDF版,是通过开源方式多人协作写成的,以多人分工合作、互相校验、开放监督的方式,既保证了书的质量,也保证了写作的效率,因此知识性的内容质量已经经过很多读者验证。尽管这样,要出版成图书,还是需要按照国家标准和出版规范精细打磨,使之从网络电子读物成为正式的纸质出版物。
于是我要隆重介绍一下我的同事G,北航研究生毕业,2020年刚刚毕业来社工作,参加社里举办的青年编校大赛就荣获一等奖!他是那种数学好,会编程,脑袋自带词典,手边常备常翻各种数学标准的人(还有就是,长得也很帅,照片就不方便放了)。由于这本书是重点选题,支撑团队可以配备顶级人员,于是分社领导C和我便一同邀请了同事G担任这本书的编辑加工老师。



一般难度的稿件,编辑加工2、300页稿子1个月,这本100来页就花了将近1个月!主要针对体例/格式不规范、字母正斜体/白体黑体不规范,并且在内容编排等问题上我们也是多次讨论,这为后续的版式设计上点亮了新想法。
在这里再次感谢一下同事G~~~没有他的细致和负责,也许这本书目前四次印刷总共的勘误不会这么少,在前期的大量编辑加工工作也为后续审稿/校对环节节省了很多时间。(作者建立了勘误并进行实时更新,见南瓜书纸质版勘误表https://datawhalechina.github.io/pumpkin-book/#/errata)
当然,在二、三审,一、二、三校对以及我最后通读的各个环节过程中,也发现了一些问题,感谢每一位老师的把关和优化,这里我就不详细说了。
四、定植(定版式)
内文版式,也就是翻开书,里边文的所有字和页眉页脚、图表等目之所及的所有内容的编排。内文版式的设计直接影响读者的阅读体验,所以做好这步可以给内容加分,反之则起到减分效果。
根据编辑的习惯,做内文版式也可以在作/译者交稿后就进行,最终的内文版式也会在各个审稿环节成为审核对象之一,但是存在一开始就错拍漏排的风险;做内文版式也可以在三审/签发都完成后再进行,这样排版老师漏排错排的风险会小一些;做内文版式还可以在三审环节中进行,就比如咱们这本,由于在编辑加工后痕迹已经比较多了,可能会影响到二、三审老师的阅读,所以这本在编辑加工后就做了版式。
这本书在做版式时具体做了以下几件事。
(1)根据内容定位,确定印刷色数:根据“西瓜书”的绝佳“伴侣”的教辅书定位,以及“南瓜书”图片少公式多的特点,四色(彩色)印刷的必要性不大,所以选择了单色(黑白)印刷。 (2)考虑配套销售,确定成品尺寸:考虑到后期可能与“西瓜书”配套销售,“南瓜书”选择与“西瓜书”最接近的尺寸大20开(210mm*230mm)。 (3)设置note栏并放置翻口,方便演算:这一点与“西瓜书”不一致,西瓜书统一放在一边,我和同事G都觉得这本书演算的使用场景较多,所以将note栏统一放在翻口(靠近手翻的地方)。 (4)把简短的注解从正文移到note栏,方便读者连续阅读。 (5)增加“字典式”页眉增强工具属性:使读者除了通过目录找公式,还能像字典一样,根据页眉查阅想看的公式,增加其便利性。 (6)考虑常常翻阅和书写的用途,选择不易透的、触感好的内文用纸,80g纯质,重点的精装书才会考虑。 (7)字乘行、行间距、页边距、字体字号及页眉页脚、标题排列方式等产品细节的设计也需要在做版式时一一确定。责编需要根据定位先确定页数,比如这本教辅,太厚不方便演算,也不方便携带,所以起初本书就预定在150页左右;然后再调整以上这些参数,按照原大小比例一次次打印出来,真实体验阅读的效果如何,并及时将想法与排版老师充分沟通,最后确定内文版式。

细化、优化内文版式这一步,不是一次性就能决定好的,需要责编不断站在读者的角度体验并权衡。
五、搭架(定书名)
经过三审后就到了签发环节,即确定所有图书信息,包括图书的书名、署名、内容提要等关键信息,以申请书号和版权页上方的CIP。
这个环节是图书效益的第一个关键,因为在这一步需要确定书名。起书名最重要的,是必须能够简短而准确地传达图书内容,其次要让读者容易念得出、记得住。如果在书名中,图书的内容没有被传达到位,可能连被搜索的机会都没有。起书名需要综合考虑这本书的内容、读者对象以及所涉领域的热搜词,前两者尤为重要。
咱们这本书由于定位很明确了,所以书名也要利用好已有的惯性思维和搜索关键词“机器学习”,再根据本书的公式推导解析的内容特色进行创新。“公式全解”有些不符合内容,毕竟只挑了一半的公式;“公式精解”“公式详解”虽然都像真题卷的名字,但是读起来“公式精解”更绕口一些,所以确定《机器学习公式详解》,这样好记、独特、顺口的特色都体现出来了。
六、整枝(设计封面)
一般签发时确定书名,之后就可以着手写封面设计文案了。这个环节是图书效益的第二个关键。一本书有可能因为一个封面成功逆袭,也有可能因为一个封面毁于一旦。
作为责编,我需要总结内容简介、作者简介等重要信息;结合内容设计整体风格,提炼卖点。前者需要的是细心,后者不仅需要对内容熟悉,还需要对市场熟悉,清楚市面上同类图书哪些设计已被广泛认可,目标读者喜欢哪种,与本书定位相符的其他领域图书是如何做的。
这本书其实在和作者在那个加班做PPT的周六就沟通过封面,“南瓜书”项目的南瓜图案,是作者亲手设计的,因此作者希望沿用“南瓜书”项目的设计元素与风格,我很赞同作者的想法,这样不仅可以让读者将电子版与纸质版关联起来,而且与“西瓜书”风格一致,“姐妹花”的印象更深入人心。
尽管设计元素的问题不用愁,封面美编我还是找了我们合作的美编中的“最高”配置,重点书“御用”美编D,从标题的细节以及南瓜排列方式的细节等方面进行设计与优化。
具体落地到真正包裹在图书外边的封面,就涉及产品的包装与实现了。比如封面选什么纸,附什么膜,字体或者图案上是否设置凸起、烫金等工艺。
“南瓜书”在选纸上,虽然是西瓜书的配套教辅角色,因为他的工具属性更强,读者翻阅、记录的时间可能更多,所以要选触感舒服的好纸;并且为了配套,视觉效果不能和西瓜书反差太大,因此最后选择特种纸超级雅顿,涂了一层亚油,字体没有凸起、烫金等工艺,这样封面摸起来很舒服,略带低调的光泽度,没有突兀的标题,仔细看和谐又略显高级。
七、灌溉(定价)
除了营销,一个选题成为一个产品的最后一步就是根据印制部门给出的预算计算图书定价。让它有商品的价格属性,就要在满足一定的成本率基础上去判断定价、首印册数和重印册数。只有合适的定价,读者才愿意买单。这里可以给大家简单分享一下一本书的成本和利润如何计算。
小插曲——定价与预算
①测算成本和利润 总成本=印制费合计+正文排版+封面设计+编辑费+二审+三审+稿酬费 毛利=(定价×册数×折扣0.54)/1.13-总成本 ②比较后确定定价 在ERP系统中,责编可以填入正文/封面用纸、装订方式、三审三校审核字数等以上两个公式涉及的所有信息,然后根据本书与同类书的比较与判断,输入几个定价进行成本的测算。最终责编和分社领导综合考虑成本率等指标,共同决定这本书的定价。
一本书的产品设计,要始终围绕这本书的定位,包括算定价。
尽管“南瓜书”完全从读者学习的角度出发,分享编著者在学习中遇到的“坑”以及跳过这个“坑”的方法,是非常宝贵的经验总结。但是,考虑到面向的读者多为学生和初学者,并且是配套手册,为了将这本书的价值和影响力最大化,认为定价不宜太高,最终确定为49.8元。
八、授粉(营销)
之前也说了,入选重点选题后社里会给相应的营销支撑。“南瓜书”的重点书小团队主要做了哪些营销工作呢?
(1)邀请KOL写序言和封底推荐语,并修改、反馈 (2)制作详情页、写软文。 (3)KOL专享赠书:收集专享书KOL名单;制作专享标签;邮寄。 (4)周志华老师转发微博,技术号持续密集曝光; (5)读书会直播曝光; (6)网店:与西瓜书组套销售;计算机店首页banner资源位置换等。



九、收获(销售及业界认可)
销售情况
印刷量:2.7万册(4次) 发货量:2.35万册 销售量:1.11万册(可监控到的数据) 机器学习榜单位居NO.2(姐姐“西瓜书”《机器学习》NO.1)
与周志华老师的珍贵合影
在BAAI2021北京源智大会上,Datawhale作者团队有幸找到周志华老师合影,并在图书上签名,作为场外的小编我也是兴奋到了极点,特此留下照片以作纪念~~~

小米AI 实验室主任、NLP 首席科学家 王斌 作序推荐
虽然与本书的编著者素不相识、从未谋面,但是看过书稿之后,我便很乐意也感觉很荣幸有机会给这本书写序。
这是一本与众不同的书。
首先,确切地说,这是一本“伴侣书”。类似于咖啡伴侣一样,这本书是周志华教授的“西瓜书”《机器学习》的伴侣书,它也有一个可爱的名字——“南瓜书”。“南瓜书”对“西瓜书”中的公式进行了解析,并补充了必要的推导过程;在推导公式的过程中有时候会需要一些先验知识,编著者也进行了必要的补充。上述做法对学习机器学习时“知其然”并“知其所以然”非常重要。现在能用一些机器学习工具来实现某个任务的人越来越多了,但是具有机器学习思维且了解其原理从而能够解决实际问题的能力在工作中更重要,具有这种能力的人也更具有竞争力。
其次,这是一本通过开源方式多人协作写成的书。这种多人分工合作、互相校验、开放监督的方式,既保证了书的质量,也保证了写作的效率。在我看来,这是一种站在读者角度且非常先进的生产方式,容易给读者带来很好的体验。
最后,我想说这是一本完全根据学习经历编著而成的书。也就是说,这本书完全从读者学习的角度出发,分享编著者在学习中遇到的“坑”以及跳过这个“坑”的方法,这对初学者来说是非常宝贵的经验,也特别能够引起他们的共鸣。其实,每个人在学习一门新的课程时,都会有自己独特的经验和方法。这种经验和方法的共享非常难能可贵。在这里,理解公式便是编著者认为了解机器学习原理的最好方法,其实对于这一点我也深表赞同,因为在学习中我就是那种喜欢推导公式的典型代表,只有公式推导成功,才觉得对知识的原理理解得更深刻,否则总是觉得心里不踏实。
对于本书,我有几点阅读建议,供大家参考。
首先,这本 “南瓜书”要和“西瓜书”配套阅读。如果在阅读“西瓜书”时对公式疑惑或对概念理解不畅,可以通过“南瓜书”快速定位公式并进行推导,从而深入理解。从这个意义来说,“南瓜书”可以看成是“西瓜书”的公式字典。
其次,阅读时一定要克服对公式的排斥或者畏惧心理。公式是通过符号对原理本质的高度概括,是一种精简而美丽的数学语言。推几个公式之后,相信读者会从中感觉到没有体验过的乐趣。
最后,这本书非常偏技术原理,看上去也有点儿枯燥,阅读时读者还是要事先做好克服困难的准备。有时,即使编著者给出了推导过程,读者也不一定一眼就能理解,这就需要自己静下心来仔细研读。只有这样,才有可能成为具有机器学习思维而不只是会用机器学习工具的人。
祝大家阅读愉快!
俞勇、李沐、程明明、陈光、徐亦达5位专家精彩评论
面对一本有很多数学难题的教材,初学者最渴望的是有一位“全能助教”,能帮助详细解析,步进推导,以便更好地消化教材。由开源组织Datawhale 发起编写的“南瓜书”集众人的智慧、开源社区的力量,为广大机器学习初学者带来了福音,给周志华教授的畅销书“西瓜书”配了一个“全能助教”。愿这两本书为所有人工智能领域及行业内求学者、从业者启智增慧,创造未来。 ——俞勇 上海交通大学特聘教授,上海交通大学ACM 班创始人,伯禹教育创始人
推导一遍所有公式是非常好的学习方法,很高兴看到“南瓜书”能专注于此。它是学习“西瓜书”不可缺少的辅助材料。 ——李沐 AWS 资深首席科学家,《动手学深度学习》作者
“南瓜书”是Datawhale 开源团队产出优质内容的一种全新探索。这本书以开源项目的形式,帮助读者推导重要的公式,并对知识难点进行深入探讨。这种新的学习思路和撰写模式,自打开始那一刻,就紧紧抓住读者的需求和痛点,使得这本书成为非常值得推荐的好书。和这本书同样值得推荐的,还有Datawhale 的开源精神和实践精神。 ——程明明 南开大学计算机系主任,开放共享科研记录行动倡议者
这本书是读透“西瓜书”的好“伴侣”。尽管这本书并不适合所有人,但真正需要它的人会觉得它特别有用。它就像一位学霸同桌,可以在你啃“西瓜书”一筹莫展的时候为你“雪中送炭”。对很多人来说,数学公式是一种很可怕的存在,但是学问之美往往就在“最险远处”,披荆斩棘之后方能品出其真滋味。如果想要理解机器学习,而不止步于了解和应用,这本书将是你的好“同桌”——伴你思考,同享“知其所以然”的乐趣。 ——陈光 北京邮电大学副教授,知名博主@ 爱可可- 爱生活
对机器学习初学者来讲,“南瓜书”补充且拓展了数学方面的基本知识,是“西瓜书”的佐读良品。 ——徐亦达 悉尼科技大学副教授,机器学习开源讲义作者
个人感受
种瓜的瓜,种豆得豆。要种南瓜,不仅要有想法,还要有一种“但问耕耘,莫问收获”的精神。
“南瓜书”为我们和Datawhale团队的合作起了一个好头。与一帮年轻有为、富有热情、极具开源精神的同学们合作“种南瓜”的过程是愉快又富有挑战的,这让我真正地体会到开源精神,不仅仅是分享,而且要不断地反馈与迭代。 “种南瓜”还有彩蛋在后,敬请读者们期待。
最后,借用俞勇老师的推荐语:
愿这两本书(“西瓜书”“南瓜书”)为所有人工智能领域及行业内求学者、从业者启智增慧,创造未来。
