如何训练“冷门歌手”唱歌——全靠机器学习技术
网络上有一位被“00后”称为“冷门歌手”的女歌手——孙燕姿,她曾是很多“80后”“90后”的青春回忆或童年回忆。今年,网友们用AI训练出歌手孙燕姿的声音,让“AI孙燕姿”翻唱各种经典曲目,比如2003年在最佳新人奖的争夺中输给她的周杰伦的《发如雪》(播放量破百万)、《爱在西元前》等,比如《安河桥》《那些花儿》《漠河舞厅》《向天再借500年》《好汉歌》等风格各异的歌曲,一时火爆全网。
成就“AI孙燕姿”的技术,正是“机器学习”。《动手学机器学习》开门见山地点明人工智能有两类任务,一是“预测”,一是“决策”;并指出人工智能有四大技术,搜索——比如“阿尔法狗”(AlphaGo)在数据库中搜索围棋路数大败人类选手(柯洁无奈哭唧唧),推理——比如ChatGPT在组合已有信息的基础上进行推理作答,学习——比如训练声音、训练绘画工具等机器学习项目,博弈——比如桥牌对战等多个智能体的交互。机器学习和人工智能关系可以概括为它是支撑人工智能的关键技术,其中服务于预测任务的称为“机器学习技术”,而支撑决策任务的一类学习技术称为“强化学习技术”。看完第一章,便能够比较清晰地了解机器学习的概貌。
《动手学机器学习》分为四部分,即机器学习基础、参数化模型、非参数化模型、无监督模型,由浅入深,清晰好读。因为机器学习的基础是数理统计,所以除了上述第一章的概貌介绍,其他各章都有很多数理模型,可供想要自建AI训练模型的爱好者一步步学习和操练。
其中很有意思的一点是监督学习和无监督学习的算法差异,很多网页或者App都要求验证操作者是个“活人”,而不是随意踩键盘的汪星人或喵星人,原因就在于“监督学习只关心基于数据特征对标签的预测是否准确”,如它要识别的“人脸”是否和数据库中的一致,哪怕带个面具让它识别为一致也是可行的;“无监督学习则关注数据的分布与其中包含的模式”,以算法区分给定的对象是否包含一张真实的人脸,甚至生成一张新的人像。
另外,这本书除了有技术思考,还有丰富的学习包——配套的源代码、PPT和解说视频,是一本不错的技术操练手册。PPT是作者之一的张伟楠老师在上海交通大学讲授的“机器学习”课程,不知道交大帅哥庞博有没有上过这位老师的课呢,有的话也算是咱们读者和帅哥共续一段缘吧。