矫情的译者+糟糕的翻译：说说王星翻译的《统计学习导论：基于R应用》

大黄蜂95号 2021-01-19 17:48:09

"标题："矫情的译者+糟糕的翻译：说说王星翻译的《统计学习导论：基于R应用》

机器学习领域的小白，同学推荐了几本书，这本看了前两章，翻译得真心不行，关键译者还很矫情，真有吃了苍蝇一般的感觉。

==========

译者王星在《译者序》中说道：（老早就想翻译一本机器学习的书）“这次翻译弥补了多年的遗憾”，又云“我和我的团队牺牲了多半年的...宝贵时间”。

译者这番话想表达几个意思？

关键译者团队翻译得也不行啊，我这小白看了都不爽，这让真正的专家情何以堪。

再次感叹国内的教师群体中混混真多，混混也就算了，关键还不要脸。

举几个例子。

===========

P3，第三段

王星：“[在第10章将重点关注先天缺乏输出变量问题的统计学习方法。】将以NCI60（基因表达）数据集为例，其中包含了64个癌症细胞系6830个基因表达测量数据......每个细胞系上有成千上万的基因表达测量信息...。。

原文：We consider the NCI60 data set, which consists of 6,830 gene expression measurements for each of 64 cancer cell lines. ..... there are thousands of gene expression measurements per cell line,

点评：译者王星在前文刚说完“64个癌症细胞系6830个基因表达测量数据”，后文又说“每个细胞系上有成千上万的基因表达测量信息”。

这明显矛盾，明显不对啊。

原来真正的意思是“n=64, p=6,830"，也就是说一共有64个细胞系，每个细胞系有6,830个变量。

这样一来，王星翻译的“每个细胞系上有成千上万的基因表达测量信息”这句，也是瞎扯，哪里来的”上万“？把 thousands of 翻译为“成千上万”，明显是脱离了上下文的翻译。

============

P3，第四段

王星：这两个变量是数据中的前两个主成分，综合了各个细胞系6,830个基因表达测量信息。虽然降维可能导致部分信息损失......

原文：These are the first two principal components of the data, which summarize the 6, 830 expression measurements for each cell line down to two numbers or dimensions. While it is likely that this dimension reduction has resulted in some loss of information.....

点评：译者漏译了“前两个主成分把......降低为两个维度”。添上这句以后，后文中的“降维”意思更加明显。 ============

P4，第二段

王星：图1-4右图数据的表示与左图同理.....

原文： The right-hand panel of Figure 1.4 is identical to the left-hand panel, except that the 14 cancer types are shown using distinct colored symbols.

点评：真正的意思是这两个图相同，只不过右图换了一种表示方式。

=========

P4，第二段，最后一行

王星：这个例子反应出聚类分析区别于有指导方法逼近真实的分析能力。

原文： This provides some independent verification of the accuracy of our clustering analysis.

点评：如果不看原文，谁能看懂王星的译文？此文只应天上有。

=====

我就纳闷了，王星团队整出这样的垃圾，不怕同事和同学们笑话吗？

矫情的译者+糟糕的翻译：说说王星翻译的《统计学习...

最新讨论 · · · · · · (全部)