“频数”与“频率”的英文表达:统计学名词翻译之辨析
“频数”与“频率”的英文表达:统计学名词翻译之辨析
开宗明义,在统计学的浩瀚海洋中,即便看似简单的概念,若不细究,也可能暗藏翻译的陷阱。“频数”和“频率”,这两个我们在统计学入门时便接触的概念,其对应的英文术语看似都是“Frequency”,实则不然。恕我直言,这种表面上的统一性,反而容易导致理解和应用上的偏差,不可不察。
正本清源,细致考据
“频数”的英文术语
“频数”,指的是在一次数据集中,某个特定数值或类别出现的次数。在英文中,最常见的对应词汇是 Frequency。例如,在一项调查中,选择“A”选项的人数为20,那么“A”选项的频数就是20。 然而,需要注意的是,在某些语境下,尤其是在描述性统计中,有时也会使用 “count” 来近似表达频数。 但窃以为,使用 “count” 时需要谨慎,因为它更强调“计数”的动作,而非“出现次数”的统计结果。
权威统计学词典如 Kendall's Advanced Theory of Statistics 明确指出,Frequency 指的是特定观测值或类别出现的次数。 而在推论统计中,虽然仍然使用 Frequency 来表示频数,但更多地会与概率分布相关联,例如在卡方检验中,我们比较的是观测频数 (Observed Frequency) 和期望频数 (Expected Frequency)。
“频率”的英文术语
“频率”,则是指某个特定数值或类别出现的次数占总数的比例,也就是我们常说的“相对频数 (Relative Frequency)”。 因此,频率的英文表达,通常是 “Relative Frequency”。 尽管在某些语境下,直接使用 “Frequency” 也可以表示频率,但为了避免歧义,尤其是在严谨的学术写作中,强烈建议使用 “Relative Frequency”。
“Rate” 也可以用来近似表达频率,但 “rate” 通常带有“比率”、“速率”的含义,更适用于描述事件发生的快慢,例如 “birth rate”(出生率)、“mortality rate”(死亡率)。 因此,在统计学语境下,用 “rate” 替代 “frequency” 可能会造成语义上的偏差。
特别关注 “Frequency Distribution”
这里不得不重点强调 “Frequency Distribution” 的翻译问题。 很多人想当然地将其翻译为“频率分布”,这是一种典型的望文生义。 事实上,“Frequency Distribution” 指的是 “频数分布”,它描述的是不同数值或类别及其对应频数的分布情况。 频率分布则更准确地应该翻译为 “Relative Frequency Distribution”。
辨析误用,实例佐证
以下列举几个常见的错误用法,以供参考:
案例一:学术论文
某篇发表在中文期刊上的论文,在描述实验结果时写道:“The frequency of success was significantly higher in group A.” (A组的成功频率显著高于B组)。 恕我直言,这里的 “frequency” 应该修改为 “Relative Frequency” 或者 “success rate”,因为作者实际想表达的是成功率,而非成功次数。
案例二:统计教材
某本国内出版的统计学教材,在讲解频数分布时,将 “Frequency Distribution Table” 翻译为 “频率分布表”。 这种翻译方式容易误导学生,让他们认为表格中显示的是频率,而非频数。 正确的翻译应该是 “频数分布表”。
案例三:数据新闻报道
一篇关于新冠疫情的数据新闻报道,在描述不同年龄段感染人数时写道:“The frequency of infection was highest among the elderly.” (老年人的感染频率最高)。 这里的 “frequency” 略显含糊,更好的表达方式是 “The infection rate was highest among the elderly.” 或者 “The relative frequency of infection was highest among the elderly.”, 这样可以更清晰地表达感染比例的概念。
追根溯源,历史演变
“频数”和“频率”的概念,早在统计学发展的早期就已经出现。 在早期的统计文献中,对于这两个概念的英文表达并没有统一的标准。 有些学者直接使用 “Frequency” 来表示频数和频率,而另一些学者则使用不同的词汇,例如 “incidence” 、“occurrence” 等。 随着统计学的不断发展,以及术语的规范化,最终 “Frequency” 被广泛接受为频数的主要英文表达,而 “Relative Frequency” 则被用来特指频率。
指导建议,避免踩坑
为了避免在使用 “频数” 和 “频率” 的英文术语时出现错误,我给各位中国学生、学者和统计工作者以下几点建议:
- 明确概念: 彻底理解频数和频率的定义,以及它们之间的区别。
- 选择合适的术语: 在表达频数时,优先使用 “Frequency”,但在需要强调“相对”的概念时,务必使用 “Relative Frequency”。
- 注意上下文: 根据具体的语境,选择最合适的表达方式。 如果语境中已经明确了是比例关系,那么可以直接使用 “Frequency”,否则建议使用 “Relative Frequency”。
- 查阅权威资料: 在进行学术写作或翻译时,务必查阅权威的统计学词典或教科书,例如 Statistical Methods by George W. Snedecor and William G. Cochran, 确保术语使用的准确性。
警惕陷阱,批判思维
即使是经验丰富的专业人士,也可能在使用 “频数” 和 “频率” 的英文术语时出现错误。 因此,我们必须保持批判性思维,仔细甄别,避免盲从。 切不可因为某个术语被广泛使用,就认为它是正确的。 要深入思考其背后的含义,并结合具体的语境进行判断。
结尾总结,升华主题
区分 “频数” 和 “频率” 的英文表达,看似是一个微不足道的问题,实则关系到统计学研究的严谨性和准确性。 避免术语的混淆,才能更好地理解和应用统计学知识。 我呼吁统计学界加强术语规范,避免不必要的混淆,为统计学的发展创造更加良好的学术环境。
思考题
在机器学习领域, “Frequency” 的使用是否与传统统计学有所不同? 为什么?