张春成

V2

2022/03/14阅读:46主题:默认主题

咬文嚼字

咬文嚼字

我唯一知道的是我什么都不知道。

哲学从本体论退化到认识论, 再退化到现在的语言哲学, 的根本原因是

在语言不恰当的情况下, 我们其实什么也说不清楚。


中文讲究微言大义, 带来了无尽的麻烦。 就比如这个“率”字, 它既可以是“概率”,也可以是“圆周率”,

  • 作概率讲时,与英文“Rate”对应,代表有多大的可能发生;
  • 作圆周率讲时,与英文“Ratio”对应,代表圆的周长与直径之比。

表 1 Rate 和 Ratio 的意义对照表

Parameters of Comparison Rate Ratio
Definition Rate defines the amount of change of one quantity with respect to another quantity. Ratio tells us about the relationship between two quantities.
Dimension Rate has a dimension of one or more. Ratio is dimensionless.
Dependency Usually, the numerator is dependent on the denominator. Usually, both are mutually dependent.
Use Rate is mostly used in science and finance. Ratio is mostly used in science and mathematics.
Variation The numerator usually varies while the denominator has a unit value. Both the numerator and the denominator change if either of them alters the value.

为了说明这个“率”字带来了多大的麻烦, 不妨看下面的例子。

天气预报的“虚警率”

考虑未来7天的天气预报, 对每天是否下雨进行预测, 若预报其中2天有雨, 而实际确实下了2天的雨, 但日期有一天弄错了,

表 2 未来天气预测及观测结果

星期 预测下雨 实际下雨
1 1 0
2 1 1
3 0 1
4 0 0
5 0 0
6 0 0
7 0 0

我们的问题是,

这种预测模型的“误警率”是多少?

这个问题的答案就非常有意思,

一种说法是,

误警率为总警报中假警报所占的比例: FAR = False Alarm Ratio

预测有两天下雨,但其中有一天实际没下雨,属于假警报,因此

另一种说法是,

误警为对于实际无状况的样本,发出错误警报的比例: FAR = False Alarm Rate

实际有五天没有下雨,但其中有一天错误地发出了警报,因此

不难发现,随着受测样本继续增加, 针对“虚警率”的不同解释方法会导致巨大的结果差异, 当实际的0样本数量逼近无穷多时, 这个差异甚至可以逼近统计学中的天文数字,1.0

如何严谨地表达

那么,这个事情就这样放着,没有公论的吗? 当然不是!

这个公论还是有的。 甚至有人专门发了期刊文章来澄清这个事情 (真乃达到了水文章的新境界)

Language 1
Language 1

他们提供了一个十分可行的建议,即

把话说明白

Language 2
Language 2

看来他们也是很烦 Ratio 和 Rate 之间的细微差异。

具体来说, 是将它们转换为更加合适的表达方式

  • Probability of false detection

    它的意思是当模型预测出事件将要发生的1结果时,这个结果是假警报的概率, 中文翻译为“检测错误的概率”;

  • Probability of false alarm

    它的意思是当事件实际上不发生时,模型对这个事件发出假警报的概率, 中文翻译为“假警报的概率”;

你看,这样是不是就特别严谨。

分类:

其他

标签:

其他

作者介绍

张春成
V2