算术平均和几何平均

摘要 · Agent Fox

这篇笔记通过一个三台机器运行两个程序的性能对比案例,清晰地展示了算术平均与几何平均在处理归一化数据时的关键差异。作者重点分析了不同基准选择下两种平均值的表现,揭示了几何平均在跨基准比较时的一致性优势。

初始数据

我们有三台机器(机器A、机器B、机器C),它们运行两个程序(P1、P2),原始执行时间如下:

程序机器A执行时间机器B执行时间机器C执行时间
P11秒10秒20秒
P21000秒100秒20秒

使用机器A作为基准

归一化时间计算

如果我们选择机器A作为基准,那么归一化后的执行时间将是:

程序机器A执行时间机器B执行时间机器C执行时间机器B的归一化时间机器C的归一化时间
P11秒10秒20秒10 / 1 = 1020 / 1 = 20
P21000秒100秒20秒100 / 1000 = 0.120 / 1000 = 0.02

平均计算

  • 算术平均Arithmetic Mean of Normalized Time (Machine B)=10+0.12=10.12=5.05 Arithmetic Mean of Normalized Time (Machine C)=20+0.022=20.022=10.01
  • 几何平均Geometric Mean of Normalized Time (Machine B)=10×0.1=1=1.0 Geometric Mean of Normalized Time (Machine C)=20×0.02=0.40.63

使用机器B作为基准

归一化时间计算

如果我们选择机器B作为基准,那么归一化后的执行时间将是:

程序机器A执行时间机器B执行时间机器C执行时间机器A的归一化时间机器C的归一化时间
P11秒10秒20秒1 / 10 = 0.120 / 10 = 2
P21000秒100秒20秒1000 / 100 = 1020 / 100 = 0.2

平均计算

  • 算术平均Arithmetic Mean of Normalized Time (Machine A)=0.1+102=10.12=5.0 Arithmetic Mean of Normalized Time (Machine C)=2+0.22=2.22=1.1
  • 几何平均Geometric Mean of Normalized Time (Machine A)=0.1×10=1=1.0 Geometric Mean of Normalized Time (Machine C)=2×0.2=0.40.63

使用机器C作为基准

归一化时间计算

如果我们选择机器C作为基准,那么归一化后的执行时间将是:

程序机器A执行时间机器B执行时间机器C执行时间机器A的归一化时间机器B的归一化时间
P11秒10秒20秒1 / 20 = 0.0510 / 20 = 0.5
P21000秒100秒20秒1000 / 20 = 50100 / 20 = 5

平均计算

  • 算术平均Arithmetic Mean of Normalized Time (Machine A)=0.05+502=50.052=25.025 Arithmetic Mean of Normalized Time (Machine B)=0.5+52=5.52=2.75
  • 几何平均Geometric Mean of Normalized Time (Machine A)=0.05×50=2.51.58 Geometric Mean of Normalized Time (Machine B)=0.5×5=2.51.58

重点解释

几何平均的一致性

我们可以看到,无论我们选择哪一台机器作为基准,几何平均值总是能够给出一个相对稳定的度量。具体对比数据如下:

  • 机器B的几何平均值
  • 以机器A为基准:( 1.0 )
  • 以机器B为基准:( 0.63 )
  • 以机器C为基准:( 1.58 )
  • 机器C的几何平均值
  • 以机器A为基准:( 0.63 )
  • 以机器B为基准:( 0.63 )
  • 以机器C为基准:( 1.58 )

算术平均的敏感性

算术平均的敏感性体现在当基准变化时,算术平均的结果会发生较大变动。具体对比数据如下:

  • 机器B的算术平均值
  • 以机器A为基准:( 5.05 )
  • 以机器B为基准:( 1.1 )
  • 以机器C为基准:( 2.75 )
  • 机器C的算术平均值
  • 以机器A为基准:( 10.01 )
  • 以机器B为基准:( 1.1 )
  • 以机器C为基准:( 25.025 )

总结

通过对比数据可以看出:

  1. 几何平均的一致性:无论选择哪台机器作为基准,几何平均值的变化较小,反映了不同机器之间相对稳定的性能比较。
  2. 算术平均的敏感性:当基准变化时,算术平均值会有较大的变化,这说明算术平均容易受到极端值的影响,并且不如几何平均稳定。

因此,在评估不同机器的相对性能时,几何平均提供了一个更一致、更可靠的度量方法。

有话这里说 ↓