# 误差的基本性质

\quad 所谓误差就是测得值与被测量的真值之间的差,可用以下形势表示:

误差=测量值真值(1.1.1)误差=测量值-真值 \tag{1.1.1}

下面我们将介绍误差的两种表示形式,以及三种误差分类。

图1

# 误差的两种表示形式

# 绝对误差

\quad 绝对误差,它是某量值的测得值和真值之差。我们通常称的误差一般就是绝对误差。他表示为即:

ΔL=LL0(1.1.2)\Delta L = L-L_{0} \tag{1.1.2}

其中 δL\delta L 表示绝对误差,LL 表示测量值,L0L_0 表示真值。
\quad 绝对误差的特点为:

  • 绝对误差是一个具有确定的大小、符号及单位的量。
  • 单位给出了被测量的量纲,其单位与测得值相同。

# 相对误差

\quad 相对误差,它是绝对误差与被测量真值之比,即:

r=ΔLL0(1.1.3)r = \frac{\Delta L}{L_{0}} \tag{1.1.3}

相对误差的特点是:

  • 相对误差有大小和符号。
  • 无量纲,一般用百分数来表示。

# 误差的分类

# 系统误差

\quad 在同一条件下,多次测量同一量值时,绝对值和符号保持不变,或在条件改变时,按一定规律变化的误差称之为系统误差(Systematic Error)。由于系统误差具有一定的规律性性,因此可以根据其产生原因,采取一定的技术措施,设法消除或减小。举几个例子:

  • 用天平计量物体质量时,砝码的质量偏差。
  • 刻线尺的温度变化引起的示值误差。
  • 在离子频标中所讨论的对不确定度影响的那几个因素,例如二阶 Doppler 频移、DC Stark 频移、AC Stark 频移、Zeeman 频移、电四极频移、黑体辐射频移、引力红移等,其实都是系统误差。

# 随机误差

\quad 在相同测量条件下,多次测量同一量值时,绝对值和符号以不可预定方式变化的误差称之为随机误差(Random Error)。例如仪器仪表中传动部件的间隙和摩擦、连接件的弹性形变等引起的示值不稳定等。
\quad 大量的重复测量可以发现,它是遵循某种统计规律的。因此,可以用概率统计的方法处理含有随机误差的数据,对随机误差的总体大小及分布做出估计,并采取适当措施减小随机误差对测量结果的影响。

# 粗大误差

\quad 超出在规定条件下预期的误差称为粗大误差(Gross Error)。此误差值较大,明显歪曲测量结果,一般是某些偶尔突发性的异常因素或疏忽所致。故应按照一定的准则进行判别,将含有粗大误差的测量数据(称为坏值或异常值)予以剔除。

# 三类误差的关系及其对测得值的影响

  • 系统误差和随机误差的定义是科学严谨,不能混淆的。
  • 但在测量实践中,由于误差划分的人为性和条件性,使得他们并不是一成不变的,在一定条件下可以相互转化。
  • 一个具体误差究竟属于哪一类,应根据所考察的实际问题和具体条件,经分析和实验后确定。

\quad 下面这幅图可以描述三种误差的区别。
图2
\quad 这里要提示一下,期望值与均值是有区别的。
\quad 均值是针对实验观察到的特征样本而言的,比如说我们进行掷骰子,掷了六次,点数分别为 2,2,2,4,4,4,那么对于这六次观察样本来说,均值为 (2+2+2+4+4+4)/6=3(2+2+2+4+4+4)/6=3
\quad 而期望值是针对随机变量而言的一个量,可以理解是一种站在 “上帝视角” 的值。可以先给出期望值的定义:

\quad 离散型随机变量 xx 的取值为 x1x_1x2x_2x3x_3\cdotsxnx_n,它们对于的概率为 p(x1)p(x_1)p(x2)p(x_2)p(x3)p(x_3)\cdotsp(xn)p(x_n),则该离散型随机变量的期望值为:

E(x)=x1p(x1)+x2p(x2)+x3p(x3)++xnp(xn)E(x)=x_1\cdot p(x_1) + x_2\cdot p(x_2) + x_3\cdot p(x_3) + \cdots + x_n\cdot p(x_n)

那么上面这个掷骰子的例子对应的期望值应该是:

E(X)=1×16+2×16+3×16+4×16+5×16+6×16=3.5(1.1.4)E(X) = 1\times\frac{1}{6} + 2\times\frac{1}{6} + 3\times\frac{1}{6} + 4\times\frac{1}{6} + 5\times\frac{1}{6} + 6\times\frac{1}{6} = 3.5 \tag{1.1.4}

所以,我觉得,可以将期望值理解为真值,均值理解为测量的均值。一些情况下,例如不存在系统误差的理想情况下,测量次数足够多,均值是可以收敛为期望值的。

# 误差与精度

\quad 反映测量结果与真值接近程度的量,通常称为精度,它与误差的大小相对应,因此可用误差大小来表示精度的高低。精度可分为:

  1. 准确度(Correctness):它反映测量结果中系统误差的影响程度。
  2. 精密度(Precision):它反映测量结果中随机误差的影响程度。
  3. 精确度(Accuracy):它表示测量结果与被测量真值之间的一致程度。就误差分析而言,精确度是测量结果中系统误差和随机误差的综合,误差越大,精确度越低,误差越小,则精确度越高。

\quad 下图是一副很经典的图片,反映了准确的、精密度和精确度三者之间的关系。

图3

上图所示的打靶结果,子弹落在靶心周围有三种情况。图 (a)(a) 的弹着点全部在靶
上,但分散。相当于系统误差小而随机误差大,即精密度低,准确度高;图 (b)(b) 的弹着点集中,但偏向一方,命中率不高。相当于系统误差大而随机误差小,即精密度高,准确度低;图 (c)(c) 的弹着点集中靶心。相当于系统误差与随机误差均小,即精密度、准确度都高,从而精确度高。

# 有效数字与数字舍入

# 有效数字的保留

\quad 一般来说,在测量结果中,最末一位有效数字取到哪一位,是由测量精度来决定的,即最末一位有效数字应与测量精度是同一量级的。例如用千分尺测量时,其测量精度只能达到 0.01mm0.01\mathrm{~mm},若测出长度 L=20.531nmL=20.531\mathrm{~nm},那么测量结果应写为 (20.54±0.01)mm(20.54\pm0.01)\mathrm{~mm}
\quad 在一些重要的测量时,测量结果和测量误差可比测量精度再多取一位数字作为参考。例如在某个测量精度为 0.010.01 的仪器上进行多次测量,若最终多次测量的平均值为 15.21412332115.214123321,标准差为 0.42111110.4211111。那么我们最终的测量结果可以表示为 15.214±0.04215.214\pm0.042

# 数字的舍入规则

\quad 对于位数很大的近似数,当有效位数确定后,其后面多余的数字应予舍去,而保留的有效数字最后一位数字应有一定的规则。从小学开始,老师就教授我们了一个方法,叫做四舍五入。但这种方法在精密测量领域中并不好用,这是因为在大量运算时,四舍五入这种 “见 5 就入” 的方法会导致出现系统误差,即舍入误差的均值不趋于零。下面就介绍另一种舍入规则:

  1. 若舍去部分的数值大于保留部分的末位的半个单位,则末位加 1。
  2. 若舍去部分的数值小于保留部分的末位的半个单位,则末位不变。
  3. 若舍去部分的数值等于保留部分的末位的半个单位,则保留部分的末位凑成偶数。即当保留部位的末位为偶数时则不变,若为奇数则末位加 1。

\quad 以上述的舍入规则举几个例子:

原有数据舍入后数据
3.141593.142
2.713492.713
3.215503.216
6.378506.378
5.430505.430

该舍入规则的第三条,被舍去的数字不是 “见 5 就入”,从而使舍入误差称为随机误差,在大量运算时,其舍入误差的均值就趋于零了。

# 随机误差

\quad 当对同一量值进行多次等精度的重复测量时,得到一系列不同的测量值(常称为测量列),每个测量值都含有误差,这些误差的出现又没有确定的规律,却具有统计的规律性,这种往往是随机误差。在这一节中,将来具体学习随机误差的一些处理方法。

# 正态分布

\quad 正态分布在误差理论中占有十分重要的地位,这是因为多数随机误差都服从正态分布。
\quad 正态分布的分布密度函数 f(δ)f(\delta) 为:

f(δ)=1σ2πeδ22σ2(1.2.1)f(\delta) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{\delta^2}{2\sigma^2}} \tag{1.2.1}

xx 是测量值,μ\mu 为测量总体的数学期望,如果不计系统误差和粗大误差,则 δ=xμ\delta=x-\mu 为随机误差。
\quad 正态分布的方差为 σ2\sigma^2,而标准差则为 σ\sigma,这是因为:

σ2=δ2f(δ)dδ(1.2.2)\sigma^2 = \int^\infin_{-\infin} \delta^2 f(\delta)\ d\delta \tag{1.2.2}

\quad 另外值得一提的是,我们常说一些光斑的强度分布服从高斯分布,或者离子阱中看到的离子成像满足高斯分布,其实高斯分布就是正态分布。

# 算术平均值

\quad 在系列测量中,被测量的 nn 个测得值的代数和除以 nn 而得的值称为算术平均值。例如,设 l1l_1l2l_2\cdotslnl_nnn 次测量所得的值,则算术平均值 xˉ\bar{x} 为:

xˉ=i=1nlin(1.2.3)\bar{x} = \frac{\sum_{i=1}^nl_i}{n} \tag{1.2.3}

若不存在系统误差和粗大误差,则根据概率论的大数定律可知,当测量次数无限增加时,算术平均值必然趋于真值。

# 测量列中单次测量的标准差

\quad 由于随机误差的存在,一次等精度测量列中各个测量值一般皆不相等,它们围绕着该测量列的算术平均值有一定的分散,此这种分散度暗含着该测量列中单次测量的不可靠性,必须用一个数值作为其不可靠性的评定标准。我们常用的就是标准差 σ\sigma,又称方均根误差
\quad 标准差 σ\sigma 不是测量列中任何一个具体测得值的随机误差,σ\sigma 的大小只说明一定条件下等精度测量列随机误差的概率分布情况。如下图所示,标准差 σ\sigma 的数值越小,该测量列相应小的误差占优势,任一单次测得值对算术平均值的分散度就小,测量的可靠性就大,即测量精度高;反之,测量精度就低。

图4

\quad 在等精度测量列中,单次测量的标准差按下式计算:

σ=δ12+δ22++δn2n=i=1nδn2n(1.2.4)\sigma = \sqrt{\frac{\delta_1^2+\delta_2^2+\cdots+\delta_n^2}{n}} = \sqrt{\frac{\sum_{i=1}^n\delta^2_n}{n}} \tag{1.2.4}

上式中,nn 为测量次数(应该充分大);δi\delta_i 是某次测量值与真值(测量总体的数学期望值)之差,即 δi=LiLo\delta_i=L_i-L_o

\quad 但一般来说,被测值的真值一般是未知的,无法按照 (1.2.4)(1.2.4) 式求得标准差。实际上,在有限次测量情况下,可用残余误差 νi\nu_i 代替真误差,从而求得标准差的估计值。先做明确的符号说明,进行一次等精度的 nn 次测量:

δi=LiL0(1.2.5)\delta_i = L_i-L_0 \tag{1.2.5}

νi=LiLˉ(1.2.6)\nu_i = L_i-\bar{L} \tag{1.2.6}

δˉ=i=1nδin=LˉL0(1.2.7)\bar{\delta} = \frac{\sum_{i=1}^n \delta_i}{n} = \bar{L}-L_0 \tag{1.2.7}

其中 δi\delta_i 是测量值的真误差,L0L_0 是真值(或者可认为是测量总体的期望值);νi\nu_i 是测量值的残余误差,简称残差,Lˉ\bar{L} 是一次等精度测量列的算术平均值;δˉ\bar{\delta} 称为算术平均值的误差,是该测量列的算术平均值与真值之差。
\quad 下面我们就来具体推导如何用残差来估计测量列的标准差。首先利用上三式可得:

{δ1=l1L0=l1Lˉ+LˉL0=ν1+δˉδ2=l2L0=l2Lˉ+LˉL0=ν2+δˉδn=lnL0=lnLˉ+LˉL0=νn+δˉ(1.2.8)\begin{cases} \delta_1 = l_1-L_0 = l_1 - \bar{L} + \bar{L} - L_0 = \nu_1+\bar{\delta} \\ \delta_2 = l_2-L_0 = l_2 - \bar{L} + \bar{L} - L_0 = \nu_2+\bar{\delta} \\ \vdots \\ \delta_n = l_n-L_0 = l_n - \bar{L} + \bar{L} - L_0 = \nu_n+\bar{\delta} \end{cases} \tag{1.2.8}

(1.2.8)(1.2.8) 式的每一项相加可得:

i=1nδi=i=1nνi+nδˉδˉ=i=1nδini=1nνin=i=1nδin(1.2.9)\sum_{i=1}^n \delta_i = \sum_{i=1}^n \nu_i + n\bar{\delta} \\ \ \\ \begin{aligned} \Longrightarrow \bar{\delta} = \frac{\sum\limits_{i=1}^n \delta_i}{n} - \frac{\sum\limits_{i=1}^n \nu_i}{n} = \frac{\sum\limits_{i=1}^n \delta_i}{n} \tag{1.2.9} \end{aligned}

我们在将 (1.2.8)(1.2.8) 式的每一项平方相加可得:

i=1nδi2=i=1nνi2+nδˉ2+2δˉi=1nνi=i=1nνi2+nδˉ2(1.2.10)\sum_{i=1}^n \delta_i^2 = \sum_{i=1}^n \nu_i^2 + n\bar{\delta}^2 + 2\bar{\delta}\sum_{i=1}^n \nu_i = \sum_{i=1}^n \nu_i^2 + n\bar{\delta}^2 \tag{1.2.10}

上两式均利用到了 i=1nνi=0\sum_{i=1}^n \nu_i=0 的特点。我们再将 (1.2.9)(1.2.9) 式平方有:

δˉ2=[i=1nδin]2=i=1nδi2n2+21i<jnδiδjn2且没有系统误差n适当大时i=1nδi2n2(1.2.11)\bar{\delta}^2 = \left[\frac{\sum\limits_{i=1}^n \delta_i}{n}\right]^2 = \frac{\sum\limits_{i=1}^n\delta_i^2}{n^2} + \frac{2\sum\limits_{1\le i < j}^n \delta_i\delta_j}{n^2} \xrightarrow[且没有系统误差]{当n适当大时} \frac{\sum\limits_{i=1}^n\delta_i^2}{n^2} \tag{1.2.11}

其中,由于一般随机误差的正负是对称且随机的,比如说正态分布的随机误差,所以当不存在随机误差且 nn 适当大时,可认为 2i=1nδiδjn2\frac{2\sum\limits_{i=1}^n \delta_i\delta_j}{n^2} 趋近于零,从而使得 1i<jnδiδj\sum\limits_{1\le i < j}^n \delta_i\delta_j 趋于零。我们不妨将 (1.2.11)(1.2.11) 式的最后一项写成一个小量,用 O\mathcal{O} 来表示,即:

δˉ2=i=1nδi2n2+O(1.2.12)\bar{\delta}^2 = \frac{\sum\limits_{i=1}^n\delta_i^2}{n^2} + \mathcal{O} \tag{1.2.12}

利用 (1.2.10)(1.2.10) 式,将 δˉ2\bar{\delta}^2 代入 (1.2.12)(1.2.12) 式可得:

i=1nδi2i=1nνi2=i=1nδi2n+nO(1.2.13)\sum_{i=1}^n\delta_i^2-\sum_{i=1}^n\nu_i^2 = \frac{\sum\limits_{i=1}^n\delta_i^2}{n} + n\mathcal{O} \tag{1.2.13}

再利用 (1.2.4)(1.2.4) 式的标准差 σ\sigma 定义,可将上式化为:

nσ2i=1nνi2=σ2+nOσ=i=1nνi2n1+nn1O(1.2.14)n\sigma^2 - \sum_{i=1}^n\nu_i^2 = \sigma^2 + n\mathcal{O}\\ \begin{array}{c} \\ \Longrightarrow \sigma = \sqrt{\frac{\sum_{i=1}\limits^n\nu_i^2}{n-1}+\frac{n}{n-1}\mathcal{O}} \tag{1.2.14} \end{array}

由于 O\mathcal{O} 在不存在系统误差(或者系统误差很小),测量次数 nn 足够大时趋于零,因此,根据上式,我们便可得到用残差求单次测量的标准差的估计值:

s=i=1nνi2n1σ(1.2.15)s = \sqrt{\frac{\sum_{i=1}\limits^n\nu_i^2}{n-1}} \approx\sigma \tag{1.2.15}

该式称为贝塞尔(Bessel)公式

\quad 关于 (1.2.4)(1.2.15)(1.2.4)(1.2.15) 式有一个更规范的说法。对一列有限次 nn 个测量值,应视为测量总体的取样。关于 (1.2.4)(1.2.4) 式计算的标准差应该称为总体标准差,用 σ\sigma 表示,它其实代表着测量值与总体测量量真值的分散度;(1.2.15)(1.2.15) 式计算的标准差应该称为样本标准差,在一些文献会把它写作 ss,以此区分总体标准差 σ\sigma。虽说要以此区分,但正如上两式所看到的,在 O\mathcal{O} 趋于零时,ss 可以作为 σ\sigma 的估计量,而这也是在不知道真值是,评价测量随机误差的一个常用方法。
\quad 有一个大一时我就纠结的问题,为什么用贝塞尔公式的分母是 n1n-1,而不是 nn 或者是 n2n-2n3n-3 之类的呢?看了看网上一些回答,结合我的思考,我想给出一个很不严谨,但还是能勉强接受的解释。首先是从数学推导上看,上面一路推导下来大概是没什么问题的。通过 (1.2.15)(1.2.15) 式,我们看看如果贝塞尔公式中分母是 nn 那会出现什么:

i=1nνi2n<σi=1nνi2n1<i=1nνi2n2(1.2.16)\sqrt{\frac{\sum_{i=1}\limits^n\nu_i^2}{n}} < \sigma \approx \sqrt{\frac{\sum_{i=1}\limits^n\nu_i^2}{n-1}} < \sqrt{\frac{\sum_{i=1}\limits^n\nu_i^2}{n-2}} \tag{1.2.16}

可见,若贝塞尔公式中的分母是 nn,那么在不知道随机变量真实值的前提下,将会导致估计的标准差偏低。而将分母 nn 换成 n1n-1,实际上就是修正这种偏差的一个方法。若分母是 n2n-2 就修正过头了,当然我们没有任何理由或者是想把分母写为 n2n-2 的想法。
\quad 可以更加直观地理解一下,为什么是 n1n-1 呢?如果是 (1.2.4)(1.2.4) 的总体标准差 σ\sigma,那么数据的自由度为 nn,即 nn 个测量值,这样的话分母是 nn 不能理解。但若是 (1.2.15)(1.2.15) 式的样本标准差,那么里面的 Lˉ\bar{L} 实际上偷走了一个自由度,导致自由度只有 n1n-1,所以如果用直观的物理直觉也就不难理解为什么分母是 n1n-1 了。总的来说,当我们用 Lˉ\bar{L} 代替 L0L_0 的过程中,我们不知不觉地损失了一个自由度

# 测量列中算术平均值的标准差

\quad 上一小节中,我们讨论的某测量列中单次测量的标准差。但作为测量的结果,我们肯定不是以测量列中某一次测量值作为测量结果,而是以算术平均值作为测量结果。那么我们最终写在实验报告上的测量结果为 “测量列的算术平均值 ± 测量列中单次测量的标准差” 是否合理呢?答案当然是不合理的。如果在相同条件下对同一个测量值进行多组重复的系列测量,每一给测量列都有一个算术平均值,由于随机误差的存在,各个测量列的算术平均值也不相同,它们围绕着被测量的真值有一定的分散。与单次测量一样,此分散说明了算术平均值的不可靠性,所有我们同样需要一个算术平均值的标准差 σxˉ\sigma_{\bar{x}} 来表征同一被测值的各个独立测量列算术平均值的分散性。
\quad 那么我们来看看,测量列算术平均值的标准差如何求得。考虑一个 nn 次等精度测量列的算术平均值为:

xˉ=l1+l2++lnn(1.2.17)\bar{x} = \frac{l_1+l_2+\cdots+l_n}{n} \tag{1.2.17}

还记得大一时学得概统吗,方差用 D(x)D(x) 来表示,其满足:

{D(ax)=a2D(x)D(x1+x2)=D(x1)+D(x2)(1.2.18)\begin{cases} D(ax) = a^2D(x) \\ D(x_1+x_2) = D(x_1)+D(x_2) \end{cases} \tag{1.2.18}

因此测量列算术平均值取方差为:

D(xˉ)=1n2[D(l1)+D(l2)+D(ln)](1.2.19)D(\bar{x}) = \frac{1}{n^2}\left[D(l_1)+D(l_2)+\cdots D(l_n)\right] \tag{1.2.19}

因为是等精度测量,测量列中每个单次测量的方差(标准差)都是相同的,即:

D(l1)=D(l2)=D(ln)=σ2(1.2.20)D(l_1) = D(l_2) = \cdots D(l_n) = \sigma^2 \tag{1.2.20}

故有:

σxˉ2=D(xˉ)=σ2n(1.2.21)\sigma_{\bar{x}}^2 = D(\bar{x}) = \frac{\sigma^2}{n} \tag{1.2.21}

因此,测量列算术平均值的标准差与测量列单次测量的标准差关系为:

σxˉ=σn(1.2.22)\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}} \tag{1.2.22}

\quad 由上式可知,在 nn 次测量的等精度测量列中,算术平均值的标准差为单次测量标准差的 1/n1/\sqrt{n},当测量次数越大时,算术平均值越接近被测量的真值(当然是假设没有系统误差的情况),测量精度也越高。从图 55 的两图中也能明显地看出,当取多个测量值做平均时,此时的分散性确实明显减小了。

图5.1
图5.2

\quad 既然随着测次数的增加,可以提高测量精度,那么是不是我测量次数越多越好呢?其实不然,由 (1.2.22)(1.2.22) 式可知,测量精度与测量次数的平方根成反比,因此要显著提高测量精度,必须付出较大的劳动力。当 σ\sigma 一定时,当 n>10n>10 以后,σxˉ\sigma_{\bar{x}} 已经减小得非常缓慢了。此外,由于测量次数越大时,也越难保证测量条件的恒定,从而带来新的误差,因此一般情况下取 n10n\le 10 较为适宜。

图6

\quad 下面给一个简单的例题:

例题:用游标卡尺对某一尺寸测量 10 次,假定已经消除系统误差和粗大误差,得到的数据如下(单位为 mm\mathrm{mm}):

求测量列的单次测量标准差和算术平均值标准差。

\quad :先用贝塞尔公式估计单次测量的标准差:

σ=i=1nνi2n1=0.00825101mm=0.0303mm(1.2.23)\sigma = \sqrt{\frac{\sum\limits_{i=1}^n\nu_i^2}{n-1}} = \sqrt{\frac{0.00825}{10-1}} \mathrm{~mm} = 0.0303\mathrm{~mm} \tag{1.2.23}

再计算测量列的算术平均值标准差:

σxˉ=σn=0.030310mm=0.0096mm(1.2.24)\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}} = \frac{0.0303}{\sqrt{10}} \mathrm{~mm} = 0.0096\mathrm{~mm} \tag{1.2.24}

# 测量的极限误差

\quad 超过极限误差的测量值我们认为是几乎是不可能出现的。这一小节就来学习一下,我们怎么来标定测量结果(单次测量或测量列的算术平均值)的极限误差。

# 单次测量的极限误差

\quad 求单次测量的极限误差的前提条件是:测量列的测量次数足够多,且单次测量误差为正态分布。若满足以上两点,那么由概率积分知识可知,随机误差在 δ-\delta+δ+\delta 范围内的概率为:

P(δδ)=1σ2πδ+δeδ22σ2dδ=2σ2π0+δeδ22σ2dδ(1.2.25)P(-\delta\sim\delta) = \frac{1}{\sigma\sqrt{2\pi}}\int^{+\delta}_{-\delta} e^{-\frac{\delta^2}{2\sigma^2}}\ d\delta = \frac{2}{\sigma\sqrt{2\pi}}\int^{+\delta}_{0} e^{-\frac{\delta^2}{2\sigma^2}}\ d\delta \tag{1.2.25}

为了方便讨论,人们引入新的变量 tt

t=δσ,δ=tσ(1.2.26)t = \frac{\delta}{\sigma},\quad\delta=t\sigma \tag{1.2.26}

变换,将 (1.2.25)(1.2.25) 式化为:

P(δδ)=2σ2π0tσet22d(tσ)=22π0tet22dt(1.2.27)P(-\delta\sim\delta) = \frac{2}{\sigma\sqrt{2\pi}}\int^{t\sigma}_0 e^{-\frac{t^2}{2}}\ d(t\sigma) = \frac{2}{\sqrt{2\pi}}\int^{t}_0 e^{-\frac{t^2}{2}}\ dt \tag{1.2.27}

再引入正态分布概率积分函数 Φ(t)\Phi(t)

Φ(t)=12π0tet22dt(1.2.28)\Phi(t) = \frac{1}{\sqrt{2\pi}}\int^{t}_0 e^{-\frac{t^2}{2}}\ dt \tag{1.2.28}

便可将 (1.2.27)(1.2.27) 式化为:

P(δδ)=2Φ(t)(1.2.28)P(-\delta\sim\delta) = 2\Phi(t) \tag{1.2.28}

因此,若我们要想知道误差在 tσ+tσ-t\sigma\sim+t\sigma 范围内的概率是多数,我们只需要查询正态分布积分表,找到不同 ttΦ(t)\Phi(t) 值,代入 (1.2.28)(1.2.28) 式计算便可,十分方便。若我们想知道超过误差范围的概率 α\alpha 是多少,也只需要计算:

α=12Φ(t)(1.2.29)\alpha = 1-2\Phi(t) \tag{1.2.29}

\quad 部分正态分布积分表如下所示:

tt不超出δ\|\delta\| 的概率2Φ(t)2\Phi(t)超出δ\|\delta\| 的概率12Φ(t)1-2\Phi(t)
0.670.49720.5028
10.68260.3174
20.95440.0456
30.99730.0027
40.99990.00001

由上表可见,随着 tt 增大,超出对于误差范围的概率明显减小,当 t=3t=3 时,超出 3σ+3σ-3\sigma\sim+3\sigma 范围的误差概率已经只有 0.0027 了,这在测量次数不超过几十次的一般测量中,已经几乎是不可能出现的了。因此我们通常把这个误差称为单次测量的极限误差 δlimx\delta_{\lim}x,即:

δlimx=±3σ(1.2.30)\delta_{\lim}x = \pm 3\sigma \tag{1.2.30}

±3σ\pm3\sigma 作为极限误差大小,这是人们习惯用的,也称作 3σ3\sigma 准则。
\quad 然而,更具实际情况,也有可能取其他的 tt 值来表示单次测量的极限误差,即:

δlimx=±tσ(1.2.31)\delta_{\lim}x = \pm t\sigma \tag{1.2.31}

所以为了方便,我们也将 tt 称为置信系数。若已知测量的标准差 σ\sigma,选定置信系数 tt,便可由 (1.2.31)(1.2.31) 式求得单次测量的极限误差了。

# 算术平均值的极限误差

\quad 寻找算术平均值的极限误差也可以与上述单次测量的一样。当多组测量列的算术平均值的误差 δxˉi\delta_{\bar{x}i} 为正态分布时,同样可以通过选定置信系数 tt 来确定测量列算术平均值的极限误差:

δlimxˉ=±tσxˉ(1.2.32)\delta_{\lim}\bar{x} = \pm t \sigma_{\bar{x}} \tag{1.2.32}

其中,σxˉ\sigma_{\bar{x}} 就是 (1.2.22)(1.2.22) 式中介绍的算术平均值标准差。

\quad 但是,在实际测量中,往往测量列的测量次数比较少,我们一般不适用正态分布来计算算术平均值的极限误差,取而代之的是 “学生式” 分布,又称 tt 分布,即:

δlimxˉ=±tασxˉ(1.2.33)\delta_{\lim}\bar{x} = \pm t_{\alpha} \sigma_{\bar{x}} \tag{1.2.33}

式中的 tαt_{\alpha}tt 分布的置信系数,它由给定的置信概率 P=1αP=1-\alpha 和自由度 ν=n1\nu=n-1 来确定,具体数值查表,下图则是 tt 分布表的部分。α\alpha 为超出极限误差的概率(又称显著度或显著水平),通常取 0.01,0.02 或 0.05;nn 为测量列中的测量次数。

图7

# 不等精度测量

\quad 上面讲述的内容皆是等精度测量的问题,在一般测量实践中基本上都属于这种类型。在高精度测量中,往往在不同的测量条件下,用不同的方法进行测量与对比,这种测量称为不等精度测量
\quad 在一般的工作中,常遇到的不等精度测量有两种情况:

  1. 用不同测量次数进行对比测量。例如,用同一台仪器测量某一参数,先后用 n1n_1n2n_2 次进行测量,分别求得算术平均值 xˉ1\bar{x}_1xˉ2\bar{x}_2 的精度是不一样的。
  2. 用不同精度的仪器进行对比测量。对于同一个参数,用不同精度的仪器进行测量,结果的精度自然是不同的。

\quad 那么对于这种不等精度测量,计算最后测量结果以及精度(如标准差),就不能套用前面等精度测量的计算公式了,我们需要另作讨论。

# 权重与加权算术平均值

\quad 对于各组不等精度测量的结果,其可靠程度可用一组数值来表示,这个数值即称为测量结果的权重,或称,记作 pp。测量结果的权可以理解为,当它与另外一些测量结果比较时,对于该测量结果所给予的信赖程度。

\quad 那么,我们现在来看看,如何确定各组测量结果的权重大小,或者说,如何测量各组权重大小的比值,因为权重的比值才是真正有用的参考。以及,如何确定在各组不等精度的测量结果下,如何决定最终的测量结果。
\quad 我们设各组不等精度测量值为 xix_i,且每组测量值的标准差 σi\sigma_i 服从正态分布。那么每组测量结果为 xix_i 的概率则为:

Pxi=limdx01σi2πexp[(xixˉ)22σi2]dx1σi2πexp[(xixˉ)22σi2](1.2.34)P_{x_i} = \lim_{dx\rightarrow 0} \frac{1}{\sigma_i\sqrt{2\pi}} \exp\left[-\frac{(x_i-\bar{x})^2}{2\sigma^2_i}\right] dx \propto \frac{1}{\sigma_i\sqrt{2\pi}} \exp\left[-\frac{(x_i-\bar{x})^2}{2\sigma^2_i}\right] \tag{1.2.34}

其中 xˉ\bar{x} 是测量的平均值,也就是我们衡量多组不等精度测量结果后最终确定的结果。那么,mm 组不等精度测量后,测量结果分别为 x1x_1x2x_2\cdotsxmx_m 的概率与 xˉ\bar{x} 的关系式为:

P(xˉ)=i=1m1σi2πexp[(xixˉ)22σi2]=Aexp[i=1m(xixˉ)22σi2](1.2.35)P(\bar{x}) = \prod^m_{i=1} \frac{1}{\sigma_i\sqrt{2\pi}} \exp\left[-\frac{(x_i-\bar{x})^2}{2\sigma^2_i}\right] = A \exp\left[-\sum_{i=1}^m\frac{(x_i-\bar{x})^2}{2\sigma^2_i}\right] \tag{1.2.35}

接下来,我们要寻求上式的极大值。即,xˉ\bar{x} 取何值时,才会从理论上以最大的概率出现我们的测量结果 x1x_1x2x_2\cdotsxmx_m。那么我们求上式的极值:

dP(xˉ)dxˉ=ddxˉ{Aexp[i=1m(xixˉ)22σi2]}=0i=1mxixˉσi2=0xˉ=i=1mxiσi2i=1m1σi2(1.2.36)\begin{aligned} \frac{dP(\bar{x})}{d\bar{x}} = \frac{d}{d\bar{x}}\left\{A \exp\left[-\sum_{i=1}^m\frac{(x_i-\bar{x})^2}{2\sigma^2_i}\right]\right\} = 0 \end{aligned} \\ \ \\ \begin{aligned} \Longrightarrow \sum^m_{i=1} \frac{x_i-\bar{x}}{\sigma_i^2} = 0 \end{aligned} \\ \ \\ \Longrightarrow \bar{x} = \frac{\sum_{i=1}^m\frac{x_i}{\sigma_i^2}}{\sum_{i=1}^m\frac{1}{\sigma_i^2}} \tag{1.2.36}

上式便是在已知的多组测量结果下,最大概率的测量的平均值,这种推导方法称为最大似然法。于是,我们便可以定义:

pi=1σi2(1.2.37)p_i = \frac{1}{\sigma_i^2} \tag{1.2.37}

p~i=pii=1mpi(1.2.38)\tilde{p}_i = \frac{p_i}{\sum_{i=1}^mp_i} \tag{1.2.38}

xˉ=i=1mpixii=1mpi=i=1mp~ixi(1.2.39)\bar{x} = \frac{\sum_{i=1}^mp_ix_i}{\sum_{i=1}^mp_i} = \sum_{i=1}^m \tilde{p}_ix_i \tag{1.2.39}

其中 (1.2.37)(1.2.37) 式就是各组不等精度测量的权重;(1.2.38)(1.2.38) 则是归一化后的权重;(1.2.39)(1.2.39) 则是各组不等精度测量的加权算术平均值,我们用它来作为我们最终测量的结果。

# 加权算术平均值的标准差

\quad 对同一被测量进行 mm 组不等精度测量,得到 mm 个测量结果 x1x_1x2x_2\cdotsxmx_m,并已知各组测量结果的标准差 σ1\sigma_1σ2\sigma_2\cdotsσm\sigma_m,那么通过 (1.2.37)(1.2.39)(1.2.37)\ (1.2.39) 两式便可计算各组测得值的权重,以及作为最终测量结果的加权算术平均值。那么至此,我们又该如何评价这个最终结果的标准差呢?我们利用到 (1.2.18)(1.2.18) 式的方差性质,结合 (1.2.39)(1.2.39) 式可得:

D(xˉ)=(1i=1mpi)2i=1mpi2D(xi)(1.2.40)D(\bar{x}) = \left(\frac{1}{\sum_{i=1}^mp_i}\right)^2 \sum_{i=1}^m p_i^2 D(x_i) \tag{1.2.40}

利用标准差与方差的关系,以及 (1.2.37)(1.2.37) 式,可得:

D(xi)=σi2=1pi(1.2.41)D(x_i) = \sigma_i^2 = \frac{1}{p_i} \tag{1.2.41}

(1.2.41)(1.2.41) 代入 (1.2.40)(1.2.40) 式可得:

D(xˉ)=(1i=1mpi)2i=1mpi=1i=1mpi(1.2.42)D(\bar{x}) = \left(\frac{1}{\sum_{i=1}^mp_i}\right)^2 \sum_{i=1}^m p_i = \frac{1}{\sum_{i=1}^mp_i} \tag{1.2.42}

因此,最终可得加权算术平均值的标准差为:

σxˉ=D(xˉ)=1i=1mpi=1i=1m1σi2(1.2.43)\sigma_{\bar{x}} = \sqrt{D(\bar{x})} = \sqrt{\frac{1}{\sum_{i=1}^mp_i}} = \sqrt{\frac{1}{\sum_{i=1}^m \frac{1}{\sigma_i^2}}} \tag{1.2.43}

所以,知道了每组不等精度测得值的标准差,我们便可以利用上式计算出加权算术平均值的标准差,以此作为最终结果的评价。

\quad 我们可以考虑一下,若 mm 组皆为等精度测量,测量标准差均为 σ\sigma,那么它们的加权算术平均值的标准差则为:

σxˉ=1m/σ2=σm(1.2.44)\sigma_{\bar{x}} = \sqrt{\frac{1}{m/\sigma^2}} = \frac{\sigma}{\sqrt{m}} \tag{1.2.44}

咦~~我们发现,这是便回到了 (1.2.22)(1.2.22) 式的测量列算术平均值标准差与测量列单次测量标准差的关系,即很自然地回到了等精度测量时的情况。

# 不等精度测量的例题

\quadA,BA,B 两种仪器对 5V5\mathrm{~V} 稳压芯片的输出电压进行两次测量,测量结果分别为 5.005V5.005\mathrm{~V} (标准差为 0.006V0.006\mathrm{~V})、5.002V5.002\mathrm{~V} (标准差为 0.008V0.008\mathrm{~V}),求该输出电压的最佳估计值,并评估最佳估计值的标准差。

\quad :两种仪器的测量构成了两种不等精度的测量列,两次测量的结果分别为:

UA=5.005V,σA=0.006V;UB=5.002V,σB=0.008VU_A = 5.005\mathrm{~V},\quad \sigma_A = 0.006\mathrm{~V};\quad U_B = 5.002\mathrm{~V},\quad \sigma_B = 0.008\mathrm{~V}

它们测量的权重是:

PA:PB=1σA2:1σB2=162:182=16:9P_A:P_B = \frac{1}{\sigma^2_A}:\frac{1}{\sigma^2_B} = \frac{1}{6^2}:\frac{1}{8^2} = 16:9

那么它们的加权平均值,即输出电压的最佳估计值为:

Uˉ=UAPA+UBPBPA+PB=5.005×16+5.002×916+9=5.004V\bar{U} = \frac{U_AP_A+U_BP_B}{P_A+P_B} = \frac{5.005\times16+5.002\times9}{16+9} = 5.004\mathrm{~V}

其加权平均值标准差为:

σVˉ=11σA2+1σB2=0.00480.005V\sigma_{\bar{V}} = \sqrt{\frac{1}{\frac{1}{\sigma_A^2}+\frac{1}{\sigma_B^2}}} = 0.0048 \approx 0.005\mathrm{~V}

# 随机误差的其他分别

\quad 在上面,我们常以随机误差服从正态分布为前提讨论问题。虽然正态分布是随机误差最普遍的分布之一,但并不是唯一的分布规律。例如比较常见的非正态分布就有:均匀分布、反正弦分布、三角分布、χ2\chi^2 分布、tt 分布、FF 分布等。我不想在这里一一介绍,这太费功夫了。若有需要,以后就自己查阅一下资料吧。

# 系统误差

\quad 前面所述的随机误差处理方法,是以测量数据中不含有系统误差为前提。实际上,测量过程中往往存在系统误差,在某些情况下的系统误差数值还比较大。系统误差是由固定不变的或按按照确定规律变化的因素造成的,所以理论上这些因素是科研被掌握的。
\quad 在这里,我先说一个困扰我好几个月的问题。在武汉实习的那段时间,我阅读了不少关于离子光频标原理的文献,知道评估离子光频标的不确定度(完整来说是系统不确定度,也是一种系统误差)在许多文献中显得尤为重要。虽然在我导师的博士论文里面也提到了 “基准钟的不确定度其实就是钟的准确度,不确定度越小,准确度越高”,但我仍然无法理解为何这些例如多普勒频移、DC Stark 频移、AC Stark 频移、电四级频移、Zeeman 频移以及黑体辐射频移等为何如此重要。因为我认为,这些频移最多只会引起跃迁频率与理想能级频率差之间的绝对漂移,但一个光钟,