# 误差的基本性质\quad 所谓误差就是测得值与被测量的真值之间的差 ,可用以下形势表示:
误差 = 测量值 − 真值 (1.1.1) 误差=测量值-真值 \tag{1.1.1} 误 差 = 测 量 值 − 真 值 ( 1 . 1 . 1 )
下面我们将介绍误差的两种表示形式,以及三种误差分类。
# 误差的两种表示形式# 绝对误差\quad 绝对误差 ,它是某量值的测得值和真值之差。我们通常称的误差一般就是绝对误差。他表示为即:
Δ L = L − L 0 (1.1.2) \Delta L = L-L_{0} \tag{1.1.2} Δ L = L − L 0 ( 1 . 1 . 2 )
其中 δ L \delta L δ L 表示绝对误差,L L L 表示测量值,L 0 L_0 L 0 表示真值。\quad 绝对误差的特点为:
绝对误差是一个具有确定的大小、符号及单位的量。 单位给出了被测量的量纲,其单位与测得值相同。 # 相对误差\quad 相对误差 ,它是绝对误差与被测量真值之比,即:
r = Δ L L 0 (1.1.3) r = \frac{\Delta L}{L_{0}} \tag{1.1.3} r = L 0 Δ L ( 1 . 1 . 3 )
相对误差的特点是:
相对误差有大小和符号。 无量纲,一般用百分数来表示。 # 误差的分类# 系统误差\quad 在同一条件下,多次测量同一量值时,绝对值和符号保持不变,或在条件改变时,按一定规律变化的误差称之为系统误差(Systematic Error) 。由于系统误差具有一定的规律性性,因此可以根据其产生原因,采取一定的技术措施,设法消除或减小。举几个例子:
用天平计量物体质量时,砝码的质量偏差。 刻线尺的温度变化引起的示值误差。 在离子频标中所讨论的对不确定度影响的那几个因素,例如二阶 Doppler 频移、DC Stark 频移、AC Stark 频移、Zeeman 频移、电四极频移、黑体辐射频移、引力红移等,其实都是系统误差。 # 随机误差\quad 在相同测量条件下,多次测量同一量值时,绝对值和符号以不可预定方式变化的误差称之为随机误差(Random Error) 。例如仪器仪表中传动部件的间隙和摩擦、连接件的弹性形变等引起的示值不稳定等。\quad 大量的重复测量可以发现,它是遵循某种统计规律 的。因此,可以用概率统计的方法处理含有随机误差的数据,对随机误差的总体大小及分布做出估计,并采取适当措施减小随机误差对测量结果的影响。
# 粗大误差\quad 超出在规定条件下预期的误差称为粗大误差(Gross Error) 。此误差值较大,明显歪曲测量结果,一般是某些偶尔突发性的异常因素或疏忽所致。故应按照一定的准则进行判别,将含有粗大误差的测量数据(称为坏值或异常值)予以剔除。
# 三类误差的关系及其对测得值的影响系统误差和随机误差的定义是科学严谨,不能混淆的。 但在测量实践中,由于误差划分的人为性和条件性,使得他们并不是一成不变的,在一定条件下可以相互转化。 一个具体误差究竟属于哪一类,应根据所考察的实际问题和具体条件,经分析和实验后确定。 \quad 下面这幅图可以描述三种误差的区别。\quad 这里要提示一下,期望值与均值是有区别的。\quad 均值是针对实验观察到的特征样本而言的,比如说我们进行掷骰子,掷了六次,点数分别为 2,2,2,4,4,4,那么对于这六次观察样本来说,均值为 ( 2 + 2 + 2 + 4 + 4 + 4 ) / 6 = 3 (2+2+2+4+4+4)/6=3 ( 2 + 2 + 2 + 4 + 4 + 4 ) / 6 = 3 。\quad 而期望值是针对随机变量而言的一个量,可以理解是一种站在 “上帝视角” 的值。可以先给出期望值的定义:
\quad 离散型随机变量 x x x 的取值为 x 1 x_1 x 1 ,x 2 x_2 x 2 ,x 3 x_3 x 3 ,⋯ \cdots ⋯ ,x n x_n x n ,它们对于的概率为 p ( x 1 ) p(x_1) p ( x 1 ) ,p ( x 2 ) p(x_2) p ( x 2 ) ,p ( x 3 ) p(x_3) p ( x 3 ) ,⋯ \cdots ⋯ ,p ( x n ) p(x_n) p ( x n ) ,则该离散型随机变量的期望值为:
E ( x ) = x 1 ⋅ p ( x 1 ) + x 2 ⋅ p ( x 2 ) + x 3 ⋅ p ( x 3 ) + ⋯ + x n ⋅ p ( x n ) E(x)=x_1\cdot p(x_1) + x_2\cdot p(x_2) + x_3\cdot p(x_3) + \cdots + x_n\cdot p(x_n) E ( x ) = x 1 ⋅ p ( x 1 ) + x 2 ⋅ p ( x 2 ) + x 3 ⋅ p ( x 3 ) + ⋯ + x n ⋅ p ( x n )
那么上面这个掷骰子的例子对应的期望值应该是:
E ( X ) = 1 × 1 6 + 2 × 1 6 + 3 × 1 6 + 4 × 1 6 + 5 × 1 6 + 6 × 1 6 = 3.5 (1.1.4) E(X) = 1\times\frac{1}{6} + 2\times\frac{1}{6} + 3\times\frac{1}{6} + 4\times\frac{1}{6} + 5\times\frac{1}{6} + 6\times\frac{1}{6} = 3.5 \tag{1.1.4} E ( X ) = 1 × 6 1 + 2 × 6 1 + 3 × 6 1 + 4 × 6 1 + 5 × 6 1 + 6 × 6 1 = 3 . 5 ( 1 . 1 . 4 )
所以,我觉得,可以将期望值理解为真值,均值理解为测量的均值。一些情况下,例如不存在系统误差的理想情况下,测量次数足够多,均值是可以收敛为期望值的。
# 误差与精度\quad 反映测量结果与真值接近程度的量,通常称为精度 ,它与误差的大小相对应,因此可用误差大小来表示精度的高低。精度可分为:
准确度(Correctness) :它反映测量结果中系统误差的影响程度。精密度(Precision) :它反映测量结果中随机误差的影响程度。精确度(Accuracy) :它表示测量结果与被测量真值之间的一致程度。就误差分析而言,精确度是测量结果中系统误差和随机误差的综合,误差越大,精确度越低,误差越小,则精确度越高。\quad 下图是一副很经典的图片,反映了准确的、精密度和精确度三者之间的关系。
上图所示的打靶结果,子弹落在靶心周围有三种情况。图 ( a ) (a) ( a ) 的弹着点全部在靶 上,但分散。相当于系统误差小而随机误差大,即精密度低,准确度高;图 ( b ) (b) ( b ) 的弹着点集中,但偏向一方,命中率不高。相当于系统误差大而随机误差小,即精密度高,准确度低;图 ( c ) (c) ( c ) 的弹着点集中靶心。相当于系统误差与随机误差均小,即精密度、准确度都高,从而精确度高。
# 有效数字与数字舍入# 有效数字的保留\quad 一般来说,在测量结果中,最末一位有效数字取到哪一位,是由测量精度来决定的,即最末一位有效数字应与测量精度是同一量级的 。例如用千分尺测量时,其测量精度只能达到 0.01 m m 0.01\mathrm{~mm} 0 . 0 1 m m ,若测出长度 L = 20.531 n m L=20.531\mathrm{~nm} L = 2 0 . 5 3 1 n m ,那么测量结果应写为 ( 20.54 ± 0.01 ) m m (20.54\pm0.01)\mathrm{~mm} ( 2 0 . 5 4 ± 0 . 0 1 ) m m 。\quad 在一些重要的测量时,测量结果和测量误差可比测量精度再多取一位数字作为参考 。例如在某个测量精度为 0.01 0.01 0 . 0 1 的仪器上进行多次测量,若最终多次测量的平均值为 15.214123321 15.214123321 1 5 . 2 1 4 1 2 3 3 2 1 ,标准差为 0.4211111 0.4211111 0 . 4 2 1 1 1 1 1 。那么我们最终的测量结果可以表示为 15.214 ± 0.042 15.214\pm0.042 1 5 . 2 1 4 ± 0 . 0 4 2 。
# 数字的舍入规则\quad 对于位数很大的近似数,当有效位数确定后,其后面多余的数字应予舍去,而保留的有效数字最后一位数字应有一定的规则。从小学开始,老师就教授我们了一个方法,叫做四舍五入。但这种方法在精密测量领域中并不好用,这是因为在大量运算时,四舍五入这种 “见 5 就入” 的方法会导致出现系统误差,即舍入误差的均值不趋于零。下面就介绍另一种舍入规则:
若舍去部分的数值大于保留部分的末位的半个单位,则末位加 1。 若舍去部分的数值小于保留部分的末位的半个单位,则末位不变。 若舍去部分的数值等于保留部分的末位的半个单位,则保留部分的末位凑成偶数。即当保留部位的末位为偶数时则不变,若为奇数则末位加 1。 \quad 以上述的舍入规则举几个例子:
原有数据 舍入后数据 3.14159 3.142 2.71349 2.713 3.21550 3.216 6.37850 6.378 5.43050 5.430
该舍入规则的第三条,被舍去的数字不是 “见 5 就入”,从而使舍入误差称为随机误差,在大量运算时,其舍入误差的均值就趋于零了。
# 随机误差\quad 当对同一量值进行多次等精度的重复测量时,得到一系列不同的测量值(常称为测量列),每个测量值都含有误差,这些误差的出现又没有确定的规律,却具有统计的规律性,这种往往是随机误差。在这一节中,将来具体学习随机误差的一些处理方法。
# 正态分布\quad 正态分布在误差理论中占有十分重要的地位,这是因为多数随机误差都服从正态分布。\quad 正态分布的分布密度函数 f ( δ ) f(\delta) f ( δ ) 为:
f ( δ ) = 1 σ 2 π e − δ 2 2 σ 2 (1.2.1) f(\delta) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{\delta^2}{2\sigma^2}} \tag{1.2.1} f ( δ ) = σ 2 π 1 e − 2 σ 2 δ 2 ( 1 . 2 . 1 )
若 x x x 是测量值,μ \mu μ 为测量总体的数学期望,如果不计系统误差和粗大误差,则 δ = x − μ \delta=x-\mu δ = x − μ 为随机误差。\quad 正态分布的方差为 σ 2 \sigma^2 σ 2 ,而标准差则为 σ \sigma σ ,这是因为:
σ 2 = ∫ − ∞ ∞ δ 2 f ( δ ) d δ (1.2.2) \sigma^2 = \int^\infin_{-\infin} \delta^2 f(\delta)\ d\delta \tag{1.2.2} σ 2 = ∫ − ∞ ∞ δ 2 f ( δ ) d δ ( 1 . 2 . 2 )
\quad 另外值得一提的是,我们常说一些光斑的强度分布服从高斯分布,或者离子阱中看到的离子成像满足高斯分布,其实高斯分布就是正态分布。
# 算术平均值\quad 在系列测量中,被测量的 n n n 个测得值的代数和除以 n n n 而得的值称为算术平均值。例如,设 l 1 l_1 l 1 ,l 2 l_2 l 2 ,⋯ \cdots ⋯ ,l n l_n l n 为 n n n 次测量所得的值,则算术平均值 x ˉ \bar{x} x ˉ 为:
x ˉ = ∑ i = 1 n l i n (1.2.3) \bar{x} = \frac{\sum_{i=1}^nl_i}{n} \tag{1.2.3} x ˉ = n ∑ i = 1 n l i ( 1 . 2 . 3 )
若不存在系统误差和粗大误差,则根据概率论的大数定律可知,当测量次数无限增加时,算术平均值必然趋于真值。
# 测量列中单次测量的标准差\quad 由于随机误差的存在,一次等精度测量列中各个测量值一般皆不相等,它们围绕着该测量列的算术平均值有一定的分散,此这种分散度暗含着该测量列中单次测量的不可靠性,必须用一个数值作为其不可靠性的评定标准。我们常用的就是标准差 σ \sigma σ ,又称方均根误差 。\quad 标准差 σ \sigma σ 不是测量列中任何一个具体测得值的随机误差,σ \sigma σ 的大小只说明一定条件下等精度测量列随机误差的概率分布情况 。如下图所示,标准差 σ \sigma σ 的数值越小,该测量列相应小的误差占优势,任一单次测得值对算术平均值的分散度就小,测量的可靠性就大,即测量精度高;反之,测量精度就低。
\quad 在等精度测量列中,单次测量的标准差按下式计算:
σ = δ 1 2 + δ 2 2 + ⋯ + δ n 2 n = ∑ i = 1 n δ n 2 n (1.2.4) \sigma = \sqrt{\frac{\delta_1^2+\delta_2^2+\cdots+\delta_n^2}{n}} = \sqrt{\frac{\sum_{i=1}^n\delta^2_n}{n}} \tag{1.2.4} σ = n δ 1 2 + δ 2 2 + ⋯ + δ n 2 = n ∑ i = 1 n δ n 2 ( 1 . 2 . 4 )
上式中,n n n 为测量次数(应该充分大);δ i \delta_i δ i 是某次测量值与真值(测量总体的数学期望值)之差,即 δ i = L i − L o \delta_i=L_i-L_o δ i = L i − L o 。
\quad 但一般来说,被测值的真值一般是未知的,无法按照 ( 1.2.4 ) (1.2.4) ( 1 . 2 . 4 ) 式求得标准差。实际上,在有限次测量情况下,可用残余误差 ν i \nu_i ν i 代替真误差,从而求得标准差的估计值。先做明确的符号说明,进行一次等精度的 n n n 次测量:
δ i = L i − L 0 (1.2.5) \delta_i = L_i-L_0 \tag{1.2.5} δ i = L i − L 0 ( 1 . 2 . 5 )
ν i = L i − L ˉ (1.2.6) \nu_i = L_i-\bar{L} \tag{1.2.6} ν i = L i − L ˉ ( 1 . 2 . 6 )
δ ˉ = ∑ i = 1 n δ i n = L ˉ − L 0 (1.2.7) \bar{\delta} = \frac{\sum_{i=1}^n \delta_i}{n} = \bar{L}-L_0 \tag{1.2.7} δ ˉ = n ∑ i = 1 n δ i = L ˉ − L 0 ( 1 . 2 . 7 )
其中 δ i \delta_i δ i 是测量值的真误差,L 0 L_0 L 0 是真值(或者可认为是测量总体的期望值);ν i \nu_i ν i 是测量值的残余误差,简称残差,L ˉ \bar{L} L ˉ 是一次等精度测量列的算术平均值;δ ˉ \bar{\delta} δ ˉ 称为算术平均值的误差,是该测量列的算术平均值与真值之差。\quad 下面我们就来具体推导如何用残差来估计测量列的标准差。首先利用上三式可得:
{ δ 1 = l 1 − L 0 = l 1 − L ˉ + L ˉ − L 0 = ν 1 + δ ˉ δ 2 = l 2 − L 0 = l 2 − L ˉ + L ˉ − L 0 = ν 2 + δ ˉ ⋮ δ n = l n − L 0 = l n − L ˉ + L ˉ − L 0 = ν n + δ ˉ (1.2.8) \begin{cases} \delta_1 = l_1-L_0 = l_1 - \bar{L} + \bar{L} - L_0 = \nu_1+\bar{\delta} \\ \delta_2 = l_2-L_0 = l_2 - \bar{L} + \bar{L} - L_0 = \nu_2+\bar{\delta} \\ \vdots \\ \delta_n = l_n-L_0 = l_n - \bar{L} + \bar{L} - L_0 = \nu_n+\bar{\delta} \end{cases} \tag{1.2.8} ⎩ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎧ δ 1 = l 1 − L 0 = l 1 − L ˉ + L ˉ − L 0 = ν 1 + δ ˉ δ 2 = l 2 − L 0 = l 2 − L ˉ + L ˉ − L 0 = ν 2 + δ ˉ ⋮ δ n = l n − L 0 = l n − L ˉ + L ˉ − L 0 = ν n + δ ˉ ( 1 . 2 . 8 )
将 ( 1.2.8 ) (1.2.8) ( 1 . 2 . 8 ) 式的每一项相加可得:
∑ i = 1 n δ i = ∑ i = 1 n ν i + n δ ˉ ⟹ δ ˉ = ∑ i = 1 n δ i n − ∑ i = 1 n ν i n = ∑ i = 1 n δ i n (1.2.9) \sum_{i=1}^n \delta_i = \sum_{i=1}^n \nu_i + n\bar{\delta} \\ \ \\ \begin{aligned} \Longrightarrow \bar{\delta} = \frac{\sum\limits_{i=1}^n \delta_i}{n} - \frac{\sum\limits_{i=1}^n \nu_i}{n} = \frac{\sum\limits_{i=1}^n \delta_i}{n} \tag{1.2.9} \end{aligned} i = 1 ∑ n δ i = i = 1 ∑ n ν i + n δ ˉ ⟹ δ ˉ = n i = 1 ∑ n δ i − n i = 1 ∑ n ν i = n i = 1 ∑ n δ i ( 1 . 2 . 9 )
我们在将 ( 1.2.8 ) (1.2.8) ( 1 . 2 . 8 ) 式的每一项平方相加可得:
∑ i = 1 n δ i 2 = ∑ i = 1 n ν i 2 + n δ ˉ 2 + 2 δ ˉ ∑ i = 1 n ν i = ∑ i = 1 n ν i 2 + n δ ˉ 2 (1.2.10) \sum_{i=1}^n \delta_i^2 = \sum_{i=1}^n \nu_i^2 + n\bar{\delta}^2 + 2\bar{\delta}\sum_{i=1}^n \nu_i = \sum_{i=1}^n \nu_i^2 + n\bar{\delta}^2 \tag{1.2.10} i = 1 ∑ n δ i 2 = i = 1 ∑ n ν i 2 + n δ ˉ 2 + 2 δ ˉ i = 1 ∑ n ν i = i = 1 ∑ n ν i 2 + n δ ˉ 2 ( 1 . 2 . 1 0 )
上两式均利用到了 ∑ i = 1 n ν i = 0 \sum_{i=1}^n \nu_i=0 ∑ i = 1 n ν i = 0 的特点。我们再将 ( 1.2.9 ) (1.2.9) ( 1 . 2 . 9 ) 式平方有:
δ ˉ 2 = [ ∑ i = 1 n δ i n ] 2 = ∑ i = 1 n δ i 2 n 2 + 2 ∑ 1 ≤ i < j n δ i δ j n 2 → 且没有系统误差 当 n 适当大时 ∑ i = 1 n δ i 2 n 2 (1.2.11) \bar{\delta}^2 = \left[\frac{\sum\limits_{i=1}^n \delta_i}{n}\right]^2 = \frac{\sum\limits_{i=1}^n\delta_i^2}{n^2} + \frac{2\sum\limits_{1\le i < j}^n \delta_i\delta_j}{n^2} \xrightarrow[且没有系统误差]{当n适当大时} \frac{\sum\limits_{i=1}^n\delta_i^2}{n^2} \tag{1.2.11} δ ˉ 2 = ⎣ ⎢ ⎢ ⎢ ⎡ n i = 1 ∑ n δ i ⎦ ⎥ ⎥ ⎥ ⎤ 2 = n 2 i = 1 ∑ n δ i 2 + n 2 2 1 ≤ i < j ∑ n δ i δ j 当 n 适 当 大 时 且 没 有 系 统 误 差 n 2 i = 1 ∑ n δ i 2 ( 1 . 2 . 1 1 )
其中,由于一般随机误差的正负是对称且随机的,比如说正态分布的随机误差,所以当不存在随机误差且 n n n 适当大时,可认为 2 ∑ i = 1 n δ i δ j n 2 \frac{2\sum\limits_{i=1}^n \delta_i\delta_j}{n^2} n 2 2 i = 1 ∑ n δ i δ j 趋近于零,从而使得 ∑ 1 ≤ i < j n δ i δ j \sum\limits_{1\le i < j}^n \delta_i\delta_j 1 ≤ i < j ∑ n δ i δ j 趋于零。我们不妨将 ( 1.2.11 ) (1.2.11) ( 1 . 2 . 1 1 ) 式的最后一项写成一个小量,用 O \mathcal{O} O 来表示,即:
δ ˉ 2 = ∑ i = 1 n δ i 2 n 2 + O (1.2.12) \bar{\delta}^2 = \frac{\sum\limits_{i=1}^n\delta_i^2}{n^2} + \mathcal{O} \tag{1.2.12} δ ˉ 2 = n 2 i = 1 ∑ n δ i 2 + O ( 1 . 2 . 1 2 )
利用 ( 1.2.10 ) (1.2.10) ( 1 . 2 . 1 0 ) 式,将 δ ˉ 2 \bar{\delta}^2 δ ˉ 2 代入 ( 1.2.12 ) (1.2.12) ( 1 . 2 . 1 2 ) 式可得:
∑ i = 1 n δ i 2 − ∑ i = 1 n ν i 2 = ∑ i = 1 n δ i 2 n + n O (1.2.13) \sum_{i=1}^n\delta_i^2-\sum_{i=1}^n\nu_i^2 = \frac{\sum\limits_{i=1}^n\delta_i^2}{n} + n\mathcal{O} \tag{1.2.13} i = 1 ∑ n δ i 2 − i = 1 ∑ n ν i 2 = n i = 1 ∑ n δ i 2 + n O ( 1 . 2 . 1 3 )
再利用 ( 1.2.4 ) (1.2.4) ( 1 . 2 . 4 ) 式的标准差 σ \sigma σ 定义,可将上式化为:
n σ 2 − ∑ i = 1 n ν i 2 = σ 2 + n O ⟹ σ = ∑ i = 1 n ν i 2 n − 1 + n n − 1 O (1.2.14) n\sigma^2 - \sum_{i=1}^n\nu_i^2 = \sigma^2 + n\mathcal{O}\\ \begin{array}{c} \\ \Longrightarrow \sigma = \sqrt{\frac{\sum_{i=1}\limits^n\nu_i^2}{n-1}+\frac{n}{n-1}\mathcal{O}} \tag{1.2.14} \end{array} n σ 2 − i = 1 ∑ n ν i 2 = σ 2 + n O ⟹ σ = n − 1 i = 1 ∑ n ν i 2 + n − 1 n O ( 1 . 2 . 1 4 )
由于 O \mathcal{O} O 在不存在系统误差(或者系统误差很小),测量次数 n n n 足够大时趋于零,因此,根据上式,我们便可得到用残差求单次测量的标准差的估计值:
s = ∑ i = 1 n ν i 2 n − 1 ≈ σ (1.2.15) s = \sqrt{\frac{\sum_{i=1}\limits^n\nu_i^2}{n-1}} \approx\sigma \tag{1.2.15} s = n − 1 i = 1 ∑ n ν i 2 ≈ σ ( 1 . 2 . 1 5 )
该式称为贝塞尔(Bessel)公式 。
\quad 关于 ( 1.2.4 ) ( 1.2.15 ) (1.2.4)(1.2.15) ( 1 . 2 . 4 ) ( 1 . 2 . 1 5 ) 式有一个更规范的说法。对一列有限次 n n n 个测量值,应视为测量总体的取样。关于 ( 1.2.4 ) (1.2.4) ( 1 . 2 . 4 ) 式计算的标准差应该称为总体标准差 ,用 σ \sigma σ 表示,它其实代表着测量值与总体测量量真值的分散度;( 1.2.15 ) (1.2.15) ( 1 . 2 . 1 5 ) 式计算的标准差应该称为样本标准差 ,在一些文献会把它写作 s s s ,以此区分总体标准差 σ \sigma σ 。虽说要以此区分,但正如上两式所看到的,在 O \mathcal{O} O 趋于零时,s s s 可以作为 σ \sigma σ 的估计量,而这也是在不知道真值是,评价测量随机误差的一个常用方法。\quad 有一个大一时我就纠结的问题,为什么用贝塞尔公式的分母是 n − 1 n-1 n − 1 ,而不是 n n n 或者是 n − 2 n-2 n − 2 、n − 3 n-3 n − 3 之类的呢?看了看网上一些回答,结合我的思考,我想给出一个很不严谨,但还是能勉强接受的解释。首先是从数学推导上看,上面一路推导下来大概是没什么问题的。通过 ( 1.2.15 ) (1.2.15) ( 1 . 2 . 1 5 ) 式,我们看看如果贝塞尔公式中分母是 n n n 那会出现什么:
∑ i = 1 n ν i 2 n < σ ≈ ∑ i = 1 n ν i 2 n − 1 < ∑ i = 1 n ν i 2 n − 2 (1.2.16) \sqrt{\frac{\sum_{i=1}\limits^n\nu_i^2}{n}} < \sigma \approx \sqrt{\frac{\sum_{i=1}\limits^n\nu_i^2}{n-1}} < \sqrt{\frac{\sum_{i=1}\limits^n\nu_i^2}{n-2}} \tag{1.2.16} n i = 1 ∑ n ν i 2 < σ ≈ n − 1 i = 1 ∑ n ν i 2 < n − 2 i = 1 ∑ n ν i 2 ( 1 . 2 . 1 6 )
可见,若贝塞尔公式中的分母是 n n n ,那么在不知道随机变量真实值的前提下,将会导致估计的标准差偏低。而将分母 n n n 换成 n − 1 n-1 n − 1 ,实际上就是修正这种偏差的一个方法。若分母是 n − 2 n-2 n − 2 就修正过头了,当然我们没有任何理由或者是想把分母写为 n − 2 n-2 n − 2 的想法。\quad 可以更加直观地理解一下,为什么是 n − 1 n-1 n − 1 呢?如果是 ( 1.2.4 ) (1.2.4) ( 1 . 2 . 4 ) 的总体标准差 σ \sigma σ ,那么数据的自由度为 n n n ,即 n n n 个测量值,这样的话分母是 n n n 不能理解。但若是 ( 1.2.15 ) (1.2.15) ( 1 . 2 . 1 5 ) 式的样本标准差,那么里面的 L ˉ \bar{L} L ˉ 实际上偷走了一个自由度,导致自由度只有 n − 1 n-1 n − 1 ,所以如果用直观的物理直觉也就不难理解为什么分母是 n − 1 n-1 n − 1 了。总的来说,当我们用 L ˉ \bar{L} L ˉ 代替 L 0 L_0 L 0 的过程中,我们不知不觉地损失了一个自由度 。
# 测量列中算术平均值的标准差\quad 上一小节中,我们讨论的某测量列中单次测量的标准差。但作为测量的结果,我们肯定不是以测量列中某一次测量值作为测量结果,而是以算术平均值作为测量结果。那么我们最终写在实验报告上的测量结果为 “测量列的算术平均值 ± 测量列中单次测量的标准差” 是否合理呢?答案当然是不合理的。如果在相同条件下对同一个测量值进行多组重复的系列测量,每一给测量列都有一个算术平均值,由于随机误差的存在,各个测量列的算术平均值也不相同,它们围绕着被测量的真值有一定的分散。与单次测量一样,此分散说明了算术平均值的不可靠性,所有我们同样需要一个算术平均值的标准差 σ x ˉ \sigma_{\bar{x}} σ x ˉ 来表征同一被测值的各个独立测量列算术平均值的分散性。\quad 那么我们来看看,测量列算术平均值的标准差如何求得。考虑一个 n n n 次等精度测量列的算术平均值为:
x ˉ = l 1 + l 2 + ⋯ + l n n (1.2.17) \bar{x} = \frac{l_1+l_2+\cdots+l_n}{n} \tag{1.2.17} x ˉ = n l 1 + l 2 + ⋯ + l n ( 1 . 2 . 1 7 )
还记得大一时学得概统吗,方差用 D ( x ) D(x) D ( x ) 来表示,其满足:
{ D ( a x ) = a 2 D ( x ) D ( x 1 + x 2 ) = D ( x 1 ) + D ( x 2 ) (1.2.18) \begin{cases} D(ax) = a^2D(x) \\ D(x_1+x_2) = D(x_1)+D(x_2) \end{cases} \tag{1.2.18} { D ( a x ) = a 2 D ( x ) D ( x 1 + x 2 ) = D ( x 1 ) + D ( x 2 ) ( 1 . 2 . 1 8 )
因此测量列算术平均值取方差为:
D ( x ˉ ) = 1 n 2 [ D ( l 1 ) + D ( l 2 ) + ⋯ D ( l n ) ] (1.2.19) D(\bar{x}) = \frac{1}{n^2}\left[D(l_1)+D(l_2)+\cdots D(l_n)\right] \tag{1.2.19} D ( x ˉ ) = n 2 1 [ D ( l 1 ) + D ( l 2 ) + ⋯ D ( l n ) ] ( 1 . 2 . 1 9 )
因为是等精度测量,测量列中每个单次测量的方差(标准差)都是相同的,即:
D ( l 1 ) = D ( l 2 ) = ⋯ D ( l n ) = σ 2 (1.2.20) D(l_1) = D(l_2) = \cdots D(l_n) = \sigma^2 \tag{1.2.20} D ( l 1 ) = D ( l 2 ) = ⋯ D ( l n ) = σ 2 ( 1 . 2 . 2 0 )
故有:
σ x ˉ 2 = D ( x ˉ ) = σ 2 n (1.2.21) \sigma_{\bar{x}}^2 = D(\bar{x}) = \frac{\sigma^2}{n} \tag{1.2.21} σ x ˉ 2 = D ( x ˉ ) = n σ 2 ( 1 . 2 . 2 1 )
因此,测量列算术平均值的标准差与测量列单次测量的标准差关系为:
σ x ˉ = σ n (1.2.22) \sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}} \tag{1.2.22} σ x ˉ = n σ ( 1 . 2 . 2 2 )
\quad 由上式可知,在 n n n 次测量的等精度测量列中,算术平均值的标准差为单次测量标准差的 1 / n 1/\sqrt{n} 1 / n ,当测量次数越大时,算术平均值越接近被测量的真值(当然是假设没有系统误差的情况),测量精度也越高。从图 5 5 5 的两图中也能明显地看出,当取多个测量值做平均时,此时的分散性确实明显减小了。
\quad 既然随着测次数的增加,可以提高测量精度,那么是不是我测量次数越多越好呢?其实不然,由 ( 1.2.22 ) (1.2.22) ( 1 . 2 . 2 2 ) 式可知,测量精度与测量次数的平方根成反比,因此要显著提高测量精度,必须付出较大的劳动力。当 σ \sigma σ 一定时,当 n > 10 n>10 n > 1 0 以后,σ x ˉ \sigma_{\bar{x}} σ x ˉ 已经减小得非常缓慢了。此外,由于测量次数越大时,也越难保证测量条件的恒定,从而带来新的误差,因此一般情况下取 n ≤ 10 n\le 10 n ≤ 1 0 较为适宜。
\quad 下面给一个简单的例题:
例题:用游标卡尺对某一尺寸测量 10 次,假定已经消除系统误差和粗大误差,得到的数据如下(单位为 m m \mathrm{mm} m m ): 求测量列的单次测量标准差和算术平均值标准差。
\quad 解 :先用贝塞尔公式估计单次测量的标准差:
σ = ∑ i = 1 n ν i 2 n − 1 = 0.00825 10 − 1 m m = 0.0303 m m (1.2.23) \sigma = \sqrt{\frac{\sum\limits_{i=1}^n\nu_i^2}{n-1}} = \sqrt{\frac{0.00825}{10-1}} \mathrm{~mm} = 0.0303\mathrm{~mm} \tag{1.2.23} σ = n − 1 i = 1 ∑ n ν i 2 = 1 0 − 1 0 . 0 0 8 2 5 m m = 0 . 0 3 0 3 m m ( 1 . 2 . 2 3 )
再计算测量列的算术平均值标准差:
σ x ˉ = σ n = 0.0303 10 m m = 0.0096 m m (1.2.24) \sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}} = \frac{0.0303}{\sqrt{10}} \mathrm{~mm} = 0.0096\mathrm{~mm} \tag{1.2.24} σ x ˉ = n σ = 1 0 0 . 0 3 0 3 m m = 0 . 0 0 9 6 m m ( 1 . 2 . 2 4 )
# 测量的极限误差\quad 超过极限误差的测量值我们认为是几乎是不可能出现的。这一小节就来学习一下,我们怎么来标定测量结果(单次测量或测量列的算术平均值)的极限误差。
# 单次测量的极限误差\quad 求单次测量的极限误差的前提条件是:测量列的测量次数足够多,且单次测量误差为正态分布 。若满足以上两点,那么由概率积分知识可知,随机误差在 − δ -\delta − δ 至 + δ +\delta + δ 范围内的概率为:
P ( − δ ∼ δ ) = 1 σ 2 π ∫ − δ + δ e − δ 2 2 σ 2 d δ = 2 σ 2 π ∫ 0 + δ e − δ 2 2 σ 2 d δ (1.2.25) P(-\delta\sim\delta) = \frac{1}{\sigma\sqrt{2\pi}}\int^{+\delta}_{-\delta} e^{-\frac{\delta^2}{2\sigma^2}}\ d\delta = \frac{2}{\sigma\sqrt{2\pi}}\int^{+\delta}_{0} e^{-\frac{\delta^2}{2\sigma^2}}\ d\delta \tag{1.2.25} P ( − δ ∼ δ ) = σ 2 π 1 ∫ − δ + δ e − 2 σ 2 δ 2 d δ = σ 2 π 2 ∫ 0 + δ e − 2 σ 2 δ 2 d δ ( 1 . 2 . 2 5 )
为了方便讨论,人们引入新的变量 t t t :
t = δ σ , δ = t σ (1.2.26) t = \frac{\delta}{\sigma},\quad\delta=t\sigma \tag{1.2.26} t = σ δ , δ = t σ ( 1 . 2 . 2 6 )
变换,将 ( 1.2.25 ) (1.2.25) ( 1 . 2 . 2 5 ) 式化为:
P ( − δ ∼ δ ) = 2 σ 2 π ∫ 0 t σ e − t 2 2 d ( t σ ) = 2 2 π ∫ 0 t e − t 2 2 d t (1.2.27) P(-\delta\sim\delta) = \frac{2}{\sigma\sqrt{2\pi}}\int^{t\sigma}_0 e^{-\frac{t^2}{2}}\ d(t\sigma) = \frac{2}{\sqrt{2\pi}}\int^{t}_0 e^{-\frac{t^2}{2}}\ dt \tag{1.2.27} P ( − δ ∼ δ ) = σ 2 π 2 ∫ 0 t σ e − 2 t 2 d ( t σ ) = 2 π 2 ∫ 0 t e − 2 t 2 d t ( 1 . 2 . 2 7 )
再引入正态分布概率积分函数 Φ ( t ) \Phi(t) Φ ( t ) :
Φ ( t ) = 1 2 π ∫ 0 t e − t 2 2 d t (1.2.28) \Phi(t) = \frac{1}{\sqrt{2\pi}}\int^{t}_0 e^{-\frac{t^2}{2}}\ dt \tag{1.2.28} Φ ( t ) = 2 π 1 ∫ 0 t e − 2 t 2 d t ( 1 . 2 . 2 8 )
便可将 ( 1.2.27 ) (1.2.27) ( 1 . 2 . 2 7 ) 式化为:
P ( − δ ∼ δ ) = 2 Φ ( t ) (1.2.28) P(-\delta\sim\delta) = 2\Phi(t) \tag{1.2.28} P ( − δ ∼ δ ) = 2 Φ ( t ) ( 1 . 2 . 2 8 )
因此,若我们要想知道误差在 − t σ ∼ + t σ -t\sigma\sim+t\sigma − t σ ∼ + t σ 范围内的概率是多数,我们只需要查询正态分布积分表,找到不同 t t t 的 Φ ( t ) \Phi(t) Φ ( t ) 值,代入 ( 1.2.28 ) (1.2.28) ( 1 . 2 . 2 8 ) 式计算便可,十分方便。若我们想知道超过误差范围的概率 α \alpha α 是多少,也只需要计算:
α = 1 − 2 Φ ( t ) (1.2.29) \alpha = 1-2\Phi(t) \tag{1.2.29} α = 1 − 2 Φ ( t ) ( 1 . 2 . 2 9 )
\quad 部分正态分布积分表如下所示:
t t t 不超出∥ δ ∥ \|\delta\| ∥ δ ∥ 的概率2 Φ ( t ) 2\Phi(t) 2 Φ ( t ) 超出∥ δ ∥ \|\delta\| ∥ δ ∥ 的概率1 − 2 Φ ( t ) 1-2\Phi(t) 1 − 2 Φ ( t ) 0.67 0.4972 0.5028 1 0.6826 0.3174 2 0.9544 0.0456 3 0.9973 0.0027 4 0.9999 0.00001
由上表可见,随着 t t t 增大,超出对于误差范围的概率明显减小,当 t = 3 t=3 t = 3 时,超出 − 3 σ ∼ + 3 σ -3\sigma\sim+3\sigma − 3 σ ∼ + 3 σ 范围的误差概率已经只有 0.0027 了,这在测量次数不超过几十次的一般测量中,已经几乎是不可能出现的了。因此我们通常把这个误差称为单次测量的极限误差 δ lim x \delta_{\lim}x δ l i m x ,即:
δ lim x = ± 3 σ (1.2.30) \delta_{\lim}x = \pm 3\sigma \tag{1.2.30} δ l i m x = ± 3 σ ( 1 . 2 . 3 0 )
将 ± 3 σ \pm3\sigma ± 3 σ 作为极限误差大小,这是人们习惯用的,也称作 3 σ 3\sigma 3 σ 准则。\quad 然而,更具实际情况,也有可能取其他的 t t t 值来表示单次测量的极限误差,即:
δ lim x = ± t σ (1.2.31) \delta_{\lim}x = \pm t\sigma \tag{1.2.31} δ l i m x = ± t σ ( 1 . 2 . 3 1 )
所以为了方便,我们也将 t t t 称为置信系数 。若已知测量的标准差 σ \sigma σ ,选定置信系数 t t t ,便可由 ( 1.2.31 ) (1.2.31) ( 1 . 2 . 3 1 ) 式求得单次测量的极限误差了。
# 算术平均值的极限误差\quad 寻找算术平均值的极限误差也可以与上述单次测量的一样。当多组测量列的算术平均值的误差 δ x ˉ i \delta_{\bar{x}i} δ x ˉ i 为正态分布时,同样可以通过选定置信系数 t t t 来确定测量列算术平均值的极限误差:
δ lim x ˉ = ± t σ x ˉ (1.2.32) \delta_{\lim}\bar{x} = \pm t \sigma_{\bar{x}} \tag{1.2.32} δ l i m x ˉ = ± t σ x ˉ ( 1 . 2 . 3 2 )
其中,σ x ˉ \sigma_{\bar{x}} σ x ˉ 就是 ( 1.2.22 ) (1.2.22) ( 1 . 2 . 2 2 ) 式中介绍的算术平均值标准差。
\quad 但是,在实际测量中,往往测量列的测量次数比较少,我们一般不适用正态分布来计算算术平均值的极限误差,取而代之的是 “学生式” 分布,又称 t t t 分布,即:
δ lim x ˉ = ± t α σ x ˉ (1.2.33) \delta_{\lim}\bar{x} = \pm t_{\alpha} \sigma_{\bar{x}} \tag{1.2.33} δ l i m x ˉ = ± t α σ x ˉ ( 1 . 2 . 3 3 )
式中的 t α t_{\alpha} t α 为 t t t 分布的置信系数,它由给定的置信概率 P = 1 − α P=1-\alpha P = 1 − α 和自由度 ν = n − 1 \nu=n-1 ν = n − 1 来确定,具体数值查表,下图则是 t t t 分布表的部分。α \alpha α 为超出极限误差的概率(又称显著度或显著水平),通常取 0.01,0.02 或 0.05;n n n 为测量列中的测量次数。
# 不等精度测量\quad 上面讲述的内容皆是等精度测量的问题,在一般测量实践中基本上都属于这种类型。在高精度测量中,往往在不同的测量条件下,用不同的方法进行测量与对比,这种测量称为不等精度测量 。\quad 在一般的工作中,常遇到的不等精度测量有两种情况:
用不同测量次数进行对比测量 。例如,用同一台仪器测量某一参数,先后用 n 1 n_1 n 1 和 n 2 n_2 n 2 次进行测量,分别求得算术平均值 x ˉ 1 \bar{x}_1 x ˉ 1 和 x ˉ 2 \bar{x}_2 x ˉ 2 的精度是不一样的。用不同精度的仪器进行对比测量 。对于同一个参数,用不同精度的仪器进行测量,结果的精度自然是不同的。\quad 那么对于这种不等精度测量,计算最后测量结果以及精度(如标准差),就不能套用前面等精度测量的计算公式了,我们需要另作讨论。
# 权重与加权算术平均值\quad 对于各组不等精度测量的结果,其可靠程度可用一组数值来表示,这个数值即称为测量结果的权重 ,或称权 ,记作 p p p 。测量结果的权可以理解为,当它与另外一些测量结果比较时,对于该测量结果所给予的信赖程度。
\quad 那么,我们现在来看看,如何确定各组测量结果的权重大小,或者说,如何测量各组权重大小的比值,因为权重的比值才是真正有用的参考。以及,如何确定在各组不等精度的测量结果下,如何决定最终的测量结果。\quad 我们设各组不等精度测量值为 x i x_i x i ,且每组测量值的标准差 σ i \sigma_i σ i 服从正态分布。那么每组测量结果为 x i x_i x i 的概率则为:
P x i = lim d x → 0 1 σ i 2 π exp [ − ( x i − x ˉ ) 2 2 σ i 2 ] d x ∝ 1 σ i 2 π exp [ − ( x i − x ˉ ) 2 2 σ i 2 ] (1.2.34) P_{x_i} = \lim_{dx\rightarrow 0} \frac{1}{\sigma_i\sqrt{2\pi}} \exp\left[-\frac{(x_i-\bar{x})^2}{2\sigma^2_i}\right] dx \propto \frac{1}{\sigma_i\sqrt{2\pi}} \exp\left[-\frac{(x_i-\bar{x})^2}{2\sigma^2_i}\right] \tag{1.2.34} P x i = d x → 0 lim σ i 2 π 1 exp [ − 2 σ i 2 ( x i − x ˉ ) 2 ] d x ∝ σ i 2 π 1 exp [ − 2 σ i 2 ( x i − x ˉ ) 2 ] ( 1 . 2 . 3 4 )
其中 x ˉ \bar{x} x ˉ 是测量的平均值,也就是我们衡量多组不等精度测量结果后最终确定的结果。那么,m m m 组不等精度测量后,测量结果分别为 x 1 x_1 x 1 ,x 2 x_2 x 2 ,⋯ \cdots ⋯ ,x m x_m x m 的概率与 x ˉ \bar{x} x ˉ 的关系式为:
P ( x ˉ ) = ∏ i = 1 m 1 σ i 2 π exp [ − ( x i − x ˉ ) 2 2 σ i 2 ] = A exp [ − ∑ i = 1 m ( x i − x ˉ ) 2 2 σ i 2 ] (1.2.35) P(\bar{x}) = \prod^m_{i=1} \frac{1}{\sigma_i\sqrt{2\pi}} \exp\left[-\frac{(x_i-\bar{x})^2}{2\sigma^2_i}\right] = A \exp\left[-\sum_{i=1}^m\frac{(x_i-\bar{x})^2}{2\sigma^2_i}\right] \tag{1.2.35} P ( x ˉ ) = i = 1 ∏ m σ i 2 π 1 exp [ − 2 σ i 2 ( x i − x ˉ ) 2 ] = A exp [ − i = 1 ∑ m 2 σ i 2 ( x i − x ˉ ) 2 ] ( 1 . 2 . 3 5 )
接下来,我们要寻求上式的极大值。即,x ˉ \bar{x} x ˉ 取何值时,才会从理论上以最大的概率出现我们的测量结果 x 1 x_1 x 1 ,x 2 x_2 x 2 ,⋯ \cdots ⋯ ,x m x_m x m 。那么我们求上式的极值:
d P ( x ˉ ) d x ˉ = d d x ˉ { A exp [ − ∑ i = 1 m ( x i − x ˉ ) 2 2 σ i 2 ] } = 0 ⟹ ∑ i = 1 m x i − x ˉ σ i 2 = 0 ⟹ x ˉ = ∑ i = 1 m x i σ i 2 ∑ i = 1 m 1 σ i 2 (1.2.36) \begin{aligned} \frac{dP(\bar{x})}{d\bar{x}} = \frac{d}{d\bar{x}}\left\{A \exp\left[-\sum_{i=1}^m\frac{(x_i-\bar{x})^2}{2\sigma^2_i}\right]\right\} = 0 \end{aligned} \\ \ \\ \begin{aligned} \Longrightarrow \sum^m_{i=1} \frac{x_i-\bar{x}}{\sigma_i^2} = 0 \end{aligned} \\ \ \\ \Longrightarrow \bar{x} = \frac{\sum_{i=1}^m\frac{x_i}{\sigma_i^2}}{\sum_{i=1}^m\frac{1}{\sigma_i^2}} \tag{1.2.36} d x ˉ d P ( x ˉ ) = d x ˉ d { A exp [ − i = 1 ∑ m 2 σ i 2 ( x i − x ˉ ) 2 ] } = 0 ⟹ i = 1 ∑ m σ i 2 x i − x ˉ = 0 ⟹ x ˉ = ∑ i = 1 m σ i 2 1 ∑ i = 1 m σ i 2 x i ( 1 . 2 . 3 6 )
上式便是在已知的多组测量结果下,最大概率的测量的平均值,这种推导方法称为最大似然法。于是,我们便可以定义:
p i = 1 σ i 2 (1.2.37) p_i = \frac{1}{\sigma_i^2} \tag{1.2.37} p i = σ i 2 1 ( 1 . 2 . 3 7 )
p ~ i = p i ∑ i = 1 m p i (1.2.38) \tilde{p}_i = \frac{p_i}{\sum_{i=1}^mp_i} \tag{1.2.38} p ~ i = ∑ i = 1 m p i p i ( 1 . 2 . 3 8 )
x ˉ = ∑ i = 1 m p i x i ∑ i = 1 m p i = ∑ i = 1 m p ~ i x i (1.2.39) \bar{x} = \frac{\sum_{i=1}^mp_ix_i}{\sum_{i=1}^mp_i} = \sum_{i=1}^m \tilde{p}_ix_i \tag{1.2.39} x ˉ = ∑ i = 1 m p i ∑ i = 1 m p i x i = i = 1 ∑ m p ~ i x i ( 1 . 2 . 3 9 )
其中 ( 1.2.37 ) (1.2.37) ( 1 . 2 . 3 7 ) 式就是各组不等精度测量的权重;( 1.2.38 ) (1.2.38) ( 1 . 2 . 3 8 ) 则是归一化后的权重;( 1.2.39 ) (1.2.39) ( 1 . 2 . 3 9 ) 则是各组不等精度测量的加权算术平均值 ,我们用它来作为我们最终测量的结果。
# 加权算术平均值的标准差\quad 对同一被测量进行 m m m 组不等精度测量,得到 m m m 个测量结果 x 1 x_1 x 1 ,x 2 x_2 x 2 ,⋯ \cdots ⋯ ,x m x_m x m ,并已知各组测量结果的标准差 σ 1 \sigma_1 σ 1 ,σ 2 \sigma_2 σ 2 ,⋯ \cdots ⋯ ,σ m \sigma_m σ m ,那么通过 ( 1.2.37 ) ( 1.2.39 ) (1.2.37)\ (1.2.39) ( 1 . 2 . 3 7 ) ( 1 . 2 . 3 9 ) 两式便可计算各组测得值的权重,以及作为最终测量结果的加权算术平均值。那么至此,我们又该如何评价这个最终结果的标准差呢?我们利用到 ( 1.2.18 ) (1.2.18) ( 1 . 2 . 1 8 ) 式的方差性质,结合 ( 1.2.39 ) (1.2.39) ( 1 . 2 . 3 9 ) 式可得:
D ( x ˉ ) = ( 1 ∑ i = 1 m p i ) 2 ∑ i = 1 m p i 2 D ( x i ) (1.2.40) D(\bar{x}) = \left(\frac{1}{\sum_{i=1}^mp_i}\right)^2 \sum_{i=1}^m p_i^2 D(x_i) \tag{1.2.40} D ( x ˉ ) = ( ∑ i = 1 m p i 1 ) 2 i = 1 ∑ m p i 2 D ( x i ) ( 1 . 2 . 4 0 )
利用标准差与方差的关系,以及 ( 1.2.37 ) (1.2.37) ( 1 . 2 . 3 7 ) 式,可得:
D ( x i ) = σ i 2 = 1 p i (1.2.41) D(x_i) = \sigma_i^2 = \frac{1}{p_i} \tag{1.2.41} D ( x i ) = σ i 2 = p i 1 ( 1 . 2 . 4 1 )
将 ( 1.2.41 ) (1.2.41) ( 1 . 2 . 4 1 ) 代入 ( 1.2.40 ) (1.2.40) ( 1 . 2 . 4 0 ) 式可得:
D ( x ˉ ) = ( 1 ∑ i = 1 m p i ) 2 ∑ i = 1 m p i = 1 ∑ i = 1 m p i (1.2.42) D(\bar{x}) = \left(\frac{1}{\sum_{i=1}^mp_i}\right)^2 \sum_{i=1}^m p_i = \frac{1}{\sum_{i=1}^mp_i} \tag{1.2.42} D ( x ˉ ) = ( ∑ i = 1 m p i 1 ) 2 i = 1 ∑ m p i = ∑ i = 1 m p i 1 ( 1 . 2 . 4 2 )
因此,最终可得加权算术平均值的标准差 为:
σ x ˉ = D ( x ˉ ) = 1 ∑ i = 1 m p i = 1 ∑ i = 1 m 1 σ i 2 (1.2.43) \sigma_{\bar{x}} = \sqrt{D(\bar{x})} = \sqrt{\frac{1}{\sum_{i=1}^mp_i}} = \sqrt{\frac{1}{\sum_{i=1}^m \frac{1}{\sigma_i^2}}} \tag{1.2.43} σ x ˉ = D ( x ˉ ) = ∑ i = 1 m p i 1 = ∑ i = 1 m σ i 2 1 1 ( 1 . 2 . 4 3 )
所以,知道了每组不等精度测得值的标准差,我们便可以利用上式计算出加权算术平均值的标准差,以此作为最终结果的评价。
\quad 我们可以考虑一下,若 m m m 组皆为等精度测量,测量标准差均为 σ \sigma σ ,那么它们的加权算术平均值的标准差则为:
σ x ˉ = 1 m / σ 2 = σ m (1.2.44) \sigma_{\bar{x}} = \sqrt{\frac{1}{m/\sigma^2}} = \frac{\sigma}{\sqrt{m}} \tag{1.2.44} σ x ˉ = m / σ 2 1 = m σ ( 1 . 2 . 4 4 )
咦~~我们发现,这是便回到了 ( 1.2.22 ) (1.2.22) ( 1 . 2 . 2 2 ) 式的测量列算术平均值标准差与测量列单次测量标准差的关系,即很自然地回到了等精度测量时的情况。
# 不等精度测量的例题\quad 用 A , B A,B A , B 两种仪器对 5 V 5\mathrm{~V} 5 V 稳压芯片的输出电压进行两次测量,测量结果分别为 5.005 V 5.005\mathrm{~V} 5 . 0 0 5 V (标准差为 0.006 V 0.006\mathrm{~V} 0 . 0 0 6 V )、5.002 V 5.002\mathrm{~V} 5 . 0 0 2 V (标准差为 0.008 V 0.008\mathrm{~V} 0 . 0 0 8 V ),求该输出电压的最佳估计值,并评估最佳估计值的标准差。
\quad 解 :两种仪器的测量构成了两种不等精度的测量列,两次测量的结果分别为:
U A = 5.005 V , σ A = 0.006 V ; U B = 5.002 V , σ B = 0.008 V U_A = 5.005\mathrm{~V},\quad \sigma_A = 0.006\mathrm{~V};\quad U_B = 5.002\mathrm{~V},\quad \sigma_B = 0.008\mathrm{~V} U A = 5 . 0 0 5 V , σ A = 0 . 0 0 6 V ; U B = 5 . 0 0 2 V , σ B = 0 . 0 0 8 V
它们测量的权重是:
P A : P B = 1 σ A 2 : 1 σ B 2 = 1 6 2 : 1 8 2 = 16 : 9 P_A:P_B = \frac{1}{\sigma^2_A}:\frac{1}{\sigma^2_B} = \frac{1}{6^2}:\frac{1}{8^2} = 16:9 P A : P B = σ A 2 1 : σ B 2 1 = 6 2 1 : 8 2 1 = 1 6 : 9
那么它们的加权平均值,即输出电压的最佳估计值为:
U ˉ = U A P A + U B P B P A + P B = 5.005 × 16 + 5.002 × 9 16 + 9 = 5.004 V \bar{U} = \frac{U_AP_A+U_BP_B}{P_A+P_B} = \frac{5.005\times16+5.002\times9}{16+9} = 5.004\mathrm{~V} U ˉ = P A + P B U A P A + U B P B = 1 6 + 9 5 . 0 0 5 × 1 6 + 5 . 0 0 2 × 9 = 5 . 0 0 4 V
其加权平均值标准差为:
σ V ˉ = 1 1 σ A 2 + 1 σ B 2 = 0.0048 ≈ 0.005 V \sigma_{\bar{V}} = \sqrt{\frac{1}{\frac{1}{\sigma_A^2}+\frac{1}{\sigma_B^2}}} = 0.0048 \approx 0.005\mathrm{~V} σ V ˉ = σ A 2 1 + σ B 2 1 1 = 0 . 0 0 4 8 ≈ 0 . 0 0 5 V
# 随机误差的其他分别\quad 在上面,我们常以随机误差服从正态分布为前提讨论问题。虽然正态分布是随机误差最普遍的分布之一,但并不是唯一的分布规律。例如比较常见的非正态分布就有:均匀分布、反正弦分布、三角分布、χ 2 \chi^2 χ 2 分布、t t t 分布、F F F 分布 等。我不想在这里一一介绍,这太费功夫了。若有需要,以后就自己查阅一下资料吧。
# 系统误差\quad 前面所述的随机误差处理方法,是以测量数据中不含有系统误差为前提。实际上,测量过程中往往存在系统误差,在某些情况下的系统误差数值还比较大。系统误差是由固定不变的或按按照确定规律变化的因素造成的,所以理论上这些因素是科研被掌握的。\quad 在这里,我先说一个困扰我好几个月的问题。在武汉实习的那段时间,我阅读了不少关于离子光频标原理的文献,知道评估离子光频标的不确定度(完整来说是系统不确定度,也是一种系统误差)在许多文献中显得尤为重要。虽然在我导师的博士论文里面也提到了 “基准钟的不确定度其实就是钟的准确度,不确定度越小,准确度越高”,但我仍然无法理解为何这些例如多普勒频移、DC Stark 频移、AC Stark 频移、电四级频移、Zeeman 频移以及黑体辐射频移等为何如此重要。因为我认为,这些频移最多只会引起跃迁频率与理想能级频率差之间的绝对漂移,但一个光钟,