测量不确定度的核心概念与评定逻辑
一、测量不确定度的本质:概率性的分散性量化
测量不确定度是基于现有信息,对“被测量合理取值范围”的概率性描述,是与测量结果绑定的参数。它的核心内涵需拆解为三点:
“合理赋予”:不是主观猜测,而是结合测量数据、校准证书、技术手册等所有可用信息的最佳估计;
“分散性”:描述被测量可能取值的分布范围(比如“质量约100g,大概率在99.8g到100.2g之间”),而非“测量值与真实值的偏差”(误差是绝对的、不可知的,不确定度是概率的、可知的);
“与结果相联系”:不确定度不能独立存在——谈论“不确定度”时,必须明确是“某测量结果的不确定度”(如“100g±0.2g的不确定度是0.2g”)。
二、标准不确定度:用标准差定义的基础参数
标准不确定度是以标准差(Standard Deviation)为量化工具的测量不确定度,符号为`u`。它是不确定度的“最小单位”,关键理解点:
- 标准差是统计中描述“数据分散程度”的经典指标(正态分布下,68%的数据落在均值±1倍标准差内,95%落在±2倍内);
- 标准不确定度≠“测量标准的不确定度”——“测量标准”是具体的计量器具(如校准用的基准天平),而标准不确定度是参数的表征方式(无论用什么器具测量,只要用标准差描述分散性,就是标准不确定度)。
三、标准不确定度分量:A类与B类的互补
测量结果通常由多个“输入量”(如质量、尺寸、电流)计算得到,每个输入量的不确定度称为标准不确定度分量。分量的评定分两类,区别仅在于“信息来源”,无优劣之分:
(一)A类评定:用观测列的统计规律
A类评定是对“相同条件下独立观测数据”进行统计分析,得到分量,符号`u_A`。它的本质是“用样本推断总体”——通过重复测量的小样本,估计总体的分散性。
1. 前提:“相同条件+独立观测”
相同条件:同一仪器、同一操作者、同一环境(温度/湿度稳定),排除系统变化的干扰;

独立观测:每次测量结果无关联(比如第5次测量不依赖第4次的结果)。
2. 计算:算术平均值的实验标准差
对输入量`Q`测`n`次(`n
$$\bar{q} = \frac{1}{n}\sum_{j=1}^n q_j$$
平均值的实验标准差(即A类分量)为:
$$u_A(\bar{q}) = \frac{s(q)}{\sqrt{n}}$$
其中`s(q)`是观测值的样本标准差:
$$s(q) = \sqrt{\frac{1}{n-1}\sum_{j=1}^n (q_j - \bar{q})^2}$$
3. 小样本的改进:合并样本标准差`s_p`
当`n<10`时,小样本的统计结果可靠性低(比如测3次质量,样本标准差波动大)。此时可采用合并样本标准差`s_p`——它是“长期重复测量的组内方差平均值的平方根”(比如生产线半年内的100组测量数据,每组测5次,`s_p`是这100组样本标准差的加权平均)。`s_p`更稳定,适合“统计控制下的常规测量”(如批量产品的质量检测)。
(二)B类评定:用外部信息的经验推断
B类评定是用“非重复观测的信息”估计分量,符号`u_B`。它解决了“无法重复测量”的问题(比如仪器校准证书只给单次结果),核心是“将经验、文档转化为标准差”。
1. 信息来源(必须可靠)
B类评定的信息需可追溯,常见来源:
- 校准/检定证书(给出扩展不确定度与包含因子);
- 仪器技术手册(如“重复性±0.1%”);
- 行业标准/规范(如“滴定管的允许误差±0.02mL”);
- 实验经验(如“手动读数的误差约±0.05mm”)。
2. 典型计算方法
(1)已知扩展不确定度`U`与包含因子`k`
若校准证书写“扩展不确定度`U=0.2mg`,`k=2`”,则:
$$u_B = \frac{U}{k} = \frac{0.2}{2} = 0.1mg$$
- `U`是“置信区间半宽”(`k=2`时,95%的概率包含真实值);
- `k`是“扩展倍数”(正态分布下,`k=2`对应95%置信度,`k=3`对应99%)。
(2)已知上下限的均匀分布
若输入量在`[a₋, a₊]`间均匀分布(比如游标卡尺精度`±0.02mm`,值在`-0.02`到`+0.02`间等概率出现),则:
$$u_B = \frac{a}{\sqrt{3}}$$
其中`a=(a₊-a₋)/2`(区间半宽)。均匀分布的方差是`a²/3`,故标准差为`a/√3`。
(3)由重复性限`r`计算
重复性限`r`是“相同条件下两次测量的最大允许差”(如标准方法规定“r=0.3%”)。两次测量差的方差为`2u_B²`(独立变量方差相加),故:
$$u_B = \frac{r}{\sqrt{2}}$$
(4)已知置信水平的正态分布
若文档仅给“95%置信度下,值在`100±0.5`之间”,则查正态分布表得`k=1.96`(95%置信度对应),计算:
$$u_B = \frac{0.5}{1.96} ≈ 0.255$$
四、合成标准不确定度:多分量的综合
当测量结果`y`由多个输入量`X₁,X₂,…,Xₙ`通过函数`y=f(X₁,X₂,…,Xₙ)`计算时,合成标准不确定度`u_C(y)`是这些分量的“综合效应”,符号`u_C`。
1. 独立输入量的合成(最常见)
若输入量互不相关(如质量`m`与尺寸`r`无关联),合成公式为:
$$u_C(y) = \sqrt{\sum_{i=1}^n \left(\frac{\partial f}{\partial X_i}\right)^2 u(X_i)^2}$$
其中`∂f/∂X_i`是灵敏度系数(描述`X_i`变化对`y`的影响程度,如`y=IR`中,`∂y/∂I=R`,电流`I`的不确定度会放大`R`倍影响电压`y`)。
2. 相关输入量的合成
若输入量相关(如电流`I`与电阻`R`均来自同一电源,变化趋势一致),需加入协方差项:
$$u_C(y) = \sqrt{\sum_{i=1}^n \left(\frac{\partial f}{\partial X_i}\right)^2 u(X_i)^2 + 2\sum_{i 协方差`Cov(X_i,X_j)`描述相关性大小(正相关时协方差为正,负相关为负)。 五、扩展不确定度:给结果加“置信区间”
扩展不确定度是将合成标准不确定度扩展`k`倍后的区间半宽,符号`U`,公式:
$$U = k \cdot u_C(y)$$
它的作用是让测量结果“可理解”——比如:
这句话的意思是:基于现有信息,金属块的真实密度有95%的概率落在63.5~63.9 g/cm³之间。
六、完整评定流程:从模型到报告
测量不确定度的评定是“逻辑闭环”,需按以下步骤执行:
1. 建模型:明确输入与输出的关系
测量模型是`y=f(X₁,X₂,…,Xₙ)`,基于物理规律或实验经验(如:
- 密度:`ρ=m/(πr²h)`(`m`质量,`r`半径,`h`高度);
- 电压:`U=IR`(`I`电流,`R`电阻)。
模型不是唯一的(如体积可通过“排水法”或“尺寸计算”得到,对应不同模型)。
2. 评分量:A类或B类
对每个输入量`X_i`,用A类(可重复测量)或B类(外部信息)评`u(X_i)`。
3. 算合成:用传播公式
根据模型的函数关系,计算`u_C(y)`(独立输入用方差和的平方根,相关输入加协方差)。
4. 扩区间:选`k`值
选包含因子`k`(通常`k=2`,对应95%置信度),算`U=k·u_C(y)`。
5. 写报告:清晰完整
报告需包含:
- 被测量值(如`63.7 g/cm³`);
- 扩展不确定度(如`±0.2 g/cm³`);
- 包含因子与概率(如`k=2`,95%)。
七、实例:金属块密度的不确定度评定
1. 任务与方法
测圆柱形金属块密度`ρ`,方法:天平测质量`m`,游标卡尺测直径`d`(`r=d/2`)与高度`h`,用`ρ=m/(πr²h)`计算。
2. 实测数据
- `m`测5次:100.1g、100.2g、100.0g、100.1g、100.2g → 平均`m=100.12g`;
- `d`测3次:10.00mm、10.02mm、9.98mm → 平均`d=10.00mm`(`r=5.00mm`);
- `h`测3次:20.00mm、20.02mm、19.98mm → 平均`h=20.00mm`。
3. 评输入量的不确定度
`m`的`u(m)`:A类`u_A=0.036g`(样本标准差`0.08g`,`n=5`),B类`u_B=0.05g`(校准证书`U=0.1g`,`k=2`)→ 合成`u(m)=√(0.036²+0.05²)=0.0616g`;
`r`的`u(r)`:A类`u_A=0.00575mm`(`d`的样本标准差`0.02mm`,`n=3`),B类`u_B=0.0115mm`(游标卡尺均匀分布`±0.02mm`)→ 合成`u(r)=0.0128mm`;
`h`的`u(h)`:同`r`,`u(h)=0.0128mm`。
4. 算合成标准不确定度
模型`ρ=m/(πr²h)`,灵敏度系数:
- `∂ρ/∂m=1/(πr²h)=1/1.5708≈0.6366 cm³/g`;
- `∂ρ/∂r=-2ρ/r=-2*63.74/5≈-25.5 g/(cm³·mm)`;
- `∂ρ/∂h=-ρ/h=-63.74/20≈-3.187 g/(cm³·mm)`。
合成`u_C(ρ)=√[(0.6366*0.0616)² + (-25.5*0.0128)² + (-3.187*0.0128)²]≈0.1 g/cm³`。
5. 扩展与报告
`k=2`,`U=2*0.1=0.2 g/cm³`,报告:
总结
测量不确定度的核心是“概率性的分散性描述”,A类与B类评定互补,合成与扩展将多源信息整合为可理解的区间。它不是“否定测量结果的准确性”,而是“告诉用户结果的可靠程度”——科学的测量,从来不是“给一个值”,而是“给一个有置信度的范围”。