实验室检测有限数据的统计管理

　　随机误差分布的规律给数据处理提供了理论基础，但它是对无限多次测量而言。实际实验室工作中我们只做有限次测量，并把它看作是从无限总体中随机抽出的一部分，称之为样本。样本中包含的个数叫样本容量，用n表示。

　　数据的趋势 → 数据集中趋势的表示

　　1. 算术平均值

　　n次测定数据的平均值。是总体平均值的最佳估计。对于有限次测定，测量值总朝算术平均值集中，即数值出现在算术平均值周围;对于无限次测定，即n → ∞时， →μ。

　　2. 中位数M

　　将数据按大小顺序排列，位于正中间的数据称为中位数M。

　　n为奇数时，居中者即是;n为偶数时，正中间两个数据的平均值即是。

　　数据的趋势 → 数据分散程度的表示

　　1. 极差R(或称全距)：指一组平行测定数据中最大者(Xmax)和最小者(Xmin)之差。

　　R = Xmax - Xmin

　　2. 平均偏差：各次测量值与平均值的偏差的绝对值的平均。

　　绝对偏差 di = Xi - (i =1,2,…,n )

　　平均偏差

　　相对平均偏差

　　3. 标准偏差S：计算方法

　　标准偏差S =

　　相对标准偏差，也叫变异系数，用CV表示，一般计算百分率。

　　相对标准偏差RSD = ×100 %

　　自由度f：f = n-1

　　平均值的置信度区间 → 定义

　　1. 置信度

　　置信度表示对所做判断有把握的程度。　表示符号：P 。

　　有时我们对某一件事会说“我对这个事有八成的把握”。这里的“八成把握”就是置信度，实际是指某事件出现的概率。

　　常用置信度：P=0.90，P=0.95;或P=90%，P=95%。

　　2. 置信度区间

　　按照t分布计算，在某一置信度下以个别测量值为中心的包含有真值的范围，叫个别测量值的置信度区间。

　　1. t的定义与对比。

　　2. t分布曲线

　　(1) t分布曲线：t分布曲线的纵坐标是概率密度，横坐标是t，这时随机误差不按正态分布，而是按t分布。

　　(2) 与正态分布关系：t分布曲线随自由度f变化，当n→∞时，t分布曲线即是正态分布。

　　t分布曲线

　　【t分布值表】

　　由表可知，当f→∞ 时，S→σ，t即是u。

　　实际上，当f=20时，t与u已十分接近。

　　3. 平均值的置信度区间：

　　(1) 表示方法：

　　(2) 含义：在一定置信度下，以平均值为中心，包括总体平均值的置信度区间。

　　(3) 计算方法：

　　① 求出测量值的，S，n。

　　② 根据要求的置信度与f值，从t分布值表中查出t值。

　　③ 代入公式计算。

　　显著性检验 → 平均值与标准值比较

　　常用的方法有两种：t检验法和F检验法。

　　分析工作中常遇到两种情况：样品测定平均值和样品标准值不一致;两组测定数据的平均值不一致。需要分别进行平均值与标准值比较和两组平均值的比较。

　　1. 比较方法

　　用标准试样做几次测定，然后用t检验法检验测定结果的平均值与标准试样的标准值之间是否存在差异。

　　2. 计算方法

　　① 求t 。

　　② 根据置信度(通常取置信度95%)和自由度f，查t分布表中t 值。

　　③ 比较t 和t ，若t ﹥t ，说明测定的平均值出现在以真值为中心的95%概率区间之外，平均值与真实值有显著差异，我们认为有系统误差存在。

　　例：某化验室测定标样中CaO含量得如下结果：CaO含量=30.51%,S=0.05,n=6, 标样中CaO含量标准值是30.43%,此操作是否有系统误差?(置信度为95%)

　　解：t = = 3.92

　　查表：置信度95%，f=5时，t =2.57。比较可知t >t 。

　　说明：此操作存在系统误差。

　　显著性检验 → 两组平均值的比较

　　常用的方法有两种：t检验法和F检验法。

　　1. 比较方法

　　用两种方法进行测定，结果分别为，S ，n ; ,S ，n 。然后分别用F检验法及t检验法计算后,比较两组数据是否存在显著差异。

　　2. 计算方法

　　(1)精密度的比较——F检验法：

　　①求F计算： F = >1

　　②由F表根据两种测定方法的自由度，查相应F值进行比较。

　　【表2-2　95%置信水平(a=0.05)时单侧检验F值(部分)】

　　③若F >F ，说明 S 和S 差异不显著，进而用t检验平均值间有无显著差异。若F >F ，S 和S 差异显著。

　　(2)平均值的比较：

　　①求t :t =

　　若S 与S 无显著差异，取S 作为S。

　　②查t值表，自由度f=n +n -2。

　　③若t >t ，说明两组平均值有显著差异。

　　例：Na CO 试样用两种方法测定结果如下：

　　方法1： =42.34，S =0.10，n =5。

　　方法2： =42.44，S =0.12，n =4。

　　比较两结果有无显著差异。

　　离群值的取舍

　　1. 定义

　　在一组平行测定数据中，有时会出现个别值与其他值相差较远，这种值叫离群值。

　　判断一个测定值是否是离群值，不是把数据摆在一块看一看，那个离得远，那个是离群值，而是要经过计算、比较才能确定，我们用的方法就叫Q检验法。

　　2. 检验方法

　　(1)求Q ：Q =

　　即：求出离群值与其最邻近的一个数值的差，再将它与极差相比就得Q 值。

　　(2)比较：根据测定次数n和置信度查Q ，若Q >Q ，则离群值应舍去，反之则保留离群值。

　　方法的选择

　　方法的选择要根据分析试样的组成确定分析方法。

　　常量组分测定：重量法、滴定法。准确度高，灵敏度低。

　　微量组分测定：仪器分析测定。准确度高，灵敏度较差。

　　准确度的提高

　　1. 减少测量误差

　　测定过程中要进行重量、体积的测定，为保证分析结果的准确度，就必须减少测量误差。

　　例：在重量分析中，称重是关键一步，应设法减少称量误差。

　　要求：称量相对误差<0.1%。

　　一般分析天平的称量误差为±0.0001克，试样重量必须等于或大于0.2克，才能保证称量相对误差在0.1%以内。

　　2. 增加平行测定次数，减少随机误差

　　增加平行测定次数，可以减少随机误差，但测定次数过多，没有太大的意义，反而增加工作量，一般分析测定时，平行测定4-6次即可。

　　3. 消除测定过程中的系统误差

　　3.1 检查方法：对照法

　　(1)对照试验：选用组成与试样相近的标准试样进行测定，测定结果与标准值作统计处理，判断有无系统误差。

　　(2)比较试验：用标准方法和所选方法同时测定某一试样，测定结果做统计检验，判断有无系统误差。

　　(3)加入法：称取等量试样两份，在其中一份试样中加入已知量的待测组分，平行进行两份试样测定，由加入被测组分量是否定量回收，判断有无系统误差。又叫回收实验。

　　3.2 消除方法

　　(1)做空白实验：在不加试样的情况下，按试样分析步骤和条件进行分析实验，所得结果为空白值，从试样测定结果中扣除。可以消除试剂、蒸馏水和容器引入的杂质。

　　(2)校准仪器：对砝码、移液管等进行校准，消除仪器引起的系统误差。

　　(3)引用其它方法校正。

文章分类