エラー値。 算術平均誤差と平均二乗誤差

一連の測定値の算術平均 除算の商として定義される 算術和シリーズ n の合計測定数に対するシリーズ Xi のすべての測定結果:

nが増加するにつれて、平均値は は、測定量 X ソースの真の値に近づく傾向があります。 したがって、ほとんどの場合、 確率値誤差が誤差の正規分布則、つまりガウスの法則に従う場合、測定値の算術平均値を取得する必要があります。

ガウスの公式は次の仮定から導き出すことができます。

  • 測定誤差は連続した一連の値をとる可能性があります。
  • 多数観測結果は同じ大きさの誤差ですが、 異なる符号同じくらいの頻度で発生します。
  • 確率、つまりエラーの相対的な発生頻度は、エラーの大きさが増加するにつれて減少します。 言い換えると、 大きな間違い小さいものに比べて一般的ではありません。

正規分布則は次の関数で記述されます。


ここで、σ は平均二乗誤差です。 σ2 – 測定のばらつき。 Xist は測定量の真の値です。

式 (1.13) の分析は、正規分布関数が直線 X = X ソースに関して対称であり、X = X ソースで最大値を持つことを示します。 式 (1.13) の右側に X の代わりに X ist を置くことによって、この最大値の縦座標値を見つけます。

,

したがって、σ が減少すると、y(X) が増加することがわかります。 曲線下の面積


X の測定値が -∞ から +∞ までの範囲に含まれる確率は 1 に等しいため、X は一定で 1 に等しい必要があります (この特性は確率正規化条件と呼ばれます)。

図では、 1.1 は、3 つの σ 値 (σ 3 > σ 2 > σ 1) と 1 つの X ソースに対する 3 つの正規分布関数のグラフを示しています。 正規分布は 2 つのパラメータによって特徴付けられます。 確率変数、これは無限です 大量の測定値 (n → ∞) は、その真の値および分散 σ と一致します。 値 σ は、真とみなされる平均値に対する誤差の広がりを特徴付けます。 σ の値が小さいと、曲線はより急峻になり、ΔХ の値が大きいと、測定結果が乖離する可能性が低くなります。 本当の意味この場合の値は小さくなります。

値を見積もるには ランダムエラー測定方法はいくつかあります。 最も一般的な推定は、標準誤差または二乗平均平方根誤差を使用することです。 算術平均誤差が使用される場合もあります。

一連の n 回の測定における平均の標準誤差 (二乗平均) は、次の式で求められます。

観測値の数が非常に多い場合、値 Sn はランダムな変動の影響を受けて、ある一定の値 σ になる傾向があり、これを統計的限界 Sn と呼びます。

この限界は平均二乗誤差と呼ばれます。 上で述べたように、この量の 2 乗は測定分散と呼ばれ、ガウスの公式 (1.13) に含まれています。

σの値が大きい 実用的な重要性。 ある物理量の測定結果として算術平均を求めてみましょう<Х>若干の誤差ΔXが発生します。 測定量がランダム誤差の影響を受ける場合、測定量の真の値が区間 (<Х>– ΔХ、<Х>+ ΔХ) または (<Х>– ΔХ)< Х < (<Х>+ ΔХ))。 真の値がこの範囲外にある可能性は常にあります。

信頼区間は値の区間です(<Х>– ΔХ、<Х>+ ΔХ) の値 X であり、定義により、X ソースの真の値が所定の確率で該当します。

一連の測定結果の信頼性は、測定値の真の値が所定の信頼区間内に収まる確率です。 測定結果の信頼性または信頼確率は、単位またはパーセントの分数で表されます。

測定結果が真の値とΔХ以下の差がある確率をαとします。 これは通常、次の形式で記述されます。

R((<Х>– ΔХ)< Х < (<Х>+ ΔХ)) = α

式 (1.16) は、α に等しい確率で、測定結果が信頼区間から外れないことを意味します。<Х>– ΔХまで<Х>+ ΔХ。 信頼区間が大きいほど、つまり測定結果の指定誤差 ΔX が大きいほど、X の目標値がこの区間内に収まる可能性が高くなります。 当然のことながら、α の値は取得された測定の数 n に依存します。 指定されたエラー ΔХ についても同様です。

したがって、ランダム誤差の大きさを特徴付けるには、次の 2 つの数値を設定する必要があります。

  • 誤差そのものの大きさ(または信頼区間)。
  • 信頼確率 (信頼性) の値。

対応する信頼確率を示さずに誤差の大きさだけを示すことは、この場合、データがどの程度信頼できるかわからないため、ほとんど意味がありません。 信頼確率を知ることで、得られた結果の信頼性の程度を評価できます。

必要な信頼性の程度は、行われる変更の性質によって決まります。 平均二乗誤差 S n は 0.68 の信頼確率に対応し、2 倍の平均二乗誤差 (2σ) は 0.95 の信頼確率に対応し、3 倍の誤差 (3σ) は 0.997 に対応します。


区間 (X – σ、X + σ) が信頼区間として選択された場合、100 件の測定結果のうち 68 件が必ずこの区間内にあると言えます (図 1.2)。 測定する場合 絶対誤差∆Х > 3σ の場合、この測定は重大なエラーまたはミスに起因すると考えられます。 値 3σ は通常、個々の測定の最大絶対誤差として取得されます (3σ の代わりに測定装置の絶対誤差が取得される場合もあります)。

信頼区間の任意の値について、対応する信頼確率はガウスの公式を使用して計算できます。 これらの計算が実行され、その結果が表にまとめられています。 1.1.

信頼区間の信頼確率 α。平均二乗誤差の分数 ε = ΔX/σ として表されます。

ページ1


算術平均誤差 ft を計算して、系統誤差の存在を確認します。 式 (7) と (7a) の両方を使用して ft を計算するときに、大幅に異なる結果が得られた場合、系統誤差の存在を仮定する理由があります。

算術平均誤差は、系統的誤差が想定される場合、重要な測定に対して計算されます。

平均算術誤差 測定量の真の値 A はほとんどの場合未知であるため、差 (2.1) から個々の測定値の誤差を判断することはできません。

ただし、算術平均誤差は、測定結果の精度に対する大きな誤差の影響を完全に反映しているわけではありません。 現代理論は、より正確な推定値がいわゆる二乗平均平方根誤差であることを示しています。

算術平均誤差 r の利点は、計算が簡単なことです。 ただし、ほとんどの場合、S は分散の効率的な推定量であるため、r よりも S が使用されることが多くなります。

散乱特性は算術平均誤差、平均値です。 二乗誤差、測定結果の範囲。 散乱は本質的に確率的なものであるため、ランダム誤差の値を示す場合には確率が指定されます。


式(6)は、残差を二乗せずに測定結果から算術平均誤差を計算できることを示しています。


円の近くの狭い垂直楕円は、点の縦座標を決定する際の平均算術誤差を示しています。

特定の系列の測定結果の分散は、算術平均誤差によって特徴付けることもできます ( 絶対値)および適応範囲。

誤差値が算術平均誤差の 3 倍以上である p/z 値は拒否の対象となります。 説明された方法論に従って実行された計算では、検討中のフィールドの初期データを拒否する必要性は明らかになりませんでした。

2 番目のグループの式は単一パラメーターであり、ガス - 凝縮系の熱力学研究の結果が欠落している場合に RK を推定することができます。 3 番目のグループの式を使用した計算の平均算術誤差は、互いにほとんど異なりません。 式 (III.116) ~ (III.118) の精度は低く、計算誤差は算術平均近似 pk の 3 ~ 16% しか減少しません。 式 (III.119) および (III.120) は実際には初期標準偏差を減少させません。

測定精度を評価するには、理論 ランダムエラーいわゆる確率誤差 g と多数の測定値の算術平均誤差も含まれます。

ここで、検討中の系列には、算術平均からの最大偏差 (u - 6 3) を与える 2 次元 (271 3) が存在しないと仮定します。 この2つを比較すると 最後の数字最初の例の同様の誤差の値を使用すると、系列の算術平均誤差は個々の誤差の存在にあまり影響されないことがわかります。 大きなエラー、チャム平均二乗誤差 a。 これは、系列の算術平均誤差の方法を使用して測定の信頼性を評価する場合の重大な欠点です。 したがって、単純さという利点にもかかわらず、算術平均誤差法が使用されることは比較的まれです。

測定したものを持たせてください 既知の値大きさ バツ. 当然のことながら、この量の個々の値は測定プロセス中に見つかります バツ1 , バツ2 ,… xn明らかに完全に正確ではありません。つまり、 一致しない バツ. その場合、値は絶対誤差になります 番目の次元。 でも結果の本当の意味は バツ, 通常は不明であるため、絶対誤差の実際の推定値が X の代わりに使用されます。 平均 , これは次の式で計算されます。



ただし、サンプルサイズが小さい場合は、代わりに 使用するのが望ましい 中央値. 中央値 (私)は、結果の半分が より小さい値を持ち、残りの半分が より大きい値を持つような確率変数 x の値です。 まあ。 計算するには まあ結果は昇順に並べられます。つまり、いわゆる変動系列を形成します。 奇数の測定値 n の場合、中央値は系列の中間項の値に等しくなります。 例えば、
n=3の場合
偶数 n の場合、値は まあ 2 つの平均結果の値の合計の半分に等しくなります。 例えば、
n=4の場合

計算用 s最後の小数点以下の桁が不正確な、四捨五入されていない分析結果を使用します。
サンプル数が非常に大きい場合 ( n>) ランダム誤差は、正規のガウス分布則を使用して説明できます。 小さいとき n通常とは分布が異なる場合がございます。 数学的統計では、このさらなる信頼性の低さは、修正された対称法によって排除されます。 t-分布。 ある程度の係数はある t、スチューデント係数と呼ばれる、自由度の数に応じて ( f) と信頼確率 ( R) を使用すると、サンプルから母集団に移動できます。
平均結果の標準偏差は次の式で求められます。

値は平均値の信頼区間です。 シリアル分析の場合、通常は次のように仮定されます。 R= 0,95.

表 1. スチューデント係数の値( t)


f

例1 . サンプル中のマンガン含有量の 10 回の測定から、1 回の分析の標準偏差と平均値の信頼区間を計算する必要があります。 Mn%: 0.69; 0.68; 0.70; 0.67; 0.67; 0.69; 0.66; 0.68; 0.67; 0.68。
解決。 式(1)を用いて解析の平均値を計算します。

表によると 1 (付録) f=n-1=9 のスチューデント係数を求めます (P=0.95) t=2.26 を計算し、平均値の信頼区間を計算します。 したがって、分析の平均値は間隔 (0.679 ± 0.009) % Mn によって決定されます。

例 2 . 20℃における尿素溶液の水蒸気圧の 9 回の測定の平均は 2.02 kPa です。 測定値のサンプル標準偏差 s = 0.04 kPa。 95% の信頼確率に相当する 9 つの測定値と 1 つの測定値の平均の信頼区間の幅を決定します。
解決。 信頼水準 0.95、f = 8 の t 係数は 2.31 です。 それを考えると
そして、次のことがわかります。
- 幅は信頼されます。 平均値の間隔
- 幅は信頼されます。 単一値測定の間隔

含有量の異なるサンプルの分析結果がある場合は、部分平均から s平均することで全体の平均値を計算できます s。 持っている メートルサンプルと各サンプルの導電性 ニュージャージー州並列定義の場合、結果は表形式で表示されます。

番号
サンプル

分析番号

誤差とは、測定値の真の値からの測定結果の偏差です。 さまざまな特性に応じて、エラーはタイプに分類されます(図 2.9)。

絶対誤差 () - 測定値 () と真 (実際) 値の差によって表され、測定値の単位で表される誤差。

相対誤差() - 測定値の真 (実際) 値に対する絶対誤差の比率で表され、パーセントで表される誤差。

減少誤差 () - 標準値 () に対する絶対誤差の比率。

正規化値は、機器の片面目盛りまたは機器の 2 桁目盛りの場合は測定範囲にゼロ値がある場合は測定上限値と同じとみなされます。

系統誤差は、繰り返しの測定または数値の変化中に一定のままになる誤差です。

永続 系統的エラー通常、測定器の計量学的信頼性の指標が高いか不十分であることを示し、確立して排除することができます。系統的な誤差を排除するために補正テーブルが導入されることもあります。

自然に発生する系統誤差は、表面の磨耗や酸化などのプロセスが発生するため、測定機器の経年変化によって引き起こされます。 このようなエラーの存在により、測定器の検証と校正の必要性が決まります。

ランダム誤差 - 繰り返し測定中にランダムに変化する誤差。 これらの誤差は予測不可能であるため、測定できず、除去することもできませんが、測定を繰り返し、その後、方法によってランダム誤差の特性を決定することで、その影響を軽減できます。 数学的統計。 ランダム誤差がゼロに近づくことは、測定の収束と呼ばれます。

静的誤差 - 測定中に測定値が変化しない場合の測定器の誤差。 この場合、測定量の実際の値は変化せず、絶対誤差は一定のままであると想定されます。

動的誤差とは、測定中に測定値が変化した場合の測定器の誤差です。 たとえば、温度計で温度を測定する場合、水銀の温度が変化し、水銀柱が目盛上の対応するマークに到達するまでに時間が経過する必要があります。 この間に測定対象物の温度が変化すると動的誤差が発生します。

除去可能なエラーは、識別して除去できる系統的なエラーです。 除去できない誤差には系統誤差とランダム誤差が含まれますが、ランダム誤差の一部は除去できないため、測定結果にはランダム性が生じます。

基本エラー - 対応するエラー 通常の状態測定器の応用。 こうした条件が成立している 規制文書測定器の種類または個々の種類について。 ほとんどの場合、周囲温度、相対湿度、大気圧といった外部条件が確立されます。 標準的なアプリケーション条件に対応する基本的なエラーを分離することは、次の 1 つです。 重要な要素測定の均一性を確保します。

追加エラー - 影響を与える量の 1 つが基準値から逸脱したときに発生するエラー 正常値。 区別するのが慣例です 追加のエラー個々の要因による: 追加の温度誤差、変化による誤差 大気圧等々。

器差 - 測定器の欠陥、設計、技術的特徴、影響によって決まる測定器の誤差。 外部条件、干渉など。 器差は誤差の最も重要な要素の 1 つであり、系統的またはランダムに発生する可能性があります。

方法論的誤差は、使用された測定技術の不完全性によって決定される誤差です。 方法論的エラーには、測定対象のモデルを理想的に再現できないことも含まれます。 ほとんどの場合 方法論上の誤り体系的です。

主観的誤差は、次のような原因で生じる計数誤差です。 個々の特性測定を行う被験者(オペレータ)。 この誤差はオペレータの注意力と集中力の程度によって決まり、系統的に発生することもあれば、ランダムに発生することもあります。

許容誤差とは、規制および技術文書によって確立されるか、計算によって決定される誤差のことです。

許容できない誤差とは、測定結果が信頼できず、考慮に入れることができない場合の誤差です。

許容できないエラーは次のように呼ばれます。 失礼エラー、または 間違い。重大なエラーをタイムリーに検出して排除することが重要です。

測定結果に影響を与える何らかの要因の影響により、重大な誤差が発生する可能性があります。 ただし、ほとんどの場合、重大な誤差の原因は、機器の誤った読み取り値または外部環境の予期せぬ変化です。

大きく分けて2つあります 重大なエラーを検出する方法:

単一測定エラーは、期待される測定結果がほぼわかっている場合、たとえば標準やゲージを使用して測定器の動作を確認する場合や、対象物を体系的に測定する場合に検出できます。 物理量それは実質的には変わりません。

複数の測定誤差は、観測結果の統計分析を使用して確立できます。 たとえば、果物や野菜の自然損失を決定する場合、10 個以上の物体の質量が測定されます。 最初の測定値と最終測定値の間の結果として生じる差から、質量損失が得られます。 テスターはすぐに「外れ値」に注意を払います 総数結果。

重大なエラーを排除する方法:

1. 1 回の測定で特定された重大な誤差は、測定を繰り返して複数の測定に変換することで除去できます。

2. いつ 複数の測定重大なエラーは、次の方法を使用して排除されます。

「スリーシグマ」ルール。

測定結果の数学的処理。

「スリー シグマ」ルールでは、サイズが 3 シグマを超える誤差は重大であるとみなされると規定されています。

シグマ () - 方程式によって計算された標準偏差

ここで、 は 1 回の測定における数量の実際の値です。 - 複数回の測定中の測定値の算術平均値。 -- 測定の数。

この場合、信頼区間が計算されます。 これには、正規分布の法則に従って信頼できると考えられる測定量の値が含まれます。 この間隔外の値は誤りとみなされ、信頼性が低いとして除外されます。 測定結果は、除外された値を考慮して再計算されます。

たとえば、ナッツの平均重量を測定する場合、10 個の試験片の重量を測定します。 次の結果が得られました: 15、19、20、21、22、18、22、20、25、17 g. ナッツの平均重量は 19.9 g です。 = 2。 信頼区間(20 2、または 18.2 ..22.2) に等しい。 その先には値 15 があります。 17; 18 と 25 は除外され、20.7 g の修正結果が得られます。

数学的処理測定結果は規格によって規定されています。