Наименьших квадратов метод

Наименьших квадратов метод (далее Н) один из методов ошибок теории для оценки неизвестных величин по результатам измерений, содержащим случайные ошибки. Н применяется также для приближенного представления заданной функции другими (более простыми) функциями и часто оказывается полезным при наблюдений обработке. Н предложен К. Гауссом (1794—95) и А. Лежандром (1805—06). Первоначально Н использовался для обработки результатов астрономических и геодезических наблюдений. Строгое математическое обоснование и установление границ содержательной применимости Н даны А. А. Марковым (старшим) и А. Н. Колмогоровым. Ныне Н представляет собой один из важнейших разделов математической статистики и широко используется для статистических выводов в различных областях науки и техники.

Сущность обоснования Н (по Гауссу) заключается в допущении, что "убыток" от замены точного (неизвестного) значения физической величины и ее приближенным значением X, вычисленным по результатам наблюдений, пропорционален квадрату ошибки: (X - m)². В этих условиях оптимальной оценкой естественно признать такую лишенную систематической ошибки величину X, для которой среднее значение "убытка" минимально. Именно это требование и составляет основу Н В общем случае отыскание оптимальной в смысле Н оценки Х — задача весьма сложная, поэтому практически эту задачу сужают и в качестве Х выбирают линейную функцию от результатов наблюдений, лишенную систематической ошибки, и такую, для которой среднее значение "убытка" минимально в классе всех линейных функций. Если случайные ошибки наблюдений подчиняются нормальному распределению и оцениваемая величина m зависит от средних значений результатов наблюдений линейно (случай, весьма часто встречающийся в приложениях Н), то решение этой задачи будет одновременно являться и решением общей задачи. При этом оптимальная оценка Х также подчиняется нормальному распределению со средним значением m и, следовательно, плотность вероятности случайной величины Х

при х = Х достигает максимума в точке m = Х (это свойство и выражает точное содержание распространенного в теории ошибок утверждения "оценка X, вычисленная согласно Н, — наиболее вероятное значение неизвестного параметра m").

Случай одного неизвестного. Пусть для оценки значения неизвестной величины m произведено n независимых наблюдений, давших результаты ₁, ₂,..., _n, т. е. ₁ = m + d₁, ₂ = m + d₂,..., _n = m + d_n, где d₁, d₂,..., d_n — случайные ошибки (по определению, принятому в классической теории ошибок, случайные ошибки — независимые случайные величины с нулевым математическим ожиданием: Еd_i = 0; если же Ed_i ¹ 0, то Еd_i, называются систематическими ошибками). Согласно Н, в качестве оценки величины m принимают такое X, для которого будет наименьшей сумма квадратов (отсюда и само название метода):

где p_i = k/s_i² и s_i² = Dd_i = Ed_i²

(коэффициент k > 0 можно выбирать произвольно). Величину p_i называют весом, a s_i — квадратичным отклонением измерения с номером i. В частности, если все измерения равноточны, то s₁ = s₂ =... = s_n, и в этом случае можно положить p₁ = p₂ =... = p_n = 1; если же каждое _i, — арифметическое среднее из n_i, равноточных измерений, то полагают p_i = n_i.

Сумма (X) будет наименьшей, если в качестве Х выбрать взвешенное среднее:

Оценка

величины m лишена систематической ошибки, имеет вес Р и дисперсию

В частности, если все измерения равноточны, то — арифметическое среднее результатов измерений:

При некоторых общих предположениях можно показать, что если количество наблюдений n достаточно велико, то распределение оценки

мало отличается от нормального с математическим ожиданием m и дисперсией k/. В этом случае абсолютная погрешность приближенного равенства

меньше

с вероятностью, близкой к значению интеграла

(напр., (1,96) = 0,950; (2,58) = 0,990; (3,00) = 0,997).

Если веса измерений p_i заданы, а множитель k до наблюдений остается неопределенным, то этот множитель и дисперсия оценки

могут быть приближенно оценены по формулам:

(обе оценки лишены систематических ошибок).

В том практически важном случае, когда ошибки d_i подчиняются нормальному распределению, можно найти точное значение вероятности, с которой абсолютная погрешность приближенного равенства

окажется меньше ts (t — произвольное положительное число). Эту вероятность, как функцию от t, называют функцией распределения Стьюдента с n - 1 степенями свободы и вычисляют по формуле

где постоянная _n_-1 выбрана таким образом, чтобы выполнялось условие: _n_-1(¥) = 1. При больших n формулу (2) можно заменить формулой (1). Однако применение формулы (1) при небольших n привело бы к грубым ошибкам. Так, например, согласно (1), значению = 0,99 соответствует t = 2,58; истинные значения t, определяемые при малых n как решения соответствующих уравнений l_n_-1(t) = 0,99, приведены в таблице:

n	2	3	4	5	10	20	30
t	63,66	9,92	5,84	4,60	3,25	2,86	2,76

Пример. Для определения массы некоторого тела произведено 10 независимых равноточных взвешиваний, давших результаты _i (в г):

_i	18,41	18,42	18,43	18,44	18,45	18,46
n_i	1	3	3	1	1	1

(здесь n_i — число случаев, в которых наблюдался вес _i, причем n = n_i, = 10). Так как все взвешивания равноточные, то следует положить p_i = n_i и в качестве оценки для неизвестного веса m, выбрать величину

Задавая, например, ₉ = 0,95, по таблицам распределения Стьюдента с девятью степенями свободы можно найти, что t = 2,262, и поэтому в качестве предельной абсолютной погрешности приближенного равенства m " 18,431 следует принять величину

Т. о. 18,420 < m < 18,442.

Случай нескольких неизвестных (линейные связи). Пусть n результатов измерений ₁, ₂,..., _n связаны с m неизвестными величинами x₁, x₂,..., х_m (m < n) независимыми линейными отношениями

где a_ij — известные коэффициенты, а d_i — независимые случайные ошибки измерений. Требуется оценить неизвестные величины x_j (эту задачу можно рассматривать как обобщение предыдущей, в которой m = x₁ и m = a_i1 = 1; i = 1,2,..., n).

Так как Еd_i = 0, то средние значения результатов измерений y_i, = Ey_i. связаны с неизвестными величинами x₁, x₂,..., х_m линейными уравнениями (линейные связи):

Следовательно, искомые величины x_j представляют собой решение системы (4), уравнения которой предполагаются совместными. Точные значения измеряемых величин y_i и случайные ошибки d_i обычно неизвестны, поэтому вместо систем (3) и (4) принято записывать так называемые условные уравнения

Согласно Н, качестве оценок для неизвестных x_j применяют такие величины X_j, для которых сумма квадратов отклонений

будет наименьшей (как и в предыдущем случае, p_i — вес измерения _i, — величина, обратно пропорциональная дисперсии случайной ошибки d_i). Условные уравнения, как правило, несовместны, т. е. при любых значениях X_j разности

не могут, вообще говоря, все обратиться в нуль, и в этом случае

также не может обратиться в нуль. Н предписывает в качестве оценок выбрать такие значения X_j, которые минимизируют сумму . В тех исключительных случаях, когда условные уравнения совместны и, значит, обладают решением, это решение совпадает с оценками, полученными согласно Н

Сумма квадратов представляет собой квадратичный многочлен относительно переменных X_j; этот многочлен достигает минимума при таких значениях X₁, X₂,..., Х_m, при которых обращаются в нуль все первые частные производные:

Отсюда следует, что оценки X_j, полученные согласно Н, должны удовлетворять системе так называемых нормальных уравнений, которая в обозначениях, предложенных Гауссом, имеет вид:

где

Оценки X_j, получающиеся в результате решения системы нормальных уравнений, лишены систематических ошибок (Ex_j = x_j); дисперсии Dx_j; величин X_j равны kd_jj/d, где d — определитель системы (5), а d_jj — минор, соответствующий диагональному элементу (ра_ja_j) (иными словами, d_jj/d — вес оценки X_j). Если множитель пропорциональности k (k называется дисперсией на единицу веса) заранее неизвестен, то для его оценки, а также для оценки дисперсии Dx_j служат формулы:

k " /(n - m) и Dx_j " s²_j = Sd_jj/d (n - m)

( — минимальное значение исходной суммы квадратов). При некоторых общих предположениях можно показать, что если количество наблюдений n достаточно велико, то абсолютная погрешность приближенного равенства x_i " X_j меньше ts_j с вероятностью, близкой к значению интеграла (1). Если случайные ошибки наблюдений d_i подчиняются нормальному распределению, то все отношения (X_j - x_j)/s_j распределены по закону Стьюдента с n - m степенями свободы (точная оценка абсолютной погрешности приближенного равенства производится здесь с помощью интеграла (2) так же, как в случае одного неизвестного). Кроме того, минимальное значение суммы в вероятностном смысле не зависит от X₁, X₂,..., X_m и поэтому приближенные значения дисперсий оценок Dx_j " s²_j не зависят от самих оценок X_j.

Один из наиболее типичных случаев применения Н — "выравнивание" таких результатов наблюдений _i, для которых в уравнениях (3) a_ij = a_j(t_i), где a_j(t) — известные функции некоторого параметра t (если t — время, то t₁, t₂,... — те моменты времени, в которые производились наблюдения). Особенно часто встречается в приложениях случай так называемой параболической интерполяции, когда a_j(t) — многочлены (например, a₁(t) = 1, a₂(t) = t, a₃(t) = t²,... и т.д.); если t₂ — t₁ = t₃ — t₂ =... = t_n — t_n_-1, a наблюдения равноточные, то для вычисления оценок X_j можно воспользоваться таблицами ортогональных многочленов, имеющимися во многих руководствах по современной вычислительной математике. Другой важный для приложения случай — так называемая гармоническая интерполяция, когда в качестве a_j(t) выбирают тригонометрические функции (например, a_j(t) = cos (j - 1) t, j = 1, 2,..., m).

Пример. Для оценки точности одного из методов анализа этим методом определялась концентрация в десяти эталонных пробах заранее известного состава. Результаты равноточных наблюдений указаны в таблице (i — номер эксперимента, t_i — истинная концентрация , T_i — концентрация . определенная в результате анализа, _i = T_i - t_i — ошибка анализа):

i	1	2	3	4	5	6	7	8	9	10
t_i	4	8	12,5	16	20	25	31	36	40	40
_i	- 0,3	- 0,2	- 0,4	- 0,4	- 0,2	- 0,5	+ 0,1	- 0,5	-0,6	-0,5

Если результаты анализа не имеют систематических ошибок, то Ey_i = 0. Если же такие ошибки имеются, то в первом приближении их можно представить в виде: Ey_i = a + bt_i (a называется постоянной ошибкой, а bt_i — методической ошибкой) или, что то же самое,

где

Для отыскания оценок a и b достаточно оценить коэффициенты

Условные уравнения в данном случае имеют вид:

поэтому a_i1 = 1, a_i2 = t_i - t (согласно предположению о равноточности наблюдений, все p_i = 1). Так как

то система нормальных уравнений записывается особенно просто:

(a₁a₁) X₁ = (Ya₁); (a₂a₂) X₂ = (Ya₂),

где

Дисперсии компонент решения этой системы суть

где k — неизвестная дисперсия на единицу веса (в данном случае k — дисперсия любой из величин _i). Так как в этом примере компоненты решения принимают значения X₁ = -0,35 и X₂ = -0,00524, то

Dx₁ " s₁² = 0,00427,

Dx₂ " s₂² = 0,0000272,

s₁ = 0,065, s₂ = 0,00522.

Если случайные ошибки наблюдений подчиняются нормальному распределению, то отношения |X_j – x_jl/s_j(j = 1, 2) распределены по закону Стьюдента. В частности, если результаты наблюдений лишены систематических ошибок, то x₁ = x₂ = 0 и, значит, закону Стьюдента должны подчиняться отношения |X₁|/s₁ и |X₂|/s₂. С помощью таблиц распределения Стьюдента с n – m = 8 степенями свободы можно убедиться, что если действительно x₁ = x₂ = 0, то с вероятностью 0,999 каждое из этих отношений не должно превосходить 5,04 и с вероятностью 0,95 не должно превосходить 2,31. В данном случае |X₁|/s₁ = 5,38 > 5,04, поэтому гипотезу отсутствия систематических ошибок целесообразно отвергнуть; в то же время следует признать, что гипотеза об отсутствии методической ошибки (x₂ = 0) не противоречит результатам наблюдений, так как |X₂|/s₂ = 1,004 < 2,31. Т. о., можно заключить, что для определения t по результату наблюдения Т целесообразно пользоваться приближенной формулой t = Т + 0,35.

Во многих практически важных случаях (и в частности, при оценке сложных нелинейных связей) количество неизвестных параметров бывает весьма большим и поэтому реализация Н оказывается эффективной лишь при использовании современной вычислительной техники.

Лит.: Марков А. А., Исчисление вероятностей, 4 изд., М., 1924; Колмогоров А. Н., К обоснованию метода наименьших квадратов, "Успехи математических наук", 1946, т. 1, в. 1; Линник Ю. В., Метод наименьших квадратов и основы математико-статистической теории обработки наблюдений, 2 изд., М., 1962; Helmert . R., Die Ausgieichungsrechnung nach der Methode der kleinsten Quadrate..., 2 Aufl., Lpz., 1907.

Л. Н. Большев.

		Новости 27.07.2024 02:37:36

	Copyright © 1999-2024 Oval.ru, All Rights Reserved.