Факторный анализ

Факторный анализ (далее Ф) раздел статистического анализа многомерного,. объединяющий методы оценки размерности множества наблюдаемых переменных посредством исследования структуры ковариационных или корреляционных матриц. Основное предположение Ф заключается в том, что корреляционные связи между большим числом наблюдаемых переменных определяются существованием меньшего числа гипотетических ненаблюдаемых переменных или факторов. В терминах случайных величин – результатов наблюдений X₁,..., X_n общей моделью Ф служит следующая линейная модель:

(*),

,

где случайные величины f_jсуть общие факторы, случайные величины _i суть факторы, специфические для величин X_i и не коррелированные с f_j, а e_i; суть случайные ошибки. Предполагается, что k < n задано, случайные величины e_i независимы между собой и с величинами f_j и _i и имеют Еe_i = 0, De_i = s²_i. Постоянные коэффициенты a_ij называются факторными нагрузками (нагрузка i-й переменной на j-й фактор). Значения a_ij, b_i, и s²_i считаются неизвестными параметрами, подлежащими оценке. В указанной форме модель Ф отличается некоторой неопределенностью, т.к. n переменных выражаются здесь через n + k других переменных. Однако уравнения (*) заключают в себе гипотезу о ковариационной матрице, которую можно проверить. Например, если факторы f_j некоррелированы и c_ij – элементы матрицы ковариаций между величинами X_i, то из уравнений (*) следует выражение для c_ijчерез факторные нагрузки и дисперсии ошибок:

.

Т. о., общая модель Ф равносильна гипотезе о ковариационной матрице, а именно о том, что ковариационная матрица представляется в виде суммы матрицы А = {a_ij} и диагональной матрицы L с 2 элементами s²_i.

Процедура оценивания в Ф состоит из двух этапов: оценки факторной структуры – числа факторов, необходимого для объяснения корреляционной связи между величинами X_i, и факторной нагрузки, а затем оценки самих факторов по результатам наблюдения. Принципиальные трудности при интерпретации набора факторов состоят в том, что при k > 1 ни факторные нагрузки, ни сами факторы не определяются однозначно, т.к. в уравнении (*) факторы f_j могут быть заменены любым ортогональным преобразованием. Это свойство модели используется в целях преобразования (вращения) факторов, которое выбирается так, чтобы наблюдаемые величины имели бы максимально возможные нагрузки на один фактор и минимальные нагрузки на остальные факторы. Существуют различные практические способы оценки факторных нагрузок, имеющие смысл в предположении, что X_i,..., Xn подчиняются многомерному нормальному распределению с ковариационной матрицей С = {с_ij}. Выделяется максимального правдоподобия метод, который приводит к единственным оценкам для c_ij, но для оценок a_ij дает уравнения, которым удовлетворяет бесчисленное множество решений, одинаково хороших по статистическим свойствам.

Ф возник и первоначально разрабатывался в задачах психологии (1904). Область его приложения значительно шире – Ф находит применение при решении различных практических задач в медицине, экономике, химии и т.д. Однако многие результаты и методы Ф пока еще не обоснованы, хотя практики ими широко пользуются. Математическое строгое описание современного Ф – задача весьма трудная и до сих пор в полной мере не решенная.

Лит.: Лоул и Д., Максвелл А., Ф как статистический метод, пер. с англ., М., 1967; Харман Г., Современный факторный анализ, пер. с англ., М., 1972.

А. В. Прохоров.

		Новости 12.03.2026 06:20:38

	Copyright © 1999-2024 Oval.ru, All Rights Reserved.