Центр системной оптимизации бизнеса и управления качеством - факторный анализ. Дисперсионный анализ (ANOVA) Пошаговый пример в STATISTICA

Факторный анализ является одним из наиболее мощных статистических средств анализа данных. В его основе лежит процедура объединения групп коррелирующих друг с другом переменных («корреляционных плеяд» или «корреляционных узлов») в несколько факторов.

Иными словами, цель факторного анализа - сконцентрировать исходную информацию, выражая большое число рассматриваемых признаков через меньшее число более емких внутренних характеристик, которые, однако, не поддаются непосредственному измерению (и в этом смысле являются латентными).

Для примера гипотетически представим себе законодательный орган регионального уровня, состоящий из 100 депутатов. В числе разных вопросов повестки дня на голосование выносятся: а) законопроект, предлагающий восстановить памятник В.И. Ленину на центральной площади города - административного центра региона; б) обращение к Президенту РФ с требованием вернуть в государственную собственность все стратегические производства. Матрица сопряженности показывает следующее распределение голосов депутатов:

	Памятник Ленину (за)	Памятник Ленину (против)
Обращение к Президенту (за)	49	4
Обращение к Президенту (против)	6	41

Очевидно, что голосования статистически связаны: подавляющее большинство депутатов, поддерживающих идею восстановления памятника Ленину, поддерживают и возвращение в государственную собственность стратегических предприятий. Аналогичным образом большинство противников восстановления памятника являются в то же время и противниками возврата предприятий в госсобственность. При этом тематически голосования между собой совершенно не связаны.

Логично предположить, что выявленная статистическая связь обусловлена существованием некоторого скрытого (латентного) фактора. Законодатели, формулируя свою точку зрения по самым разнообразным вопросам, руководствуются ограниченным, небольшим набором политических позиций. В данном случае можно предположить наличие скрытого раскола депутатского корпуса по критерию поддержки/отвержения консервативно-социалистических ценностей. Выделяется группа «консерваторов» (согласно нашей таблице сопряженности - 49 депутатов) и их оппонентов (41 депутат). Выявив такие расколы, мы сможем описать большое число отдельных голосований через небольшое число факторов, которые являются латентными в том смысле, что мы не можем их обнаружить непосредственно: в нашем гипотетическом парламенте ни разу не проводилось голосование, в ходе которого депутатам предлагалось бы определить свое отношение к консервативно-социалистическим ценностям. Мы обнаруживаем наличие данного фактора, исходя из содержательного анализа количественных связей между переменными. Причем, если в нашем примере сознательно взяты номинальные переменные - поддержка законопроекта с категориями «за» (1) и «против» (0), - то в действительности факторный анализ эффективно обрабатывает интервальные данные.

Факторный анализ очень активно используется как в политической науке, так и в «соседних» социологии и психологии. Одна из важных причин большой востребованности данного метода состоит в разнообразии задач, которые можно решать с его помощью. Так, выделяются по крайней мере три «типовые» цели факторного анализа:

· уменьшение размерности (редукция) данных. Факторный анализ, выделяя узлы взаимосвязанных признаков и сводя их к неким обобщенным факторам, уменьшает исходный базис признаков описания. Решение этой задачи важно в ситуации, когда объекты измерены большим числом переменных и исследователь ищет способ сгруппировать их по смысловому признаку. Переход от множества переменных к нескольким факторам позволяет сделать описание более компактным, избавиться от малоинформативных и дублирующих переменных;

Выявление структуры объектов или признаков (классификация). Эта задача близка к той, которая решается методом кластер-анализа. Но если кластер-анализ принимает за «координаты» объектов их значения по нескольким переменным, то факторный анализ определяет положение объекта относительно факторов (связанных групп переменных). Иными словами, с помощью факторного анализа можно оценить сходство и различие объектов в пространстве их корреляционных связей, или в факторном пространстве. Координатными осями факторного пространства выступают полученные латентные переменные, на эти оси проецируются рассматриваемые объекты, что позволяет создать наглядное геометрическое представление изучаемых данных, удобное для содержательной интерпретации;

Косвенное измерение. Факторы, являясь латентными (эмпирически не наблюдаемыми), не поддаются непосредственному измерению. Однако факторный анализ позволяет не только выявить латентные переменные, но и оценить количественно их значение для каждого объекта.

Рассмотрим алгоритм и интерпретацию статистики факторного анализа на примере данных о результатах парламентских выборов в Рязанской области 1999 г. (общефедеральный округ). Для упрощения примера возьмем электоральную статистику только по тем партиям, которые преодолели 5%-ный барьер. Данные взяты в разрезе территориальных избирательных комиссий (по городам и районам области).

Первым шагом будет стандартизация данных путем перевода их в стандартные баллы (так называемые Л-баллы, рассчитываемые с помощью функции нормального распределения).

ТИК (территориальная избирательная комиссия)	«Яблоко»	«Единство»	Блок Жириновского	ОВР	КПРФ	СПС
Ермишинская	1,49	35,19	6,12	5,35	31,41	2,80
Захаровская	2,74	18,33	7,41	11,41	31,59	л б 3 "
Кадомская	1,09	29,61	8,36	5,53	35,87	1,94
Касимовская	1,30	39,56	5,92	5,28	29,96	2,37
Касимовская городская	3,28	39,41	5,65	6,14	24,66	4,61
То же в стандартизированных баллах (г-баллах)
Ермишинская	-0,83	1,58	-0,25	-0,91	-0,17	-0,74
Захаровская	-0,22	-1,16	0,97	0,44	-0,14	0,43
Кадомская	-1,03	0,67	1,88	-0,87	0,59	-1,10
Касимовская	-0,93	2,29	-0,44	-0,92	-0,42	-0,92
Касимовская городская	0,04	2,26	-0,70	-0,73	-1,32	0,01
И т.д. (всего 32 случая)

	«Яблоко»	«Единство»	БЖ	ОВР	КПРФ	СПС
«Яблоко»
«Единство»	-0,55
БЖ	-0,47	0,27
ОВР	0,60	-0,72	-0,47
КПРФ	-0,61	0,01	0,10	-0,48
СПС	0,94	-0,45	-0,39	0,52	-0,67

Уже визуальный анализ матрицы парных корреляций позволяет сделать предположения о составе и характере корреляционных плеяд. К примеру, положительные корреляции обнаруживаются для «Союза правых сил», «Яблока» и блока «Отечество - вся Россия» (пары «Яблоко» - ОВР, «Яблоко» - СПС и ОВР - СПС). Одновременно эти три переменные отрицательно коррелируют с КПРФ (поддержка КПРФ), в меньшей степени - с «Единством» (поддержка «Единства») и в еще меньшей - с переменной БЖ (поддержка «Блока Жириновского»). Таким образом, предположительно мы имеем две выраженные корреляционные плеяды:

(«Яблоко» + ОВР + СПС) - КПРФ;

(«Яблоко» + ОВР + СПС) - «Единство».

Это две разные плеяды, а не одна, так как между «Единством» и КПРФ связи нет (0,01). Относительно переменной БЖ предположение сделать сложнее, здесь корреляционные связи менее выражены.

Чтобы проверить наши предположения, необходимо ВЫЧИСлить собственные значения факторов (eigenvalues), факторные значения (factor scores) и факторные нагрузки (factor loadings) для каждой переменной. Такие расчеты достаточно сложны, требуют серьезных навыков работы с матрицами, поэтому здесь мы не станем рассматривать вычислительный аспект. Скажем лишь, что эти вычисления могут осуществляться двумя путями: методом главных компонент (principal components) и методом главных факторов (principal factors). Метод главных компонент более распространен, статистические программы используют его «по умолчанию».

Остановимся на интерпретации собственных значений, факторных значений и факторных нагрузок.

Собственные значения факторов для нашего случая таковы:

bgcolor=white>5

Фактор	Собственное значение	% общей вариации
1	3,52	58,75
2	1,14	19,08
3	0,76	12,64
4	0,49	S.22
0,05	0.80
6	0,03	0,51
Всего	6	100%

Чем больше собственное значение фактора, тем больше его объяснительная сила (максимальное значение равно количеству переменных, в нашем случае 6). Одним из ключевых элементов статистики факторного анализа является показатель «% общей вариации» (% total variance). Он показывает, какую долю вариации (изменчивости) переменных объясняет извлеченный фактор. В нашем случае вес первого фактора превосходит вес всех остальных факторов, вместе взятых: он объясняет почти 59% общей вариации. Второй фактор объясняет 19% вариации, третий - 12,6% и т.д. по убывающей.

Имея собственные значения факторов, мы можем приступить к решению задачи сокращения размерности данных. Редукция произойдет за счет исключения из модели факторов, обладающих наименьшей объяснительной силой. И здесь ключевой вопрос состоит в том, сколько факторов оставить в модели и какими критериями при этом руководствоваться. Так, явно лишними являются факторы 5 и 6, в совокупности объясняющие чуть более 1% всей вариации. А вот судьба факторов 3 и 4 уже не столь очевидна.

Как правило, в модели остаются факторы, собственное значение которых превышает единицу (критерий Кайзера). В нашем случае это факторы 1 и 2. Однако полезно проверить корректность удаления четырех факторов с помощью других критериев. Одним из наиболее широко используемых методов является анализ «графика осыпи» (scree plot). Для нашего случая он имеет вид:

График получил свое название из-за сходства со склоном горы. «Осыпь» - геологический термин, обозначающий обломки горных пород, скапливающиеся в нижней части скалистого склона. «Скала» - это по-настоящему влиятельные факторы, «осыпь» - статистический шум. Образно говоря, нужно найти место на графике, где кончается «скала» и начинается «осыпь» (где убывание собственных значений слева направо сильно замедляется). В нашем случае выбор нужно сделать из первого и второго перегибов, соответствующих двум и четырем факторам. Оставив четыре фактора, мы получим очень высокую точность модели (более 98% общей вариации), но сделаем ее достаточно сложной. Оставив два фактора, мы будем иметь значительную необъясненную часть вариации (около 22%), но модель станет лаконичной и удобной в анализе (в частности, визуальном). Таким образом, в данном случае лучше пожертвовать некоторой долей точности в пользу компактности, оставив первый и второй факторы.

Проверить адекватность полученной модели можно с помощью специальных матриц воспроизведенных корреляций (reproduced correlations) и остаточных коэффициентов (residual correlations). Матрица воспроизведенных корреляций содержит коэффициенты, которые удалось восстановить по двум оставленным в модели факторам. Особое значение в ней имеет главная диагональ, на которой расположены общности переменных (в таблице выделены курсивом), которые показывают, насколько точно модель воспроизводит корреляцию переменной с той же переменной, которая должна составлять единицу.

Матрица остаточных коэффициентов содержит разность между исходным и воспроизведенным коэффициентами. Например, воспроизведенная корреляция между переменными СПС и «Яблоко» составляет 0,88, исходная - 0,94. Остаток = 0,94 - 0,88 = 0,06. Чем ниже значения остатков, тем выше качество модели.

Воспроизведенные корреляции
	«Яблоко»	«Единство»	БЖ	ОВР	КПРФ	СПС
«Яблоко»	0,89
«Единство»	-0,53	0,80
БЖ	-0,47	0,59	0,44
ОВР	0,73	-0,72	-0,56	0,76
КПРФ	-0,70	0,01	0,12	-0,34	0,89
СПС	0,88 -0,43		-0,40	0,66	-0,77	0,88
Остаточные коэффициенты
	«Яблоко»	«Единство»	БЖ	ОВР	КПРФ	СПС
«Яблоко»	0,11
«Единство»	-0,02	0,20
БЖ	0,00	-0,31	0,56
ОВР	-0,13	-0,01	0,09	0,24
КПРФ	0,09	0,00	-0,02	-0,14	0,11
СПС	0,06	-0,03	0,01	-0,14	0,10	0,12

Как видно из матриц, двухфакторная модель, будучи в целом адекватной, плохо объясняет отдельные связи. Так, очень низкой является общность переменной БЖ (всего 0,56), слишком велико значение остаточного коэффициента связи БЖ и «Единства» (-0,31).

Теперь необходимо решить, насколько важным для данного конкретного исследования является адекватное представление переменной БЖ. Если важность высока (к примеру, если исследование посвящено анализу электората именно этой партии), корректно вернуться к четырехфакторной модели. Если нет, можно оставить два фактора.
Принимая во внимание учебный характер наших задач, оставим более простую модели.

Факторные нагрузки можно представить как коэффициенты корреляции каждой переменной с каждым из выявленных факторов 1ак, корреляция между значениями первой факторной переменной и значениями переменной «Яблоко» составляет -0,93. Все факторные нагрузки приводятся в матрице факторного отображения-

Чем теснее связь переменной с рассматриваемым фактором, тем выше значение факторной нагрузки. Положительный знак факторной нагрузки указывает на прямую, а отрицательный знак - на обратную связь переменной с фактором.

Имея значения факторных нагрузок, мы можем построить геометрическое представление результатов факторного анализа. По оси X отложим нагрузки переменных на фактор 1, по оси Y- нагрузки переменных на фактор 2 и получим двухмерное факторное пространство.

Перед тем как приступить к содержательному анализу полученных результатов, осуществим еще одну операцию - вращение (rotation). Важность этой операции продиктована тем, что существует не один, а множество вариантов матрицы факторных нагрузок, в равной степени объясняющих связи переменных (матрицу интеркорреляций). Необходимо выбрать такое решение, которое проще интерпретировать содержательно. Таковым считается матрица нагрузок, в которой значения каждой переменной по каждому фактору максимизированы или минимизированы (приближены к единице или к нулю).

Рассмотрим схематичный пример. Имеется четыре объекта, расположенных в факторном пространстве следующим образом:

Нагрузки на оба фактора для всех объектов существенно отличны от нуля, и мы вынуждены привлекать оба фактора для интерпретации положения объектов. Но если «повернуть» всю конструкцию по часовой стрелке вокруг пересечения осей координат, получим следующую картинку:

В данном случае нагрузки на фактор 1 будут близки к нулю, а нагрузки на фактор 2 - к единице (принцип простой структуры). Соответственно, для содержательной интерпретации положения объектов мы будем привлекать только один фактор - фактор 2.

Существует довольно большое количество методов вращения факторов. Так, группа методов ортогонального вращения всегда сохраняет прямой угол между координатными осями. К таковым относятся vanmax (минимизирует количество переменных с высокой факторной нагрузкой), quartimax (минимизирует количество факторов, необходимых для объяснения переменной), equamax (сочетание двух предыдущих методов). Методы косоугольного вращения не обязательно сохраняют прямой угол между осями (например, direct obiimin). Метод promax представляет собой сочетание ортогонального и косоугольного методов вращения. В большинстве случаев используется метод vanmax, который дает хорошие результаты применительно и к большинству задач политических исследований. Кроме того, как и в процессе применения многих других методов, рекомендуется поэкспериментировать с различными техниками вращения.

В нашем примере после вращения методом varimax получаем следующую матрицу факторных нагрузок:

Соответственно, геометрическое представление факторного пространства будет иметь вид:

Теперь можно приступить к содержательной интерпретации полученных результатов. Ключевую оппозицию - электоральный раскол - по первому фактору формируют КПРФ с одной стороны и «Яблоко» и СПС (в меньшей степени ОВР) - с другой. Содержательно - исходя из специфики идеологических установок названных субъектов избирательного процесса - мы можем интерпретировать данное размежевание как «лево-правый» раскол, являющийся «классическим» для политической науки.

Оппозицию по фактору 2 формируют ОВР и «Единство». К последнему примыкает «Блок Жириновского», но достоверно судить о его положении в факторном пространстве мы не можем в силу особенностей модели, которая плохо объясняет связи именно этой переменной. Чтобы объяснить такую конфигурацию, необходимо вспомнить политические реалии избирательной кампании 1999 г. Тогда борьба внутри политической элиты привела к формированию двух эшелонов «партии власти» - блоков «Единство» и «Отечество - вся Россия». Различие между ними не носило идеологического характера: фактически населению предложили выбирать не из двух идейных платформ, а из двух элитных групп, каждая из которых располагала существенными властными ресурсами и региональной поддержкой. Таким образом, этот раскол можно интерпретировать как «властно-элитный» (или, несколько упрощая, «власть - оппозиция»).

В целом мы получаем геометрическое представление некоего электорального пространства Рязанской области для данных выборов, если понимать электоральное пространство как пространство электорального выбора, структуру ключевых политических альтернатив («расколов»). Комбинация именно этих двух расколов была очень типична для парламентских выборов 1999 г.

Сопоставляя результаты факторного анализа для одного и того же региона на разных выборах, мы можем судить о наличии преемственности в конфигурации пространства электорального выбора территории. К примеру, факторный анализ федеральных парламентских выборов (1995, 1999 и 2003 гг.), проходивших в Татарстане, показал устойчивую конфигурацию электорального пространства. Для выборов 1999 г. в модели оставлен всего один фактор с объяснительной силой 83% вариации, что сделало невозможным построение двухмерной диаграммы. В соответствующем столбце приведены факторные нагрузки.

Если внимательно присмотреться к этим результатам, можно заметить, что в республике от выборов к выборам воспроизводится один и тот же основной раскол: «"партия власти” - все остальные». «Партией власти» в 1995 г. выступал блок «Наш дом - Россия» (НДР), в 1999 г. - ОВР, в 2003 г. - «Единая Россия». С течением времени меняются лишь «детали» - название «партии власти». Новый политический «лейбл» очень легко ложится в статичную матрицу одномерного политического выбора.

В заключение главы дадим один практический совет. Успешность освоения статистических методов по большому счету возможна только при интенсивной практической работе со специальными программами (уже неоднократно упомянутые SPSS, Statistica или хотя бы Microsoft Excel). Не случайно изложение статистических техник ведется нами в режиме алгоритмов работы: это позволяет студенту самостоятельно пройти все стадии анализа, сидя за компьютером. Без попыток практического анализа реальных данных представление о возможностях статистических методов в политическом анализе неизбежно останется общим и абстрактным. А на сегодняшний день умение применять статистику для решения и теоретических, и прикладных задач - принципиально важная составляющая модели специалиста-политолога.

Контрольные вопросы и задания

1. Каким уровням измерения соответствуют средние величины - мода, медиана, среднее арифметическое? Какие меры вариации характерны для каждой из них?

2. В силу каких причин необходимо учитывать форму распределения переменных?

3. Что означает утверждение: «Между двумя переменными имеется статистическая связь»?

4. Какую полезную информацию о связях между переменными можно получить на основе анализа таблиц сопряженности?

5. Что можно узнать о связи между переменными, исходя из значений статистических критериев хи-квадрат и лямбда?

6. Дайте определение понятию «ошибка» в статистических исследованиях. Каким образом по данному показателю можно судить о качестве построенной статистической модели?

7. Какова основная цель корреляционного анализа? Какие характеристики статистической связи выявляет данный метод?

8. Как интерпретировать значение коэффициента корреляции Пирсона?

9. Охарактеризуйте метод дисперсионного анализа. В каких других статистических методах используется статистика дисперсионного анализа и для чего?

10. Объясните значение понятия «нулевая гипотеза».

11. Что такое линия регрессии, каким методом она строится?

12. Что показывает коэффициент R в итоговой статистике регрессионного анализа?

13. Поясните термин «метод многомерной классификации».

14. Объясните основные различия между кластеризацией посредством иерархического кластер-анализа и методом К-средних.

15. Каким образом кластер-анализ может использоваться при изучении имиджа политических лидеров?

16. Какова основная задача, решаемая посредством дискриминантного анализа? Дайте определение дискриминантной функции.

17. Назовите три класса задач, решаемых с помощью факторного анализа. Конкретизируйте понятие «фактор».

18. Дайте характеристику трем основным методам проверки качества модели в факторном анализе (критерий Кайзера, критерий «осыпи», матрица воспроизведенных корреляций).

Міжнародна міграція фінансових ресурсів у контексті факторного аналізу

25. Ж.-Б. Сэй вошел в историю экономической науки как автор факторной теории стоимости. Каковы основные положения этой теории?

Технико-экономический анализ строительного проекта и анализ обеспечения по запрашиваемому строительному кредиту

Все явления и процессы хозяйственной деятельности предприятий находятся во взаимосвязи и взаимообусловленности. Одни из них непосредственно связаны между собой, другие косвенно. Отсюда важным методологическим вопросом в экономическом анализе является изучение и измерение влияния факторов на величину исследуемых экономических показателей.

Факторный анализ в учебной литературе трактуется как раздел многомерного статистического анализа, объединяющий методы оценки размерности множества наблюдаемых переменных посредством исследования структуры ковариационных или корреляционных матриц.

Свою историю факторный анализ начинает в психометрике и в настоящее время широко используется не только в психологии, но и в нейрофизиологии, социологии, политологии, в экономике, статистике и других науках. Основные идеи факторного анализа были заложены английским психологом и антропологом Ф. Гальтоном . Разработкой и внедрением факторного анализа в психологии занимались такие ученые как: Ч.Спирмен, Л.Терстоун и Р.Кеттел . Математический факторный анализ разрабатывался Хотеллингом, Харманом, Кайзером, Терстоуном, Такером и другими учеными.

Данный вид анализа позволяет исследователю решить две основные задачи: описать предмет измерения компактно и в то же время всесторонне. С помощью факторного анализа возможно выявление факторов, отвечающих за наличие линейных статистических связей корреляций между наблюдаемыми переменными.

Цели факторного анализа

К примеру, анализируя оценки, полученные по нескольким шкалам, исследователь отмечает, что они сходны между собой и имеют высокий коэффициент корреляции, в этом случае он может предположить, что существует некоторая латентная переменная , с помощью которой можно объяснить наблюдаемое сходство полученных оценок. Такую латентную переменную называют фактором, который влияет на многочисленные показатели других переменных, что приводит к возможности и необходимости отметить его как наиболее общий, более высокого порядка.

Таким образом, можно выделить две цели факторного анализа :

определение взаимосвязей между переменными, их классификация, т. е. «объективная R-классификация»;
сокращение числа переменных.

Для выявления наиболее значимых факторов и, как следствие, факторной структуры, наиболее оправданно применять метод главных компонентов . Суть данного метода состоит в замене коррелированных компонентов некоррелированными факторами. Другой важной характеристикой метода является возможность ограничиться наиболее информативными главными компонентами и исключить остальные из анализа, что упрощает интерпретацию результатов. Достоинство данного метода также в том, что он - единственный математически обоснованный метод факторного анализа.

Факторный анализ - методика комплексного и системного изучения и измерения воздействия факторов на величину результативного показателя.

Типы факторного анализа

Существуют следующие типы факторного анализа:

1) Детерминированный (функциональный) - результативный показатель представлен в виде произведения, частного или алгебраической суммы факторов.

2) Стохастический (корреляционный) - связь между результативным и факторными показателями является неполной или вероятностной.

3) Прямой (дедуктивный) - от общего к частному.

4) Обратный (индуктивный) - от частного к общему.

5) Одноступенчатый и многоступенчатый.

6) Статический и динамический.

7) Ретроспективный и перспективный.

Также факторный анализ может быть разведочным - он осуществляется при исследовании скрытой факторной структуры без предположения о числе факторов и их нагрузках и конфирматорным , предназначенным для проверки гипотез о числе факторов и их нагрузках. Практическое выполнение факторного анализа начинается с проверки его условий.

Обязательные условия факторного анализа:

Все признаки должны быть количественными;
Число признаков должно быть в два раза больше числа переменных;
Выборка должна быть однородна;
Исходные переменные должны быть распределены симметрично;
Факторный анализ осуществляется по коррелирующим переменным.

При анализе в один фактор объединяются сильно коррелирующие между собой переменные, как следствие происходит перераспределение дисперсии между компонентами и получается максимально простая и наглядная структура факторов. После объединения коррелированность компонент внутри каждого фактора между собой будет выше, чем их коррелированность с компонентами из других факторов. Эта процедура также позволяет выделить латентные переменные, что бывает особенно важно при анализе социальных представлений и ценностей.

Этапы факторного анализа

Как правило, факторный анализ проводится в несколько этапов.

Этапы факторного анализа:

1 этап. Отбор факторов.

2 этап. Классификация и систематизация факторов.

3 этап. Моделирование взаимосвязей между результативным и факторными показателями.

4 этап. Расчет влияния факторов и оценка роли каждого из них в изменении величины результативного показателя.

5 этап. Практическое использование факторной модели (подсчет резервов прироста результативного показателя).

По характеру взаимосвязи между показателями различают методы детерминированного и стохастического факторного анализа

Детерминированный факторный анализ представляет собой методику исследования влияния факторов, связь которых с результативным показателем носит функциональный характер, т. е. когда результативный показатель факторной модели представлен в виде произведения, частного или алгебраической суммы факторов.

Методы детерминированного факторного анализа : Метод цепных подстановок; Метод абсолютных разниц; Метод относительных разниц; Интегральный метод; Метод логарифмирования.

Данный вид факторного анализа наиболее распространен, поскольку, будучи достаточно простым в применении (по сравнению со стохастическим анализом), позволяет осознать логику действия основных факторов развития предприятия, количественно оценить их влияние, понять, какие факторы, и в какой пропорции возможно и целесообразно изменить для повышения эффективности производства.

Стохастический анализ представляет собой методику исследования факторов, связь которых с результативным показателем в отличие от функциональной является неполной, вероятностной (корреляционной). Если при функциональной (полной) зависимости с изменением аргумента всегда происходит соответствующее изменение функции, то при корреляционной связи изменение аргумента может дать несколько значений прироста функции в зависимости от сочетания других факторов, определяющих данный показатель.

Методы стохастического факторного анализа : Способ парной корреляции; Множественный корреляционный анализ; Матричные модели; Математическое программирование; Метод исследования операций; Теория игр.

Необходимо также различать статический и динамический факторный анализ. Первый вид применяется при изучении влияния факторов на результативные показатели на соответствующую дату. Другой вид представляет собой методику исследования причинно-следственных связей в динамике.

И, наконец, факторный анализ может быть ретроспективным, который изучает причины прироста результативных показателей за прошлые периоды, и перспективным, который исследует поведение факторов и результативных показателей в перспективе.

Факторный анализ прибыли позволяет оценить влияние каждого фактора в отдельности на финансовый результат в целом. Читайте, как его провести, а также скачайте методику проведения.

Суть факторного анализа

Суть факторного метода в том, чтобы определить влияние каждого фактора в отдельности на результат в целом. Это достаточно сложно сделать, так факторы влияют друг на друга, а если фактор не количественный (например, сервис), то его вес оценивают экспертным путем, что накладывает на весь анализ отпечаток субъективности. Кроме того, когда факторов влияющих на результат становится слишком много, то данные невозможно обрабатывать и рассчитывать без специальных программ математического моделирования.

Одним из самых главных финансовых показателей предприятия является прибыль. В рамках факторного анализа лучше анализировать маржинальную прибыль, где постоянные расходы отсутствуют, либо прибыль от продаж.

Узнайте причины изменений с помощью Excel-модели

Скачайте готовую модель в Excel. Она поможет узнать, как повлияли на выручку объем продаж, цена и структура продаж.

Факторный анализ методом цепных подстановок

При факторном анализе экономисты обычно применяют метод цепных подстановок, однако математически данный метод является некорректным и выдает сильно перекошенные результаты, которые значительно различаются в зависимости от того, какие переменные подставляют вначале, а какие после (например, в таблице 1).

Таблица 1 . Анализ выручки в зависимости от цены и количества проданной продукции

	Базовый год		Текущий год		Прирост выручки
		Выручка В 0		Выручка В 0	За счет цены В p	За счет количества В q
Вариант 1					P 1 Q 0 -P 0 Q 0	P 1 Q 1 -P 1 Q 0	В 1 -В 0
Вариант 1
Вариант 2					P 1 Q 1 -P 0 Q 1	P 0 Q 1 -P 0 Q 0	В 1 -В 0
Вариант 2

В первом варианте выручка за счет цены выросла на 500 рублей, а во втором на 600 рублей; выручка за счет количества в первом выросла на 300 рублей, а во втором всего на 200 рублей. Таким образом, результаты значительно разнятся в зависимости от порядка подстановки. .

Можно более корректно распределять факторы, влияющие на конченый результат в зависимости от наценки (Нац) и количества продаж (Кол) (см. рисунок 1).

Рисунок 1

Формула прироста прибыли за счет наценки: П нац = ∆ Нац * (Кол (тек) + Кол (баз)) / 2

Формула прироста прибыли за счет количества: П кол = ∆ Кол * (Нац (тек) + Нац (баз)) / 2

Пример двухфакторного анализа

Рассмотрим в таблице 2 пример.

Таблица 2 . Пример двухфакторного анализа выручки

	Базовый год		Текущий год		Прирост выручки
		Выручка В 0		Выручка В 0	За счет наценки В p	количества В q
					∆ P(Q 1 +Q 0)/2	∆ Q(P 1 +P 0)/2	В 1 -В 0
Товар «А»

Получились усредненные величины между вариантами цепных подстановок (см. таблицу 1).

Трехфакторная модель для анализа прибыли

Трехфакторная модель значительно сложнее двухфакторной (рисунок 2).

Рисунок 2

Формула, по которой определяют влияние каждого фактора в 3-х факторной модели (например, наценка, количество, номенклатура) на общий результат похожа на формулу в двухфакторной, но уже сложнее.

П нац = ∆Нац * ((Кол (тек) * Ном (тек) + Кол (баз) * Ном (баз)) / 2 - ∆Кол * ∆Ном / 6)

П кол = ∆Кол * ((Нац (тек) * Ном (тек) + Нац (баз) * Ном (баз)) / 2 - ∆Нац * ∆Ном / 6)

П ном = ∆Ном * ((Нац (тек) * Кол (тек) + Нац (баз) * Кол (баз)) / 2 - ∆Нац * ∆Кол / 6)

Пример анализа

В таблице мы привели пример использования трехфакторной модели.

Таблица 3 . Пример расчета выручки по трехфакторной модели

Прошлый год	Текущий год	Факторы выручки
				Номенклатура
		∆ Q((N 1 P 1 + N 0 P 0) / 2 - - ∆ N ∆ P/6)	∆ P((N 1 Q 1 + N 0 Q 0) / 2 - - ∆ N ∆ Q/6)	∆ N ((Q 1 P 1 + Q 0 P 0) / 2 - - ∆ Q ∆ P/6)

Если посмотреть на полученные результаты анализа выручки факторным методом, то наибольший прирост выручки произошел за счет повышения цен. Цены повысились на (15 / 10 - 1) * 100% = 50%, следующим по значимости оказалось увеличение номенклатуры с 3 до 4 ед.– темп прироста (4 / 3 - 1) * 100% = 33% и на последнем месте «количество», которое возросло всего на (120/100-1)*100% = 20%. Таким образом, факторы влияют на прибыль пропорционально темпу роста.

Четырехфакторная модель

К сожалению, для функции вида Пр = Kол ср * Ном * (Цен - Cеб), не существует простых формул расчета влияния каждого отдельного фактора на показатель.

Пр – прибыль;

Kол ср – среднее количество на единицу номенклатуры;

Ном – количество номенклатурных позиций;

Цена – цена;

Есть метод расчета, основанный на теореме Лагранжа о конечных приращениях, с использованием дифференциального и интегрального исчислений, однако он настолько сложный и трудоемкий, что практически не применим в реальной жизни.

Поэтому для вычленения каждого отдельного фактора сначала вычисляются более общие факторы по обычной двухфакторной модели, а затем уже их составляющие тем же способом.

Общая формула прибыли: Пр = Кол * Нац (Нац – наценка на ед. продукции). Соответственно, мы определяем влияние двух факторов: количества и наценки. В свою очередь количество проданной продукции зависит от номенклатуры и количества продаж приходящихся в среднем на единицу номенклатуры.

Получаем Кол = Kол ср * Ном. А наценка зависит от цены и себестоимости, т.е. Нац = Цен – Себ. В свою очередь влияние себестоимости на изменение прибыли зависит от количества проданной продукции и от изменения самой себестоимости.

Таким образом, нам надо по отдельности определить влияние 4-х факторов на изменение прибыли: Кол, Цена, Себ, Ном, используя 4 уравнения:

Пр = Кол * Нац
Кол = Kол ср * Ном
Затр = Кол * Себ.
Выр = Кол * Цена

Пример анализа по четырехфактороной модели

Рассмотрим это на примере. Исходные данные и расчеты в таблице

Таблица 4 . Пример анализа прибыли по 4-х факторной модели

Прошлый год
		Кол (ср) Q (ср 0)				Прибыль П 0
						Q 0 *(P 0 -С 0)




			∑Q 0 P 0 / ∑Q 0	∑Q 0 P 0 / ∑Q 0

Текущий год
		Кол (ср) Q (ср 1)
						Q 1 *(P 1 -С 1)



Итоговые и средневзвешенные значения
			∑Q 1 P 1 /∑Q 1	∑Q 1 P 1 /∑Q 1

Влияние фактора на изменение прибыли
Ном N ∆	Кол Q ∆	Кол (ср) Q (ср)∆	Цен P ∆		Нац Н ∆
∆N * (Q (ср 0) +Q (ср 1)) / 2 * (H 1 + H 0) / 2	∆Q*(H 1 + H 0) / 2	∆Q (ср) * (N 1 + N 0) / 2 * (H 1 + H 0) / 2	∆P * (Q 1 + Q 0) / 2	∆С * (Q 1 + Q 0) / 2	∆H * (Q 1 +Q 0)/2



Итоговые и средневзвешенные значения

Примечание: цифры в таблице Excel могут на несколько единиц не совпадать с данным в текстовом описании, т.к. в таблице они округлены до десятых.

1. Сначала по двухфакторной модели (описанной в самом начале) раскладываем изменение прибыли на количественный фактор и фактор наценки. Это факторы первого порядка.

Пр = Кол * Нац

Кол ∆ = ∆Q * (H 1 + H 0) / 2 = (220 - 180) * (3,9 + 4,7) / 2 = 172

Нац ∆ = ∆H * (Q 1 + Q 0) / 2 = (4,7 - 3,9) * (220 + 180) / 2 = 168

Проверка: ∆Пр = Кол ∆ + Нац ∆ = 172+168 = 340

2. Вычисляем зависимость от параметра себестоимости. Для этого раскладываем затраты на количество и себестоимость по той же формуле, но со знаком минус, так как себестоимость снижает прибыль.

Затр = Кол * Себ

Себ∆ = - ∆С*(Q1+Q0) / 2 = -(7,2 - 6,4) * (180 + 220) / 2 = -147

3. Вычисляем зависимость от цены. Для этого раскладываем выручку на количество и цену по той же формуле.

Выр = Кол*Цена

Цена∆ = ∆P * (Q1 + Q0) / 2 = (11,9 - 10,3) * (220 + 180) / 2 = 315

Проверка: Нац∆ = Цена∆ - Себ∆ = 315 - 147 = 168

4. Вычисляем влияние номенклатуры на прибыль. Для этого раскладываем количество проданной продукции на число единиц в ассортименте и среднее количество, приходящееся на одну единицу номенклатуры. Так мы определим соотношение фактора количества и номенклатуры в натуральном выражении. После этого умножаем полученные данные на среднегодовую наценку и переводим в рубли.

Кол = Ном * Кол (ср)

Ном ∆ = ∆N * (Q (ср 0) + Q (ср 1)) / 2 * (H 1 + H 0) / 2 = (3 - 2) (73 + 90) / 2 * (4,7 + 3,9) = 352

Кол (ср) = ∆Q (ср) *(N 1 + N 0) / 2 * (H 1 + H 0) / 2 = (73 - 90) * (2 + 3) / 2 * (4,7 + 3,9) = -180

Проверка: Кол ∆ = Ном ∆ + Кол (ср) = 352-180 = 172

Приведенный четырехфакторный анализ показал, что прибыль увеличилась по сравнению с прошлым годом за счет:

повышения цен на 315 тыс. руб.;
изменения номенклатуры на 352 тыс. руб.

А уменьшилась за счет:

роста себестоимости на 147 тыс. руб.;
падения количества продаж на 180 тыс. руб.

Казалось бы, парадокс: общее количество единиц проданных в текущем году по сравнению с прошлым увеличилось на 40 единиц, но при этом фактор количества показывает отрицательный результат. Это потому что рост продаж произошел за счет увеличения номенклатурных единиц. Если в прошлом году их было всего 2, то в текущем добавилась еще одна. При этом по количеству товар «Б» продали в отчетном году на 20 ед. меньше, чем в предыдущем.

Это говорит о том, что товар «С» введенный в новом году частично заместил товар «Б», но привлек к себе новых покупателей, которых не было у товара «Б». Если в следующем году товар «Б» продолжит утрачивать свои позиции, то его можно выводить из ассортимента.

Что касается цен, то их повышение на (11,9/10,3 – 1)*100% = 15,5% не сильно затронуло продажи в целом. Если судить по товару «А», который не затронули структурные изменения ассортимента, то его продажи выросли на 20%, не смотря на рост цены на 33%. Это означает, что рост цен не является для фирмы критичным.

С себестоимостью все понятно: она выросла и прибыль уменьшилась.

Факторный анализ прибыли от продаж

Евгений Шагин , финансовый директор УК «РусЧерМет»

Чтобы провести факторный анализ, необходимо:

выбрать базу для анализа – выручка от продаж, прибыль;
отобрать факторы, влияние которых необходимо оценить. В зависимости от выбранной базы анализа ими могут быть: объем продаж, себестоимость, операционные расходы, внереализационные доходы, проценты за кредит, налоги;
оценить влияние каждого фактора на итоговый показатель. В базовый расчет по предыдущему периоду подставить значение выбранного фактора из отчетного периода и скорректировать итоговый показатель с учетом этих изменений;
определить влияние фактора. Вычесть из полученного промежуточного значения оцениваемого показателя его фактическое значение за предыдущий период. Если цифра положительная, изменение фактора оказало позитивное влияние, отрицательная – негативное.

Пример факторного анализа прибыли от продаж

Рассмотрим на примере. В отчет о финансовых результатах компании «Альфа» за предыдущий период подставим значение объема продаж за текущий период (571 513 512 руб. вместо 488 473 087 руб.), все остальные показатели останутся прежними (см. таблицу 5). Как результат, чистая прибыль увеличилась на 83 040 425 руб. (116 049 828 руб. – 33 009 403 руб.). Это означает, что если бы в предыдущем периоде компании удалось реализовать продукцию на ту же сумму, что и в этом, то ее чистая прибыль выросла бы как раз на эти 83 040 425 руб.

Таблица 5 . Факторный анализ прибыли по объему продаж

Показатель	Предыдущий период, руб.
Показатель		с подстановкой значения фактора из текущего периода
Объем продаж

Валовая прибыль
Операционные расходы

Операционная прибыль
Проценты за кредит
Прибыль до налогообложения

Чистая прибыль
1 Значение объема продаж за текущий период. 2 Показатель пересчитан с учетом корректировки объема продаж.

По аналогичной схеме можно оценить влияние каждого фактора и пересчитать чистую прибыль, а итоговые результаты свести в одну таблицу (см. таблицу 6).

Таблица 6 . Влияние факторов на прибыль, руб.


Объем продаж
Себестоимость реализованной продукции, услуг
Операционные расходы
Внереализационные доходы/расходы
Проценты за кредит

Итого	32 244 671

Как видно из таблицы 6, наибольшее влияние в анализируемом периоде оказал рост продаж (83 040 425 руб.). Сумма влияния всех факторов совпадает с фактическим изменением прибыли за прошедший период. Отсюда можно сделать вывод о корректности результатов анализа.

Заключение

В заключение хочется понять: с чем же нужно сравнивать прибыль при факторном анализе? С прошлым годом, с базовым годом, с конкурентами, с планом? Как понять хорошо отработало предприятие этот год или нет? Например, предприятие увеличило прибыль за текущий год в два раза, казалось бы, это отличный результат! Но в это время конкуренты провели техническое переоснащение предприятия и со следующего года вытеснят счастливчиков с рынка. А если сравнивать с конкурентами, то у них доходы меньше, т.к. вместо, скажем, рекламы или расширения номенклатуры они вкладывали деньги в модернизацию. Таким образом, все зависит от целей и планов предприятия. Из чего следует, что прибыль фактическую нужно сравнивать, прежде всего, с плановой.

Jae-On Kim, Charles W. Mueller. Factor Analysis: Statistical Methods and Practical Issues (Eleventh Printing, 1986).

ПРЕДИСЛОВИЕ

Настоящая работа является продолжением книги Джэй-Он Кима и Чарльза У. Мьюллера «Введение в факторный анализ: что это такое и как им пользоваться», также опубликованной в серии «Quantitative Applications in the Social Sciences». Последняя является введением в метод факторного анализа; в ней даются ответы на вопросы читателя: «Для чего используется факторный анализ?» и «Какие предположения делаются при использовании этого метода?», но не затрагиваются вопросы применения факторного анализа к конкретным данным. В работе «Факторный анализ: статистические методы и практические вопросы» более подробно рассматриваются специфические примеры анализа данных, различные виды факторного анализа и ситуации, когда его применение наиболее полезно. Различие между конфирматорным и разведочным факторным анализом здесь обсуждается более детально, чем во «Введении в факторный анализ». Например, рассматриваются различные критерии для факторного вращения. Особенно полезным является обсуждение различных форм косоугольных вращений и интерпретации коэффициентов в факторном анализе. Дж.-О. Ким и Ч. У. Мьюллер также ставят вопрос о числе факторов, фигурирующих в разведочном факторном анализе, разбирают методы проверки гипотез в конфирматорном анализе и рассматривают проблему вычисления значений факторов. Предлагается словарь специальных терминов, а также ответы на вопросы, наиболее часто возникающие у пользователей факторного анализа, которые могут предостеречь их от многих ошибок. Математический аппарат достаточно скромный - приводятся только сведения из матричной алгебры.

Факторный анализ использовался в экономических задачах, в которых наличие сильно коррелированных параметров приводило к неверным результатам в регрессионном анализе. Ученые, занимающиеся общественно-политическими проблемами, сопоставляли всевозможные признаки наций с разными политическими и социально-экономическими характеристиками, пытаясь определить, какие из них наиболее важны при классификации наций (например, благосостояние и численность); социологи определяли «дружественные группы», изучая группы людей, симпатизирующих именно друг другу (а не другим индивидуумам). Психологи использовали метод факторного анализа для определения того, как люди воспринимают всевозможные «стимулы» и классификации людей в группы, соответствующие различным реакциям, а издатели применяли факторный анализ для изучения способов связывать отдельные элементы языка.

Как утверждают авторы, их работа не охватывает всех аспектов факторного анализа, так как он постоянно развивается. Тем не менее если читатель получит достаточно полное представление о том, как этот метод может быть использован, то можно считать, что авторы выполнили свою задачу.

Е. М. Асланер, редактор серии