Фактарны аналіз
Фактарны аналіз — шматмерны статыстычны мэтад, які ўжываецца для вывучэньня ўзаемасувязяў паміж значэньнямі зьменных.
Кароткая гісторыя
Фактарны аналіз упершыню паўстаў у псыхамэтрыцы й у наш час шырока выкарыстоўваецца ня толькі ў псыхалёгіі, але й у нэўрафізыялёгіі, сацыялёгіі, паліталёгіі, у эканоміцы, статыстыцы й іншых навуках. Асноўныя ідэі фактарнага аналізу былі закладзены ангельскім псыхалёгам і антрапалёгам, заснавальнікам эўгенікі Гальтонам Ф. (1822—1911), які зрабіў таксама вялікі ўнёсак у дасьледаваньне індывідуальных адрозьненьняў. Але ў распрацоўку фактарнага аналізу зрабілі ўнёсак шматлікія навукоўцы. Распрацоўкай ды ўкараненьнем фактарнага аналізу ў псыхалёгію займаліся такія навукоўцы як Сьпірмэн Ч. (1904, 1927, 1946), Тэрстаўн Л. (1935, 1947, 1951) і Кетэл Р. (1946, 1947, 1951). Таксама нельга не згадаць ангельскага матэматыка й філёзафа Пірсана К., у значнай ступені які развіў ідэі Ф. Гальтона, амэрыканскага матэматыка Хатэлінга Г., распрацавалага сучасны варыянт мэтаду галоўных кампанэнтаў. Увагі заслугоўвае й ангельскі псыхоляг Айзенк Г., шырока выкарысталы фактарны аналіз для распрацоўкі псыхалягічнае тэорыі асобы. Матэматычна фактарны аналіз распрацоўваўся Хатэлінгам, Харманам, Кайзэрам, Тэрстаўнам, Такерам і інш. Сёньня фактарны аналіз уключаны ва ўсе пакеты статыстычнае апрацоўкі зьвестак — R, SAS, SPSS, Statistica і г. д.
Задачы й магчымасьці фактарнага аналізу
Фактарны аналіз дазваляе вырашыць дзьве важныя праблемы дасьледніка: апісаць аб’ект вымярэньня ўсебакова і ў той жа час кампактна. З дапамогаю фактарнага аналізу магчыма выяўленьне ўтоеных зьменных фактараў, якія адказваюць за наяўнасьць лінейных статыстычных сувязяў карэляцыяў паміж назіранымі зьменнымі.
Такім чынам можна вылучыць 2 мэты Фактарнага аналізу:
- вызначэньне ўзаемасувязяў паміж зьменнымі, (клясыфікацыя зьменных), т. б. «аб'ектыўная R-клясыфікацыя»[1][2];
- скарачэньне ліку зьменных.
Пры аналізе ў адзін фактар аб'ядноўваюцца моцна карэліруючыя паміж сабою зьменныя, як сьледства адбываецца пераразьмеркаваньне дыспэрсіі паміж кампанэнтамі й атрымліваецца максымальна простая й навочная структура фактараў. Пасьля аб'яднаньня карэляванасьць кампанэнт усярэдзіне кожнага фактару паміж сабою будзе вышэй, чым іх карэляванасьць з кампанэнтамі зь іншых фактараў. Гэта працэдура таксама дазваляе вылучыць латэнтныя зьменныя, што бывае асабліва важна пры аналізе сацыяльных уяўленьняў і каштоўнасьцяў. Напрыклад, аналізуючы адзнакі, атрыманыя па некалькіх шкалам, дасьледнік заўважае, што яны падобныя паміж сабою й маюць высокі каэфіцыент карэляцыі, ён можа выказаць здагадку, што існуе некаторая латэнтная зьменная, з дапамогаю якое можна растлумачыць назіранае падабенства атрыманых адзнакаў. Такую латэнтную зьменную завуць фактарам. Дадзены фактар уплывае на шматлікія паказчыкі іншых зьменных, што прыводзіць нас да магчымасьці й неабходнасці вылучыць яго як найболей агульны, больш высокага парадку. Для выяўленьня найболей значных фактараў і, як сьледства, фактарнае структуры, найболей апраўдана ўжываць мэтад галоўных кампанэнтаў (МГК). Сутнасьць дадзенага метаду складаецца ў замене карэляваных кампанэнтаў некарэляванымі фактарамі. Іншаю важнаю характарыстыкаю метаду зьяўляецца магчымасьць абмежавацца найболей інфарматыўнымі галоўнымі кампанэнтамі й выключыць астатнія з аналізу, што спрашчае інтэрпрэтацыю вынікаў. Добрая якасьць МГК таксама ў тым, што ён — адзіны матэматычна абгрунтаваны метад фактарнага аналізу[1][3].
Фактарны аналіз можа быць:
- выведкавым — ён ажыцьцяўляецца пры дасьледаваньні ўтоенае фактарнае структуры без здагадкі пра лік фактараў і іх нагрузках;
- Канфірматарным, прызначаным для праверкі гіпотэзаў пра лік фактараў і іх нагрузках.
Умовы ўжываньня фактарнага аналізу
Практычнае выкананьне фактарнага аналізу пачынаецца з праверкі яго ўмоваў. У абавязковыя ўмовы фактарнага аналізу ўваходзяць:
- Усе прыкметы павінны быць колькаснымі.
- Лік назіраньняў павінен быць у два разы большым за лікі зьменных.
- Выбарка павінна быць аднастайная.
- Зыходныя зьменныя павінны быць разьмеркаваны сымэтрычна.
- Фактарны аналіз ажыцьцяўляецца па карэліруючым зьменным.
Асноўныя паняцьці фактарнага аналізу
- Фактар — утоеная зьменная
- Нагрузка — карэляцыя паміж зыходнае зьменнай і фактарам
Працэдура кручэньня. Вылучэньне й інтэрпрэтацыя фактараў
Сутнасьцю фактарнага аналізу зьяўляецца працэдура кручэньня фактараў, гэта значыць пераразьмеркаваньні дыспэрсіі па вызначаным метадзе. Мэта артаганальных кручэньняў — вызначэньне простае структуры фактарных нагрузкаў, мэтаю большасьці касавугольных кручэньняў зьяўляецца вызначэньне простае структуры другасных фактараў, гэта значыць касавугольнае кручэньне варта выкарыстоўваць у прыватных выпадках. Таму артаганальнае кручэньне пераважней. Паводле вызначэньня Мюльека простая структура адпавядае патрабаваньням:
- у кожным радку матрыцы другаснае структуры V павінен быць хоць бы адзін нулявы элемэнт;
- Для кожнага слупка k матрыцы другаснае структуры V павінна існаваць падмноства з r лінейна-незалежных назіраных зьменных, карэляцыі якіх з k-м другасным фактарам — нулявыя. Дадзены крытэр зводзіцца да таго, што кожны слупок матрыцы павінен утрымоўваць ня меней r нулёў.
- У аднаго са слупкоў кожнае пары слупкоў матрыцы V павінна быць некалькі нулявых каэфіцыентаў (нагрузкаў) у тых пазыцыях, дзе для іншага слупка яны ненулявыя. Гэта здагадка гарантуе адрозьненьне другасных восяў і адпаведных ім падпрастораў памернасьці r—1 у прасторы агульных фактараў.
- Пры ліку агульных фактараў больш чатырох у кожнай пары слупкоў павінна быць некаторая колькасьць нулявых нагрузкаў у адных і тых жа радках. Дадзеная здагадка дае магчымасьць падзяліць назіраныя зьменныя на асобныя скупнасьці.
- Для кожнае пары слупкоў матрыцы V павінна быць як мага менш значных па велічыні нагрузкаў, якія адпавядаюць адным і тым жа радкам. Гэта патрабаваньне забясьпечвае мінімізацыю складанасьці зьменных (у вызначэньні Мьюлейка праз r пазначана лік агульных фактараў, а V — матрыца другаснае структуры, утвораная каардынатамі (нагрузкамі) другасных фактараў, якія атрымліваюцца ў выніку кручэньня.)
Кручэньне бывае:
- артаганальным
- касавугольным.
Пры першым выглядзе кручэньня кожны наступны фактар вызначаецца так, каб максімізаваць зьменлівасьць, пакінутую ад папярэдніх, таму фактары апыняюцца незалежнымі, некарэляванымі адзін ад аднаго (да гэтага тыпу ставіцца МГК). Другі выгляд — гэта пераўтварэньне, пры якім фактары карэлююць адзін з адным. Перавага касавугольнага кручэньня складаецца ў наступным: калі ў выніку яго выкананьня атрымліваюцца артаганальныя фактары, можна быць упэўненым, што гэта артаганальнасьць сапраўды ім уласьцівая, а не прыўнесена штучна. Існуе каля 13 метадаў кручэньня ў абодвух выглядах, у статыстычнай праграме SPSS 10 даступныя пяць: тры артаганальных, адзін касавугольны й адзін камбінаваны, аднак з усіх найболей ужытны артаганальны метад «варымакс». Метад «варымакс» максімізуе роскід квадратаў нагрузкаў для кожнага фактару, што прыводзіць да павелічэньня вялікіх і памяншэньню малых значэньняў фактарных нагрузкаў. У выніку простая структура атрымліваецца для кожнага фактару ў асобнасьці[1][3][2].
Галоўнаю праблемаю фактарнага аналізу зьяўляецца вылучэньне й інтэрпрэтацыя галоўных фактараў. Пры адборы кампанэнтаў дасьледнік звычайна сутыкаецца зь істотнымі цяжкасьцямі, бо не існуе адназначнага крытэра вылучэньня фактараў, і таму тут непазбежны суб'ектывізм інтэрпрэтацыяў вынікаў. Існуе некалькі часта ўжытных крытэраў вызначэньня ліку фактараў. Некаторыя зь іх зьяўляюцца альтэрнатыўнымі ў адносінах да іншых, а частка гэтых крытэраў можна выкарыстоўваць разам, каб адзін дапаўняў іншы:
- Крытэр Кайзэра ці крытэр уласных лікаў. Гэты крытэр прапанаваны Кайзерам, і зьяўляецца, верагодна, найболей шырока выкарыстоўваным. Адбіраюцца толькі фактары з уласнымі значэньнямі роўнымі ці вялікімі 1. Гэта азначае, што калі фактар не вылучае дыспэрсію, эквівалентную, прынамсі, дыспэрсіі аднае зьменнай, то ён апускаецца.
- Крытэр асыпка ці крытэр адсяваньня. Ён зьяўляецца графічным метадам, упершыню прапанаваным псыхалёгам Кэтэлам. Уласныя значэньні магчыма намаляваць у выглядзе простага графіка. Кэтэл прапанаваў знайсьці такое месца на графіцы, дзе зьмяншэньне ўласных значэньняў зьлева направа максімальна запавольваецца. Мяркуецца, што справа ад гэтае кропкі знаходзіцца толькі «фактарыяльны асыпак» — «асыпак» зьяўляецца геалагічным тэрмінам, якім пазначаюць абломкі горных пародаў, што запасяцца ў ніжняй частцы скалістага схілу. Аднак гэты крытэр адрозьніваецца высокаю суб'ектыўнасьцю й, у адрозьненьне ад папярэдняга крытэра, статыстычна неабгрунтаваны. Недахопы абодвух крытэраў складаюцца ў тым, што першы часам захоўвае занадта шмат фактараў, у той час як другі, насупраць, можа захаваць занадта мала фактараў; аднак абодва крытэра цалкам добрыя пры звычайных умовах, калі маецца адносна невялікі лік фактараў і шмат зьменных. На практыку ўзьнікае важнае пытаньне: калі атрыманае рашэньне можа быць зьмястоўна інтэрпрэтавана. У гэтай сувязі прапануецца выкарыстоўваць яшчэ некалькі крытэраў.
- Крытэр значнасьці. Ён асабліва эфэктыўны, калі мадэль генэральнае сукупнасьці вядомая й адсутнічаюць другарадныя фактары. Але крытэр непрыдатны для пошуку зьменаў у мадэлі й рэалізоўны толькі ў фактарным аналізе па метадзе найменшых квадратаў ці максымальнага праўдападабенства.
- Крытэр дзелі прайграванае дыспэрсіі. Фактары ранжыруюцца па дзелі якая дэтэрмінуецца дыспэрсіі, калі адсотак дыспэрсіі апыняецца неістотным, вылучэньне варта спыніць. Пажадана, каб вылучаныя фактары тлумачылі больш 80 % роскіду. Недахопы крытэра: па-першае, суб'ектыўнасьць вылучэньня, па-другое, спэцыфіка дадзеных можа быць такая, што ўсе галоўныя фактары не змогуць сукупна растлумачыць пажаданага адсотка роскіду. Таму галоўныя фактары павінны разам тлумачыць не менш 50,1 % дысперсіі.
- Крытэр интерпретируемости і інварыянтавасці. Дадзены крытэр спалучае статыстычную дакладнасьць з суб'ектыўнымі інтарэсамі. Паводле яго, галоўныя фактары можна вылучаць датуль, пакуль будзе магчымая іх ясная інтэрпрэтацыя. Яна, у сваю чаргу, залежыць ад велічыні фактарных нагрузкаў, гэта значыць калі ў фактары ёсць хоць бы адна моцная нагрузка, ён можа быць інтэрпрэтаваны. Магчымы й зваротны варыянт — калі моцныя нагрузкі маюцца, аднак інтэрпрэтацыя цяжкая, ад гэтае кампанэнты пераважна адмовіцца.
Практыка паказвае, што калі кручэньне ня вырабіла істотных зьменаў у структуры фактарнай прасторы, гэта сьведчыць пра яго ўстойлівасьць і стабільнасьць дадзеных. Магчымыя яшчэ два варыянты: 1). моцнае пераразьмеркаваньне дыспэрсіі — вынік выяўленьня латэнтнага фактару; 2). вельмі малаважная зьмена (дзясятыя, сотыя ці тысячныя дзелі нагрузкі) ці яго адсутнасьць наогул, пры гэтым моцныя карэляцыі можа мець толькі адзін фактар, — аднафактарнае разьмеркаваньне. Апошняе магчыма, напрыклад, калі на прадмет наяўнасьці вызначанай уласьцівасьці правяраюцца некалькі сацыяльных групаў, аднак шуканая ўласьцівасць ёсьць толькі ў аднае з іх.
Фактары маюць дзьве характарыстыкі: аб'ём якая тлумачыцца дыспэрсіі й нагрузкі. Калі разглядаць іх з пункту гледжаньня геаметрычнае аналёгіі, то датычна першае адзначым, што фактар, які ляжыць уздоўж восі ОХ, можа максымальна тлумачыць 70 % дыспэрсіі (першы галоўны фактар), фактар, што ляжыць уздоўж восі ОУ, здольны дэтэрмінаваць ня больш за 30 % (другі галоўны фактар). Гэта значыць у ідэальнай сытуацыі ўся дыспэрсія можа быць растлумачана двума галоўнымі фактарамі з паказанымі дзелямі[4]. У звычайнай сытуацыі можа назірацца два ці больш галоўных фактараў, а таксама застаецца частка неінтэрпрытаванай дыспэрсіі (геаметрычныя скажэньні), выключаная з аналізу па чыньніку нязначнасьці. Нагрузкі, ізноў жа з пункту гледжаньня геаметрыі, ёсьць праекцыі ад кропкаў на восі ОХ і ОУ (пры трох- і больш фактарнай структуры таксама на вось ОZ). Праекцыі — гэта каэфіцыенты карэляцыі, кропкі — назіраньні, такім чынам, фактарныя нагрузкі зьяўляюцца мерамі сувязі. Бо моцнае лічыцца карэляцыя з каэфіцыентам Пірсана R ? 0,7, то ў нагрузках трэба надаваць увагу толькі моцным сувязям. Фактарныя нагрузкі могуць валодаць уласьцівасьцю біпалярнасьці — наяўнасьцю дадатных і адмоўных паказчыкаў у адным фактары. Калі біпалярнасць прысутнічае, то паказчыкі, якія ўваходзяць у склад фактару, дыхатамічны й знаходзяцца ў процілеглых каардынатах.
Мэтады фактарнага аналізу:
- мэтад галоўных кампанэнтаў
- карэляцыйны аналіз
- мэтад максымальнага праўдападабенства
Крыніцы
- ^ а б в Кім Дж.-О., Мьюллер Ч. У. «Фактарны аналіз: статыстычныя метады і практычныя пытаньні» / складанка працаў «Фактарны, дыскрымінантны і клястарны аналіз»: пёр. з ангел.; Пад. рэд. І. С. Енюкова. — М.: «Фінансы і статыстыка», 1989. — 215 з.
- ^ а б Электронны падручнік па статыстыцы. Масква, StatSoft. WEB: www.statsoft.ru/home/textbook/default.htm.
- ^ а б Шуметов В. Г. Шуметова Л. В. «Фактарны аналіз: падыход з ужываннем ЭВМ». ОРЕЛГТУ, Арол, 1999. — 88 з.
- ^ Пажес Ж.-П. «Канфлікты і грамадская думка. Новая спроба аб'яднаць сацыёлягаў і матэматыкаў» // «Сацыялагічныя дасьледаваньні», 1991, № 7. — з.107-115.
Літаратура
- Афифи А., Эйзен С. Статыстычны аналіз: Падыход з выкарыстаннем ЭВМ. — М.: Сьвет, 1982. — С. 488.
- Колін Купер. Індывідуальныя адрозьненьні. — М.: Аспект Прэс, 2000. — 527 з.
- Гусеў А. Н., Измайлов Ч. А., Міхалеўская М. Б. Вымярэньне ў псіхалёгіі. — М.: Сэнс, 1997. — 287 з.
- Мітына О. В., Міхайлаўская І. Б. Фактарны аналіз для псіхалёгаў. — М.: Навучальна-мэтадычны калектар Псыхалёгія, 2001. — 169 з.
- Фактарны, дыскрымінантны і кластарны аналіз / складанка працаў пад рэд. Енюкова І. С. — М.: Фінансы і статыстыка, 1989. — 215 з.
- Пацыаркоўскі В. В., Пациорковская В. В. SPSS для сацыёлягаў. — М.: Навучальны дапаможнік ИСЭПН РАНАЎ, 2005. — 433 з.
- Бююль А., Цефель П. SPSS: Мастацтва апрацоўкі інфармацыі. Аналіз статыстычных дадзеных і аднаўленне ўтоеных заканамернасцяў. — Спб.: ТАА «ДИАСОФТЮП», 2002. — 603 з.
- Фактарны, дыскрымінантны й клястарны аналіз: Пёр. Ф18 з ангел./Дж.-О. Кім, Ч. У. Мьюллер, У. Р. Клекка і інш.; Пад рэд. І. С. Енюкова. — М.: Фінансы і статыстыка, 1989.— 215 з: