Faktorová analýza štatistiky. Faktorová analýza v štatistických balíkoch Statistica Statgraphics a Faktorová analýza štatistiky pre figuríny

Faktorová analýza je štatistická metóda, ktorá sa používa pri spracovaní veľkého množstva experimentálnych údajov. Úlohy faktorovej analýzy sú: zníženie počtu premenných (redukcia údajov) a určenie štruktúry vzťahov medzi premennými, t.j. klasifikácia premenných, preto sa faktorová analýza používa ako metóda redukcie údajov alebo ako metóda štrukturálnej klasifikácie.

Dôležitým rozdielom medzi faktorovou analýzou a všetkými vyššie opísanými metódami je to, že ju nemožno použiť na spracovanie primárnych, alebo, ako sa hovorí, „surových“ experimentálnych údajov, t. získané priamo zo skúšky predmetov. Materiálom pre faktorovú analýzu sú korelácie, alebo skôr Pearsonove korelačné koeficienty, ktoré sú vypočítané medzi premennými (t. j. psychologickými charakteristikami) zahrnutými v prieskume. Inými slovami, korelačné matice alebo, ako sa inak nazývajú, interkorelačné matice, sú podrobené faktorovej analýze. Názvy stĺpcov a riadkov v týchto maticiach sú rovnaké, pretože predstavujú zoznam premenných zahrnutých do analýzy. Z tohto dôvodu sú interkorelačné matice vždy štvorcové, t.j. počet riadkov v nich sa rovná počtu stĺpcov a symetrický, t.j. symetrické miesta vzhľadom na hlavnú uhlopriečku majú rovnaké korelačné koeficienty.

Hlavným konceptom faktorovej analýzy je faktor. Ide o umelý štatistický ukazovateľ, ktorý je výsledkom špeciálnych transformácií tabuľky korelačných koeficientov medzi skúmanými psychologickými charakteristikami, prípadne maticou interkorelácií. Postup extrakcie faktorov z interkorelačnej matice sa nazýva faktorizácia matice. V dôsledku faktorizácie možno z korelačnej matice extrahovať rôzny počet faktorov až do počtu, ktorý sa rovná počtu pôvodných premenných. Faktory identifikované ako výsledok faktorizácie však spravidla nemajú rovnakú hodnotu. (päť)

Pomocou zistených faktorov sa vysvetľuje vzájomná závislosť psychologických javov. (7)

V dôsledku faktorovej analýzy sa najčastejšie neurčuje jeden, ale niekoľko faktorov, ktoré vysvetľujú maticu interkorelácií premenných rôznymi spôsobmi. V tomto prípade sú faktory rozdelené na všeobecné, všeobecné a jednotlivé. Nazývajú sa všeobecné faktory, ktorých všetky faktorové zaťaženia sú výrazne odlišné od nuly (nulové zaťaženie naznačuje, že táto premenná nie je nijako spojená s ostatnými a nemá na ne v živote žiadny vplyv). Všeobecné – sú to faktory, v ktorých je časť faktorových zaťažení odlišná od nuly. Jednoduché - to sú faktory, v ktorých sa iba jedno zo zaťažení výrazne líši od nuly. (7)

Faktorová analýza môže byť vhodná, ak sú splnené nasledujúce kritériá.

1. Nie je možné faktorizovať kvalitatívne údaje získané na škále mien, napríklad farba vlasov (čierna / hnedá / červená) atď.
2. Všetky premenné musia byť nezávislé a ich rozdelenie musí byť blízke normálu.
3. Vzťahy medzi premennými by mali byť približne lineárne, alebo aspoň nie jasne krivočiare.
4. V pôvodnej korelačnej matici by malo byť niekoľko korelačných modulov vyšších ako 0,3. V opačnom prípade je dosť ťažké extrahovať akékoľvek faktory z matrice.
5. Vzorka subjektov by mala byť dostatočne veľká. Rady odborníkov sa líšia. Najrigidnejšie hľadisko odporúča nepoužívať faktorovú analýzu, ak je počet subjektov menší ako 100, pretože štandardné chyby korelácie budú v tomto prípade príliš veľké.

Ak sú však faktory dobre definované (napríklad so zaťažením 0,7 namiesto 0,3), experimentátor potrebuje na ich izolovanie menšiu vzorku. Okrem toho, ak je známe, že získané údaje sú vysoko spoľahlivé (napríklad sa používajú platné testy), potom je možné analyzovať údaje na menšom počte subjektov. (päť).

Na analýzu variability znaku pod vplyvom riadených premenných sa používa disperzná metóda.

Študovať vzťah medzi hodnotami - faktoriálna metóda. Pozrime sa podrobnejšie na analytické nástroje: faktorové, disperzné a dvojfaktorové disperzné metódy na hodnotenie variability.

ANOVA v Exceli

Podmienečne možno cieľ disperznej metódy formulovať takto: izolovať z celkovej variability parametra 3 konkrétnu variabilitu:

1 - určené pôsobením každej zo študovaných hodnôt;
2 - diktované vzťahom medzi študovanými hodnotami;
3 - náhodné, diktované všetkými nezohľadnenými okolnosťami.

V programe Microsoft Excel analýzu rozptylu je možné vykonať pomocou nástroja "Analýza údajov" (záložka "Údaje" - "Analýza"). Toto je tabuľkový doplnok. Ak doplnok nie je k dispozícii, musíte otvoriť „Možnosti programu Excel“ a povoliť nastavenie pre analýzu.

Práca začína návrhom stola. pravidlá:

Každý stĺpec by mal obsahovať hodnoty jedného skúmaného faktora.
Usporiadajte stĺpce vo vzostupnom/zostupnom poradí podľa hodnoty skúmaného parametra.

Zvážte analýzu rozptylu v Exceli pomocou príkladu.

Firemný psychológ analyzoval pomocou špeciálnej techniky stratégiu správania zamestnancov v konfliktná situácia. Predpokladá sa, že správanie je ovplyvnené úrovňou vzdelania (1 - stredné, 2 - stredné odborné, 3 - vysokoškolské vzdelanie).

Zadajte údaje do tabuľky programu Excel:

Významný parameter je vyplnený žltou farbou. Keďže P-hodnota medzi skupinami je väčšia ako 1, Fisherov test nemožno považovať za významný. V dôsledku toho správanie v konfliktnej situácii nezávisí od úrovne vzdelania.

Faktorová analýza v Exceli: príklad

Faktorová analýza je viacrozmerná analýza vzťahov medzi hodnotami premenných. Cez túto metódu najdôležitejšie úlohy je možné vyriešiť:

komplexne popíšte meraný objekt (navyše priestranne, kompaktne);
identifikovať hodnoty skrytých premenných, ktoré určujú prítomnosť lineárnych štatistických korelácií;
klasifikovať premenné (určiť vzťah medzi nimi);
znížiť počet požadovaných premenných.

Zoberme si príklad faktorovej analýzy. Predpokladajme, že poznáme predaj akéhokoľvek tovaru za posledné 4 mesiace. Je potrebné analyzovať, ktoré položky sú žiadané a ktoré nie.

Teraz môžete jasne vidieť, ktorý predaj produktov vedie k hlavnému rastu.

Obojsmerná analýza rozptylu v Exceli

Ukazuje, ako dva faktory ovplyvňujú zmenu hodnoty náhodnej premennej. Zvážte obojsmernú analýzu rozptylu v Exceli pomocou príkladu.

Úloha. Skupine mužov a žien boli prezentované zvuky rôznej hlasitosti: 1 - 10 dB, 2 - 30 dB, 3 - 50 dB. Čas odozvy bol zaznamenaný v milisekundách. Je potrebné určiť, či pohlavie ovplyvňuje reakciu; Ovplyvňuje hlasitosť odozvu?

sa volajú faktorová analýza. Hlavnými variantmi faktorovej analýzy sú deterministická analýza a stochastická analýza.

Deterministická faktorová analýza vychádza z metodiky skúmania vplyvu takých faktorov, ktorých vzťah so zovšeobecňujúcim ekonomickým ukazovateľom je funkčný. To druhé znamená, že zovšeobecňujúci ukazovateľ je buď súčin, alebo kvocient delenia, alebo algebraický súčet jednotlivých faktorov.

Stochastická faktorová analýza je založená na metodológii skúmania vplyvu takých faktorov, ktorých vzťah so zovšeobecňujúcim ekonomickým ukazovateľom je pravdepodobnostný, inak - korelačný.

V prítomnosti funkčného vzťahu so zmenou argumentu vždy dôjde k zodpovedajúcej zmene funkcie. Ak existuje pravdepodobnostný vzťah, zmena v argumente môže byť kombinovaná s niekoľkými hodnotami zmeny funkcie.

Faktorová analýza je tiež rozdelená na rovno, inak deduktívny rozbor a späť(induktívna) analýza.

Prvý typ analýzy uskutočňuje štúdium vplyvu faktorov deduktívnou metódou, teda v smere od všeobecného k jednotlivému. V reverznej faktorovej analýze vplyv faktorov sa študuje induktívnou metódou - v smere od súkromných faktorov k zovšeobecňujúcim ekonomickým ukazovateľom.

Klasifikácia faktorov ovplyvňujúcich efektivitu organizácie

Faktory, ktorých vplyv sa skúma počas konania, sú klasifikované podľa rôznych kritérií. V prvom rade ich možno rozdeliť do dvoch hlavných typov: vnútorné faktory , v závislosti od činnosti tohto , a vonkajšie faktory nezávislé od tejto organizácie.

Vnútorné faktory, v závislosti od veľkosti ich vplyvu, možno rozdeliť na hlavné a vedľajšie. Medzi hlavné patria faktory súvisiace s použitím a materiálmi, ako aj faktory v dôsledku dodávateľských a marketingových aktivít a niektoré ďalšie aspekty fungovania organizácie. Hlavné faktory majú zásadný vplyv na všeobecné ekonomické ukazovatele. Vonkajšie faktory, ktoré od tejto organizácie nezávisia, sú determinované prírodnými a klimatickými (geografickými), sociálno-ekonomickými, ako aj vonkajšími ekonomickými podmienkami.

Podľa dĺžky trvania ich vplyvu na ekonomické ukazovatele ich môžeme rozlíšiť fixné a variabilné faktory. Prvý typ faktorov má vplyv na ekonomickú výkonnosť, ktorá nie je časovo obmedzená. Variabilné faktory ovplyvňujú ekonomickú výkonnosť len počas určitého obdobia.

Faktory možno rozdeliť na extenzívne (kvantitatívne) a intenzívne (kvalitatívne) na základe podstaty ich vplyvu na ekonomické ukazovatele. Ak sa teda napríklad študuje vplyv faktorov práce na objem produkcie, zmena počtu pracovníkov bude rozsiahlym faktorom a zmena produktivity práce jedného pracovníka bude intenzívnym faktorom.

Faktory ovplyvňujúce ekonomickú výkonnosť podľa miery ich závislosti od vôle a vedomia zamestnancov organizácie a iných osôb možno rozdeliť na objektívne a subjektívne faktory. TO objektívne faktory možno pripísať poveternostným podmienkam, prírodným katastrofám, ktoré nezávisia od ľudskej činnosti. Subjektívne faktory úplne závisia od ľudí. Prevažnú väčšinu faktorov treba klasifikovať ako subjektívne.

Faktory možno tiež rozdeliť v závislosti od rozsahu ich pôsobenia na faktory neobmedzeného a obmedzeného pôsobenia. Prvý typ faktorov pôsobí všade, vo všetkých odvetviach národného hospodárstva. Druhý typ faktorov ovplyvňuje iba odvetvie alebo dokonca individuálnu organizáciu.

Podľa štruktúry sa faktory delia na jednoduché a zložité. Prevažná väčšina faktorov je komplexná, vrátane niekoľkých základné časti. Sú však aj faktory, ktoré sa nedajú rozdeliť. Napríklad produktivita kapitálu môže slúžiť ako príklad komplexného faktora. Počet dní, počas ktorých zariadenie pracovalo v danom období, je jednoduchým faktorom.

Podľa charakteru vplyvu na zovšeobecňujúce ekonomické ukazovatele sú priame a nepriame faktory. Teda zmenu v predaných produktoch, hoci má inverzný vplyv na výšku zisku, treba považovať za priame faktory, teda za faktor prvého rádu. Zmena hodnoty materiálových nákladov má nepriamy vplyv na zisk, t.j. ovplyvňuje zisk nie priamo, ale prostredníctvom nákladov, ktoré sú faktorom prvého poriadku. Na základe toho by sa úroveň materiálových nákladov mala považovať za faktor druhého rádu, teda za nepriamy faktor.

Podľa toho, či je možné kvantifikovať vplyv tohto faktora na všeobecný ekonomický ukazovateľ, existujú faktory merateľné a nemerateľné.

Táto klasifikácia úzko súvisí s klasifikáciou rezerv na zvýšenie efektívnosti. ekonomická aktivita organizácie, alebo inými slovami rezervy na zlepšenie analyzovaného ekonomické ukazovatele.

Faktorová ekonomická analýza

V tých znakoch, ktoré charakterizujú príčinu, sa nazývajú faktoriálne, nezávislé. Rovnaké znaky, ktoré charakterizujú dôsledok, sa zvyčajne nazývajú výsledné, závislé.

Kombinácia faktorov a výsledných znakov, ktoré sú v rovnakom kauzálnom vzťahu, sa nazýva faktorový systém . Existuje aj koncept modelu faktorového systému. Charakterizuje vzťah medzi výsledným znakom, označeným ako y, a faktorovými znakmi, označenými ako . Inými slovami, model faktorového systému vyjadruje vzťah medzi všeobecnými ekonomickými ukazovateľmi a jednotlivými faktormi, ktoré tento ukazovateľ ovplyvňujú. Zároveň pôsobia ako faktory ďalšie ekonomické ukazovatele, ktoré sú dôvodom zmeny zovšeobecňujúceho ukazovateľa.

Model faktorového systému možno matematicky vyjadriť pomocou nasledujúceho vzorca:

Stanovenie závislostí medzi zovšeobecňujúcimi (efektívnymi) a ovplyvňujúcimi faktormi sa nazýva ekonomické a matematické modelovanie.

Študujú sa dva typy vzťahov medzi zovšeobecňujúcimi ukazovateľmi a faktormi, ktoré ich ovplyvňujú:

funkčné (inak - funkčne určené alebo pevne určené spojenie.)
stochastické (pravdepodobnostné) spojenie.

funkčné spojenie- ide o taký vzťah, v ktorom každej hodnote faktora (faktoriálny atribút) zodpovedá dobre definovaná nenáhodná hodnota zovšeobecňujúceho ukazovateľa (efektívny atribút).

Stochastické spojenie- ide o taký vzťah, v ktorom každá hodnota faktora (faktoriálny atribút) zodpovedá množine hodnôt zovšeobecňujúceho ukazovateľa (efektívny atribút). Za týchto podmienok pre každú hodnotu faktora x tvoria hodnoty zovšeobecňujúceho ukazovateľa y podmienené štatistické rozdelenie. V dôsledku toho zmena hodnoty faktora x len v priemere spôsobí zmenu všeobecného ukazovateľa y.

V súlade s dvomi uvažovanými typmi vzťahov existujú metódy deterministickej faktorovej analýzy a metódy stochastickej faktorovej analýzy. Zvážte nasledujúci diagram:

Metódy používané vo faktorovej analýze. Schéma č.2

Najväčšiu úplnosť a hĺbku analytického výskumu, najväčšiu presnosť výsledkov analýzy zabezpečuje použitie ekonomických a matematických metód výskumu.

Tieto metódy majú množstvo výhod oproti tradičným a štatistickým metódam analýzy.

Poskytujú tak presnejší a podrobnejší výpočet vplyvu jednotlivých faktorov na zmenu hodnôt ekonomických ukazovateľov a zároveň umožňujú riešiť množstvo analytických problémov, ktoré sa nezaobídu bez použitia ekonomických a matematických metódy.

Faktorová analýza je jedným z najsilnejších štatistických nástrojov na analýzu údajov. Je založená na postupe kombinovania skupín premenných, ktoré navzájom korelujú („korelačné plejády“ alebo „korelačné uzly“), do viacerých faktorov.

Inými slovami, účelom faktorovej analýzy je sústrediť prvotné informácie, vyjadrujúce veľké množstvo uvažovaných znakov prostredníctvom menšieho počtu priestrannejších vnútorných charakteristík, ktoré však nemožno priamo merať (a v tomto zmysle sú latentné).

Napríklad si hypoteticky predstavme zákonodarný zbor na krajskej úrovni, ktorý má 100 poslancov. Medzi rôznymi otázkami programu hlasovania sú: a) návrh zákona, ktorým sa navrhuje obnoviť pomník V.I. Lenin ďalej centrálne námestie mesto - administratívne centrum regiónu; b) výzva prezidentovi Ruskej federácie s požiadavkou vrátiť všetku strategickú výrobu do vlastníctva štátu. Kontingenčná matica zobrazuje nasledovné rozdelenie hlasov poslancov:

	Pamätník Lenina (pre)	Pamätník Lenina (proti)
Odvolanie k prezidentovi (pre)	49	4
Odvolanie k prezidentovi (proti)	6	41

Je zrejmé, že hlasovania spolu štatisticky súvisia: prevažná väčšina poslancov, ktorí podporujú myšlienku obnovy Leninovho pomníka, podporuje aj návrat do vlastníctva štátu. strategických podnikov. Podobne väčšina odporcov obnovy pamiatky je zároveň odporcom návratu podnikov do vlastníctva štátu. Hlasovanie zároveň tematicky úplne nesúvisí.

Je logické predpokladať, že odhalený štatistický vzťah je spôsobený existenciou nejakého skrytého (latentného) faktora. Zákonodarcovia, ktorí formulujú svoj názor na širokú škálu otázok, sa riadia obmedzeným, malým súborom politických pozícií. V tomto prípade môžeme predpokladať prítomnosť skrytého rozkolu v poslancoch podľa kritéria podpory/odmietnutia konzervatívnych socialistických hodnôt. Vyčnieva skupina „konzervatívcov“ (podľa našej kontingenčnej tabuľky – 49 poslancov) a ich odporcovia (41 poslancov). Po identifikovaní takýchto rozkolov môžeme veľké množstvo individuálnych hlasovaní opísať z hľadiska malého počtu faktorov, ktoré sú latentné v tom zmysle, že ich nevieme priamo odhaliť: v našom hypotetickom parlamente nikdy neprebehlo hlasovanie, v ktorom by poslanci boli požiadaní, aby určili svoj postoj ku konzervatívnym socialistickým hodnotám. Prítomnosť tohto faktora zisťujeme na základe zmysluplnej analýzy kvantitatívnych vzťahov medzi premennými. Navyše, ak sa v našom príklade zámerne vezmú nominálne premenné - podpora pre účet s kategóriami „pre“ (1) a „proti“ (0), potom v skutočnosti faktorová analýza efektívne spracováva intervalové údaje.

Faktorová analýza sa veľmi aktívne využíva ako v politológii, tak aj v „susednej“ sociológii a psychológii. Jedným z dôležitých dôvodov veľkého dopytu po tejto metóde je rôznorodosť problémov, ktoré je možné s jej pomocou vyriešiť. Existujú teda aspoň tri „typické“ ciele faktorovej analýzy:

redukcia rozmerov (redukcia) dát. Faktorová analýza, ktorá zvýrazňuje uzly vzájomne súvisiacich vlastností a redukuje ich na niektoré zovšeobecnené faktory, redukuje počiatočný základ vlastností popisu. Riešenie tohto problému je dôležité v situácii, keď sú objekty merané veľkým počtom premenných a výskumník hľadá spôsob, ako ich zoskupiť podľa sémantického znaku. Prechod od mnohých premenných k viacerým faktorom umožňuje urobiť opis kompaktnejším, zbaviť sa neinformatívnych a duplicitných premenných;

Odhalenie štruktúry predmetov alebo vlastností (klasifikácia). Tento problém je blízky problému, ktorý rieši metóda klastrovej analýzy. Ak však zhluková analýza berie ich hodnoty pre niekoľko premenných ako „súradnice“ objektov, potom faktorová analýza určuje polohu objektu vzhľadom na faktory (súvisiace skupiny premenných). Inými slovami, pomocou faktorovej analýzy je možné vyhodnotiť podobnosť a rozdielnosť objektov v priestore ich korelácií alebo vo faktorovom priestore. Výsledné latentné premenné pôsobia ako súradnicové osi faktorového priestoru, na tieto osi sa premietajú uvažované objekty, čo umožňuje vytvoriť vizuálnu geometrickú reprezentáciu študovaných údajov, vhodnú na zmysluplnú interpretáciu;

nepriame meranie. Faktory, ktoré sú latentné (empiricky nepozorovateľné), nemožno priamo merať. Faktorová analýza však umožňuje nielen identifikovať latentné premenné, ale aj kvantifikovať ich hodnotu pre každý objekt.

Uveďme si ako príklad algoritmus a interpretáciu štatistík faktorovej analýzy s použitím údajov o výsledkoch parlamentných volieb v regióne Riazan v roku 1999 (federálny okres). Pre zjednodušenie príkladu si zoberme volebné štatistiky len pre tie strany, ktoré prekonali hranicu 5 %. Údaje sú prevzaté v kontexte územných volebných komisií (podľa miest a okresov kraja).

Prvým krokom je štandardizácia údajov ich konverziou na štandardné skóre (takzvané L-skóre vypočítané pomocou funkcie normálneho rozdelenia).

TEAK (územná volebná komisia)	"jablko"	"jednota"	Blokovať Žirinovský	OVR	CPRF	Vďaka
Ermišinskaja	1,49	35,19	6,12	5,35	31,41	2,80
Zacharovská	2,74	18,33	7,41	11,41	31,59	lb 3"
Kadomskaja	1,09	29,61	8,36	5,53	35,87	1,94
Kasimovská	1,30	39,56	5,92	5,28	29,96	2,37
Mesto Kasimovskaya	3,28	39,41	5,65	6,14	24,66	4,61
To isté v štandardizovaných skóre (g-skóre)
Ermišinskaja	-0,83	1,58	-0,25	-0,91	-0,17	-0,74
Zacharovská	-0,22	-1,16	0,97	0,44	-0,14	0,43
Kadomskaja	-1,03	0,67	1,88	-0,87	0,59	-1,10
Kasimovská	-0,93	2,29	-0,44	-0,92	-0,42	-0,92
Mesto Kasimovskaya	0,04	2,26	-0,70	-0,73	-1,32	0,01
Atď. (celkom 32 prípadov)

	"Jablko"	"jednota"	BJ	OVR	CPRF	Vďaka
"Jablko"
"jednota"	-0,55
BJ	-0,47	0,27
OVR	0,60	-0,72	-0,47
CPRF	-0,61	0,01	0,10	-0,48
Vďaka	0,94	-0,45	-0,39	0,52	-0,67

Už vizuálna analýza matice párových korelácií nám umožňuje robiť predpoklady o zložení a povahe korelačných plejád. Pozitívne korelácie sa nachádzajú napríklad pre „Zväz správnych síl“, „Yabloko“ a blok „Vlasť – celé Rusko“ (páry „Yabloko“ – OVR, „Yabloko“ – SPS a OVR – SPS). Tieto tri premenné zároveň negatívne korelujú s CPRF (podpora CPRF), v menšej miere s Jednotou (podpora Jednoty) a ešte menej s premennou BZ (podpora Bloku Žirinovského). Preto máme pravdepodobne dve výrazné korelačné plejády:

("Yabloko" + OVR + SPS) - Komunistická strana Ruskej federácie;

("Yabloko" + OVR + SPS) - "Jednota".

Ide o dve rôzne plejády, nie jednu, keďže medzi Jednotou a Komunistickou stranou Ruskej federácie neexistuje žiadne spojenie (0,01). Čo sa týka premennej BZ, je ťažšie urobiť predpoklad, tu sú korelácie menej výrazné.

Aby sme otestovali naše predpoklady, musíme VYPOČÍTAŤ vlastné hodnoty faktorov (vlastné hodnoty), skóre faktorov a zaťaženie faktorov pre každú premennú. Takéto výpočty sú dosť komplikované a vyžadujú vážne zručnosti pri práci s maticami, takže tu nebudeme brať do úvahy výpočtový aspekt. Povieme len, že tieto výpočty možno vykonať dvoma spôsobmi: metódou hlavných komponentov (hlavné komponenty) a metódou hlavných faktorov (hlavné faktory). Metóda hlavnej zložky je bežnejšia, štatistické programy ju používajú „štandardne“.

Zastavme sa pri interpretácii vlastných hodnôt, faktorových hodnôt a faktorových zaťažení.

Vlastné hodnoty faktorov pre náš prípad sú nasledovné:

bgcolor=biela>5

Faktor	Vlastná hodnota	% celkovej variácie
1	3,52	58,75
2	1,14	19,08
3	0,76	12,64
4	0,49	S.22
0,05	0.80
6	0,03	0,51
Celkom	6	100%

Čím väčšia je vlastná hodnota faktora, tým väčšia je jeho vypovedacia schopnosť (maximálna hodnota sa rovná počtu premenných, v našom prípade 6). Jedným z kľúčových prvkov štatistiky faktorovej analýzy je ukazovateľ % celkového rozptylu. Ukazuje, aký podiel variácie (variability) premenných vysvetľuje extrahovaný faktor. V našom prípade váha prvého faktora prevažuje nad váhou všetkých ostatných faktorov dokopy: vysvetľuje takmer 59 % celkovej variácie. Druhý faktor vysvetľuje 19% variácie, tretí - 12,6% atď. zostupne.

Keď máme vlastné hodnoty faktorov, môžeme začať riešiť problém redukcie dátovej dimenzie. K zníženiu dôjde v dôsledku vylúčenia faktorov, ktoré majú najmenšiu vypovedaciu schopnosť, z modelu. A tu je kľúčová otázka, koľko faktorov v modeli ponechať a akými kritériami sa riadiť. Faktory 5 a 6 sú teda zjavne nadbytočné, ktoré spolu vysvetľujú o niečo viac ako 1 % celej variácie. Ale osud faktorov 3 a 4 už nie je taký zrejmý.

V modeli spravidla zostávajú faktory, ktorých vlastná hodnota presahuje jednotu (Kaiserovo kritérium). V našom prípade ide o faktory 1 a 2. Správnosť odstránenia štyroch faktorov je však užitočné skontrolovať pomocou iných kritérií. Jednou z najpoužívanejších metód je sutinová analýza. V našom prípade to vyzerá takto:

Graf dostal svoj názov podľa podobnosti so stranou hory. „Sutina“ je geologický výraz pre úlomky hornín, ktoré sa hromadia na dne skalnatého svahu. „Rock“ je skutočne vplyvný faktor, „sutina“ je štatistický šum. Obrazne povedané, musíte nájsť miesto na grafe, kde končí „skala“ a začína „sutina“ (kde je pokles vlastných hodnôt zľava doprava výrazne spomalený). V našom prípade je potrebné vybrať z prvej a druhej inflexie zodpovedajúcich dvom a štyrom faktorom. Ak ponecháme štyri faktory, dostaneme veľmi vysokú presnosť modelu (viac ako 98% z celkovej variácie), ale robíme ho pomerne zložitým. Ak ponecháme dva faktory, budeme mať významnú nevysvetlenú časť variácie (asi 22%), ale model sa stane stručným a ľahko analyzovateľným (najmä vizuálne). V tomto prípade je teda lepšie obetovať určitú presnosť v prospech kompaktnosti a nechať prvý a druhý faktor.

Adekvátnosť získaného modelu môžete skontrolovať pomocou špeciálnych matíc reprodukovaných korelácií a reziduálnych koeficientov (reziduálnych korelácií). Matica reprodukovaných korelácií obsahuje koeficienty, ktoré boli získané z dvoch faktorov ponechaných v modeli. Zvlášť dôležitá je v ňom hlavná uhlopriečka, na ktorej sú umiestnené spoločné znaky premenných (v tabuľke kurzívou), ktoré ukazujú, ako presne model reprodukuje koreláciu premennej s rovnakou premennou, ktorá by mala byť jednotná.

Matica reziduálnych koeficientov obsahuje rozdiel medzi pôvodnými a reprodukovanými koeficientmi. Napríklad reprodukovaná korelácia medzi premennými ATP a Yabloko je 0,88, zatiaľ čo pôvodná je 0,94. Zvyšok = 0,94 - 0,88 = 0,06. Čím sú zostatkové hodnoty nižšie, tým je model kvalitnejší.

Reprodukované korelácie
	"Jablko"	"jednota"	BJ	OVR	CPRF	Vďaka
"Jablko"	0,89
"jednota"	-0,53	0,80
BJ	-0,47	0,59	0,44
OVR	0,73	-0,72	-0,56	0,76
CPRF	-0,70	0,01	0,12	-0,34	0,89
Vďaka	0,88 -0,43		-0,40	0,66	-0,77	0,88
Zvyšné kurzy
	"Jablko"	"jednota"	BJ	OVR	CPRF	Vďaka
"Jablko"	0,11
"jednota"	-0,02	0,20
BJ	0,00	-0,31	0,56
OVR	-0,13	-0,01	0,09	0,24
CPRF	0,09	0,00	-0,02	-0,14	0,11
Vďaka	0,06	-0,03	0,01	-0,14	0,10	0,12

Ako vidno z matíc, dvojfaktorový model, ktorý je vo všeobecnosti adekvátny, nevysvetľuje jednotlivé vzťahy dobre. Všeobecnosť premennej BZ je teda veľmi nízka (len 0,56), hodnota reziduálneho koeficientu prepojenia medzi BZ a „Jednotou“ je príliš vysoká (-0,31).

Teraz je potrebné rozhodnúť, aké dôležité je adekvátne zastúpenie premennej BJ pre túto konkrétnu štúdiu. Ak je dôležitosť vysoká (napríklad ak je štúdia venovaná analýze voličstva tejto konkrétnej strany), je správne vrátiť sa k štvorfaktorovému modelu. Ak nie, môžu zostať dva faktory.
Berúc do úvahy vzdelávací charakter našich úloh, ponechávame jednoduchší model.

Faktorové zaťaženia môžu byť reprezentované ako korelačné koeficienty každej premennej s každým z identifikovaných faktorov 1ak, korelácia medzi hodnotami premennej prvého faktora a hodnotami premennej "Apple" je -0,93. Všetky faktory zaťaženia sú uvedené v matici mapovania faktorov -

Čím užší je vzťah premennej s uvažovaným faktorom, tým vyššia je hodnota faktorového zaťaženia. Kladné znamienko faktorového zaťaženia označuje priame a záporné znamienko spätnú väzbu premennej s faktorom.

S hodnotami faktorových zaťažení môžeme zostaviť geometrické znázornenie výsledkov faktorovej analýzy. Na osi X vynesieme zaťaženia premenných na faktor 1, na os Y zaťaženia premenných na faktor 2 a dostaneme dvojrozmerný faktorový priestor.

Predtým, ako pristúpime k zmysluplnej analýze získaných výsledkov, vykonajte ešte jednu operáciu - rotáciu. Dôležitosť tejto operácie je daná skutočnosťou, že neexistuje jeden, ale mnoho variantov matice faktorových zaťažení, ktoré rovnako vysvetľujú vzťahy premenných (matica interkorelácií). Je potrebné zvoliť riešenie, ktoré je jednoduchšie zmysluplne interpretovať. Toto sa považuje za maticu zaťaženia, v ktorej sú hodnoty každej premennej pre každý faktor maximalizované alebo minimalizované (blízko jednej alebo nuly).

Zvážte schematický príklad. Vo faktorovom priestore sa nachádzajú štyri objekty takto:

Zaťaženia oboch faktorov pre všetky objekty sú výrazne odlišné od nuly a na interpretáciu polohy objektov sme nútení použiť oba faktory. Ale ak „otočíme“ celú štruktúru v smere hodinových ručičiek okolo priesečníka súradnicových osí, dostaneme nasledujúci obrázok:

V tomto prípade bude zaťaženie faktora 1 blízke nule a zaťaženie faktora 2 bude blízke jednotke (princíp jednoduchej konštrukcie). V súlade s tým, pre zmysluplnú interpretáciu polohy objektov, použijeme iba jeden faktor - faktor 2.

Existuje celkom veľké množstvo metódy rotácie faktorov. Skupina metód ortogonálnej rotácie teda vždy zachováva pravý uhol medzi osami súradníc. Patria sem vanmax (minimalizuje počet premenných s vysokou faktorovou záťažou), quartimax (minimalizuje počet faktorov potrebných na vysvetlenie premennej), equamax (kombinácia dvoch predchádzajúcich metód). Metódy šikmej rotácie nemusia nevyhnutne zachovávať pravý uhol medzi osami (napr. priamy obiimin). Metóda promax je kombináciou metódy ortogonálnej a šikmej rotácie. Vo väčšine prípadov sa používa metóda vanmax, ktorá poskytuje dobré výsledky pre väčšinu úloh politického výskumu. Okrem toho, ako pri mnohých iných metódach, sa odporúča experimentovať rôzne techniky rotácia.

V našom príklade po rotácii metódou varimax získame nasledujúcu maticu faktorových zaťažení:

V súlade s tým bude geometrické znázornenie faktorového priestoru vyzerať takto:

Teraz môžeme pristúpiť k zmysluplnej interpretácii získaných výsledkov. Kľúčovú opozíciu - volebný rozkol - podľa prvého faktora tvoria Komunistická strana Ruskej federácie na jednej strane a Jabloko a Zväz pravých síl (v menšej miere OVR) na strane druhej. Obsahovo – na základe špecifík ideových postojov menovaných subjektov volebného procesu – môžeme toto vymedzenie interpretovať ako „ľavicovo-pravicový“ rozkol, ktorý je pre politológiu „klasický“.

Opozíciu proti faktoru 2 tvoria OVR a Jednota. Posledný z nich je spojený s „Zhirinovským blokom“, ale nemôžeme spoľahlivo posúdiť jeho polohu vo faktorovom priestore kvôli vlastnostiam modelu, čo zle vysvetľuje vzťahy tejto konkrétnej premennej. Na vysvetlenie tejto konfigurácie je potrebné pripomenúť si politickú realitu predvolebnej kampane v roku 1999. V tom čase boj vo vnútri politickej elity viedol k vytvoreniu dvoch vrstiev „strany moci“ – „Jednoty“ a „Jednoty“. Bloky Vlast – celé Rusko. Rozdiel medzi nimi nebol ideologického charakteru: v skutočnosti sa obyvateľstvu ponúklo, aby si nevyberalo z dvoch ideologických platforiem, ale z dvoch elitných skupín, z ktorých každá mala významné mocenské zdroje a regionálnu podporu. Tento rozkol teda možno interpretovať ako „mocenskú elitu“ (alebo, trochu zjednodušene, „moc-opozíciu“).

Vo všeobecnosti dostávame pre tieto voľby geometrické znázornenie určitého volebného priestoru Riazanskej oblasti, ak volebný priestor chápeme ako priestor volebnej voľby, štruktúru kľúčových politických alternatív („splitov“). Kombinácia týchto dvoch rozkolov bola veľmi typická pre parlamentné voľby v roku 1999.

Porovnaním výsledkov faktorovej analýzy pre ten istý región v rôznych voľbách môžeme posúdiť prítomnosť kontinuity v konfigurácii priestoru volebného výberu územia. Napríklad faktorová analýza volieb do federálneho parlamentu (1995, 1999 a 2003) v Tatarstane ukázala stabilnú konfiguráciu volebného priestoru. Pre voľby v roku 1999 zostal v modeli iba jeden faktor s vypovedacou silou 83 % variácie, čo znemožňovalo zostavenie dvojrozmerného diagramu. Zodpovedajúci stĺpec zobrazuje zaťaženia faktorov.

Ak sa pozriete pozorne na tieto výsledky, všimnete si, že rovnaký hlavný rozkol sa v republike reprodukuje od volieb po voľby: „strana moci“ je všetko ostatné.“ V roku 1995 bola „stranou moci“ blok „Naším domovom je Rusko“ (NDR), v roku 1999 – OVR, v roku 2003 – „Spojené Rusko“. Postupom času sa menia iba „detaily“ – názov „strany moci“. Nová politická „nálepka“ veľmi ľahko zapadá do statickej matice jednorozmernej politickej voľby.

Na konci kapitoly si dáme jednu praktické rady. Úspech rozvoja štatistických metód je vo všeobecnosti možný len pri intenzívnom praktická práca so špeciálnymi programami (už spomínaný SPSS, Statistica alebo aspoň Microsoft Excel). Nie je náhoda, že prezentáciu štatistických techník vykonávame v režime pracovných algoritmov: to umožňuje študentovi samostatne prejsť všetkými fázami analýzy sediac pri počítači. Bez pokusov o praktickú analýzu reálnych údajov zostane predstava o možnostiach štatistických metód v politickej analýze nevyhnutne všeobecná a abstraktná. A dnes je schopnosť aplikovať štatistiku na riešenie teoretických aj aplikovaných problémov zásadne dôležitou súčasťou modelu politológa.

Kontrolné otázky a úlohy

1. Aké úrovne merania zodpovedajú priemerným hodnotám - režim, medián, aritmetický priemer? Aké miery variácie sú typické pre každú z nich?

2. Z akých dôvodov je potrebné brať do úvahy formu rozdelenia premenných?

3. Čo znamená tvrdenie „Medzi dvoma premennými je štatistický vzťah“?

4. Čo užitočná informácia o vzťahoch medzi premennými možno získať na základe analýzy kontingenčných tabuliek?

5. Čo sa dá dozvedieť o vzťahu medzi premennými na základe hodnôt štatistických testov chí-kvadrát a lambda?

6. Definujte pojem „chyba“ v štatistickom výskume. Ako možno tento ukazovateľ použiť na posúdenie kvality vytvoreného štatistického modelu?

7. Aký je hlavný účel korelačnej analýzy? Aké charakteristiky štatistického vzťahu odhaľuje táto metóda?

8. Ako interpretovať hodnotu Pearsonovho korelačného koeficientu?

9. Opíšte metódu disperznej analýzy. Aké ďalšie štatistické metódy využívajú štatistiku ANOVA a prečo?

10. Vysvetlite význam pojmu „nulová hypotéza“.

11. Čo je to regresná priamka, aká metóda sa používa na jej zostavenie?

12. Čo ukazuje koeficient R v konečnej štatistike regresnej analýzy?

13. Vysvetlite pojem "metóda viacrozmernej klasifikácie".

14. Vysvetlite hlavné rozdiely medzi zhlukovaním pomocou hierarchickej zhlukovej analýzy a K-priemerov.

15. Ako možno použiť klastrovú analýzu na štúdium obrazu politických lídrov?

16. Akú hlavnú úlohu rieši diskriminačná analýza? Definujte diskriminačnú funkciu.

17. Vymenujte tri triedy problémov riešených pomocou faktorovej analýzy. Definujte pojem "faktor".

18. Popíšte tri hlavné metódy kontroly kvality modelu vo faktorovej analýze (Kaiserovo kritérium, kritérium "sutiny", matica reprodukovaných korelácií).

Medzinárodná migrácia finančných zdrojov v kontexte faktorovej analýzy

25. J.-B. Say sa zapísal do dejín ekonomickej vedy ako autor faktoriálnej teórie hodnoty. Aké sú hlavné ustanovenia tejto teórie?

Štúdia realizovateľnosti stavebného projektu a analýza zabezpečenia požadovaného stavebného úveru

Všetky javy a procesy hospodárskej činnosti podnikov sú vzájomne prepojené a závislé. Niektoré z nich súvisia priamo, iné nepriamo. Dôležitým metodologickým problémom ekonomickej analýzy je preto štúdium a meranie vplyvu faktorov na veľkosť skúmaných ekonomických ukazovateľov.

Faktorová analýza sa vo vzdelávacej literatúre interpretuje ako časť viacrozmernej štatistickej analýzy, ktorá kombinuje metódy na odhadovanie rozmeru súboru pozorovaných premenných štúdiom štruktúry kovariančných alebo korelačných matíc.

Faktorová analýza začína svoju históriu v psychometrii av súčasnosti je široko používaná nielen v psychológii, ale aj v neurofyziológii, sociológii, politológii, ekonómii, štatistike a iných vedách. Hlavné myšlienky faktorovej analýzy stanovil anglický psychológ a antropológ F. Galton. Vývoj a implementáciu faktorovej analýzy v psychológii vykonali takí vedci ako: Ch.Spearman, L.Thurstone a R.Kettel. Bola vyvinutá matematická faktorová analýza Hotelling, Harman, Kaiser, Thurstone, Tucker a ďalší vedci.

Tento typ analýzy umožňuje výskumníkovi riešiť dve hlavné úlohy: kompaktne a zároveň komplexne opísať predmet merania. Pomocou faktorovej analýzy je možné identifikovať faktory zodpovedné za prítomnosť lineárnych štatistických vzťahov korelácií medzi sledovanými premennými.

Ciele faktorovej analýzy

Napríklad pri analýze skóre získaných na niekoľkých škálach výskumník poznamenáva, že sú si navzájom podobné a majú vysoký korelačný koeficient, v takom prípade môže predpokladať, že existuje latentná premenná, pomocou ktorého možno vysvetliť pozorovanú podobnosť získaných odhadov. Takáto latentná premenná sa nazýva faktor, ktorý ovplyvňuje početné ukazovatele iných premenných, čo vedie k možnosti a potrebe označiť ju za najvšeobecnejšiu, vyššieho rádu.

Teda dve ciele faktorovej analýzy:

určenie vzťahov medzi premennými, ich klasifikácia, teda "objektívna R-klasifikácia";
zníženie počtu premenných.

Na identifikáciu najvýznamnejších faktorov a v dôsledku toho aj faktorovú štruktúru je najvhodnejšie použiť metóda hlavných komponentov. Podstatou tejto metódy je nahradenie korelovaných komponentov nekorelovanými faktormi. Ďalšou dôležitou charakteristikou metódy je schopnosť obmedziť najinformatívnejšie hlavné zložky a zvyšok vylúčiť z analýzy, čo zjednodušuje interpretáciu výsledkov. Výhodou tejto metódy je aj to, že ide o jedinú matematicky opodstatnenú metódu faktorovej analýzy.

Faktorová analýza- metodika pre komplexné a systematické štúdium a meranie vplyvu faktorov na hodnotu efektívneho ukazovateľa.

Typy faktorovej analýzy

Existujú nasledujúce typy faktorovej analýzy:

1) Deterministický (funkčný) - efektívny ukazovateľ je prezentovaný ako súčin, súkromný alebo algebraický súčet faktorov.

2) Stochastická (korelácia) - vzťah medzi ukazovateľmi výkonnosti a faktorov je neúplný alebo pravdepodobnostný.

3) Priame (deduktívne) – od všeobecného po konkrétne.

4) Reverzný (induktívny) - od konkrétneho k všeobecnému.

5) Jednostupňové a viacstupňové.

6) Statické a dynamické.

7) Retrospektívne a perspektívne.

Faktorová analýza môže byť tiež prieskum- vykonáva sa pri štúdiu štruktúry latentných faktorov bez predpokladu o počte faktorov a ich zaťažení, a potvrdzujúci určené na testovanie hypotéz o počte faktorov a ich zaťažení. Praktická implementácia faktorovej analýzy začína kontrolou jej podmienok.

Povinné podmienky pre faktorovú analýzu:

Všetky znaky musia byť kvantitatívne;
Počet funkcií by mal byť dvojnásobkom počtu premenných;
Vzorka musí byť homogénna;
Zdrojové premenné musia byť rozdelené symetricky;
Faktorová analýza sa vykonáva na korelujúcich premenných.

V analýze sa premenné, ktoré spolu silne korelujú, skombinujú do jedného faktora, výsledkom čoho je prerozdelenie rozptylu medzi komponenty a získa sa najjednoduchšia a najprehľadnejšia štruktúra faktorov. Po skombinovaní bude vzájomná korelácia zložiek v rámci každého faktora vyššia ako ich korelácia so zložkami iných faktorov. Tento postup tiež umožňuje izolovať latentné premenné, čo je dôležité najmä pri analýze sociálneho vnímania a hodnôt.

Etapy faktorovej analýzy

Faktorová analýza sa spravidla vykonáva v niekoľkých fázach.

Etapy faktorovej analýzy:

1. fáza Výber faktorov.

2. fáza Klasifikácia a systematizácia faktorov.

3. fáza Modelovanie vzťahu medzi výkonnostnými a faktorovými ukazovateľmi.

4. fáza Výpočet vplyvu faktorov a posúdenie úlohy každého z nich pri zmene hodnoty efektívneho ukazovateľa.

5. fáza Praktické využitie faktorového modelu (výpočet rezerv na rast efektívneho ukazovateľa).

Podľa charakteru vzťahu medzi ukazovateľmi existujú deterministické metódy A stochastická faktorová analýza

Deterministická faktorová analýza je metodika skúmania vplyvu faktorov, ktorých vzťah s ukazovateľom výkonnosti je funkčný, t.j. keď je ukazovateľ výkonnosti faktorového modelu prezentovaný ako súčin, súkromný alebo algebraický súčet faktorov.

Metódy deterministickej faktorovej analýzy: Metóda nahradenia reťazca; Metóda absolútnych rozdielov; Metóda relatívneho rozdielu; Integrálna metóda; Logaritmická metóda.

Tento typ faktorovej analýzy je najbežnejší, pretože je pomerne jednoduchý na používanie (v porovnaní so stochastickou analýzou) a umožňuje vám pochopiť logiku hlavných faktorov rozvoja podniku, kvantifikovať ich vplyv, pochopiť, ktoré faktory a v čom pomer, je možné a účelné meniť pre zlepšenie efektívnosti výroby.

Stochastická analýza je metodika skúmania faktorov, ktorých vzťah s ukazovateľom výkonnosti je na rozdiel od funkčného neúplný, pravdepodobnostný (korelačný). Ak pri funkčnej (úplnej) závislosti vždy nastane zodpovedajúca zmena funkcie so zmenou argumentu, potom pri korelácii môže zmena argumentu poskytnúť niekoľko hodnôt zvýšenia funkcie v závislosti od kombinácia ďalších faktorov, ktoré určujú tento ukazovateľ.

Metódy stochastickej faktorovej analýzy: Metóda párovej korelácie; viacnásobná korelačná analýza; maticové modely; Matematické programovanie; metóda operačného výskumu; Herná teória.

Je tiež potrebné rozlišovať medzi statickou a dynamickou faktorovou analýzou. Prvý typ sa používa pri štúdiu vplyvu faktorov na ukazovatele výkonnosti k príslušnému dátumu. Ďalším typom je metodológia na štúdium vzťahov príčin a následkov v dynamike.

A nakoniec, faktorová analýza môže byť retrospektívna, ktorá študuje dôvody nárastu ukazovateľov výkonnosti za minulé obdobia, a prospektívna, ktorá skúma správanie faktorov a ukazovateľov výkonnosti v budúcnosti.