Analiza factorială a statisticilor. Analiza factorială în pachete statistice Statistica Statgraphics și Statistici de analiză factorială pentru manechin

Analiza factorială este o metodă statistică care este utilizată atunci când se prelucrează cantități mari de date experimentale. Sarcinile analizei factoriale sunt: ​​reducerea numărului de variabile (reducerea datelor) și determinarea structurii relațiilor dintre variabile, i.e. clasificarea variabilelor, astfel încât analiza factorială este utilizată ca metodă de reducere a datelor sau ca metodă de clasificare structurală.

O diferență importantă între analiza factorială și toate metodele descrise mai sus este că nu poate fi utilizată pentru a procesa date experimentale primare sau, după cum se spune, „brute”, de exemplu. obţinute direct din examinarea subiectelor. Materialul pentru analiza factorială este corelațiile, sau mai degrabă, coeficienții de corelație ai lui Pearson, care sunt calculați între variabilele (adică, caracteristicile psihologice) incluse în sondaj. Cu alte cuvinte, matricele de corelație sau, așa cum se numesc altfel, matricele de intercorelație, sunt supuse analizei factoriale. Numele coloanelor și rândurilor din aceste matrice sunt aceleași, deoarece reprezintă o listă de variabile incluse în analiză. Din acest motiv, matricele de intercorelare sunt întotdeauna pătrate, adică. numărul de rânduri din ele este egal cu numărul de coloane și simetric, adică locurile simetrice față de diagonala principală au aceiași coeficienți de corelație.

Conceptul principal de analiză factorială este un factor. Acesta este un indicator statistic artificial rezultat din transformări speciale ale tabelului de coeficienți de corelație între caracteristicile psihologice studiate, sau matricea de intercorelații. Procedura de extragere a factorilor dintr-o matrice de intercorelație se numește factorizare matriceală. Ca rezultat al factorizării, un număr diferit de factori poate fi extras din matricea de corelație până la un număr egal cu numărul de variabile originale. Cu toate acestea, factorii identificați ca rezultat al factorizării, de regulă, sunt inegale în valoare. (cinci)

Cu ajutorul factorilor identificați se explică interdependența fenomenelor psihologice. (7)

Cel mai adesea, în urma analizei factoriale, nu se determină unul, ci mai mulți factori care explică matricea de intercorelații ale variabilelor în moduri diferite. În acest caz, factorii sunt împărțiți în generali, generali și unici. Sunt numiți factori generali, toate încărcările factorilor fiind semnificativ diferite de zero (încărcarea zero indică faptul că această variabilă nu este în niciun fel conectată cu celelalte și nu are niciun efect asupra lor în viață). Generale - aceștia sunt factori în care o parte a încărcărilor factorilor este diferită de zero. Unic - aceștia sunt factori în care doar una dintre sarcini diferă semnificativ de zero. (7)

Analiza factorială poate fi adecvată dacă sunt îndeplinite următoarele criterii.

  • 1. Nu este posibilă factorizarea datelor calitative obținute pe o scară de nume, de exemplu, cum ar fi culoarea părului (negru / maro / roșu), etc.
  • 2. Toate variabilele trebuie să fie independente, iar distribuția lor trebuie să fie apropiată de normal.
  • 3. Relațiile dintre variabile trebuie să fie aproximativ liniare, sau cel puțin să nu fie clar curbilinie.
  • 4. În matricea de corelație originală, ar trebui să existe mai multe corelații modulo mai mari de 0,3. În caz contrar, este destul de dificil să extragi orice factori din matrice.
  • 5. Eșantionul de subiecți ar trebui să fie suficient de mare. Sfatul experților variază. Cel mai rigid punct de vedere recomandă să nu se folosească analiza factorială dacă numărul de subiecți este mai mic de 100, deoarece erorile standard de corelare în acest caz vor fi prea mari.

Cu toate acestea, dacă factorii sunt bine definiți (de exemplu, cu încărcări de 0,7 mai degrabă decât 0,3), experimentatorul are nevoie de o probă mai mică pentru a-i izola. În plus, dacă se știe că datele obținute sunt foarte fiabile (de exemplu, se folosesc teste valide), atunci este posibil să se analizeze datele pe un număr mai mic de subiecți. (cinci).

Pentru a analiza variabilitatea unei trăsături sub influența variabilelor controlate se folosește metoda dispersiei.

Pentru a studia relația dintre valori - metoda factorială. Să luăm în considerare instrumentele analitice mai detaliat: metode factoriale, de dispersie și de dispersie cu doi factori pentru evaluarea variabilității.

ANOVA în Excel

Condițional, scopul metodei de dispersie poate fi formulat după cum urmează: să izolați din variabilitatea totală a parametrului 3 variabilitatea particulară:

  • 1 - determinată de acţiunea fiecăreia dintre valorile studiate;
  • 2 - dictate de relaţia dintre valorile studiate;
  • 3 - aleatoriu, dictat de toate circumstanțele nesocotite.

Într-un program Microsoft Excel analiza varianței poate fi efectuată folosind instrumentul „Analiza datelor” (fila „Date” - „Analiză”). Acesta este un supliment pentru foi de calcul. Dacă programul de completare nu este disponibil, trebuie să deschideți „Opțiuni Excel” și să activați setarea pentru analiză.

Lucrarea începe cu proiectarea mesei. Reguli:

  1. Fiecare coloană ar trebui să conțină valorile unui factor studiat.
  2. Aranjați coloanele în ordine crescătoare/descrescătoare a valorii parametrului studiat.

Luați în considerare analiza varianței în Excel folosind un exemplu.

Psihologul firmei a analizat, folosind o tehnică specială, strategia comportamentului angajaților în situație conflictuală. Se presupune că comportamentul este influențat de nivelul de studii (1 - gimnaziu, 2 - gimnaziu specializat, 3 - studii superioare).

Introduceți datele într-o foaie de calcul Excel:


Parametrul semnificativ este umplut cu culoare galbenă. Deoarece valoarea P între grupuri este mai mare decât 1, testul lui Fisher nu poate fi considerat semnificativ. În consecință, comportamentul într-o situație conflictuală nu depinde de nivelul de educație.



Analiza factorială în Excel: un exemplu

Analiza factorială este o analiză multivariată a relațiilor dintre valorile variabilelor. Prin intermediul aceasta metoda cele mai importante sarcini pot fi rezolvate:

  • descrieți cuprinzător obiectul măsurat (mai mult, cu capacitate, compact);
  • identificarea valorilor variabilelor ascunse care determină prezența corelațiilor statistice liniare;
  • clasificarea variabilelor (determinarea relației dintre ele);
  • reduce numărul de variabile necesare.

Luați în considerare exemplul analizei factoriale. Să presupunem că cunoaștem vânzările oricăror bunuri din ultimele 4 luni. Este necesar să se analizeze ce articole sunt solicitate și care nu.



Acum puteți vedea clar care vânzări de produse dau creșterea principală.

Analiza bidirecțională a varianței în Excel

Arată modul în care doi factori afectează modificarea valorii unei variabile aleatoare. Luați în considerare analiza bidirecțională a varianței în Excel folosind un exemplu.

O sarcină. Un grup de bărbați și femei au fost prezentate cu sunete de diferite volume: 1 - 10 dB, 2 - 30 dB, 3 - 50 dB. Timpul de răspuns a fost înregistrat în milisecunde. Este necesar să se determine dacă genul afectează răspunsul; Afectează zgomotul răspunsul?

sunt numite analiza factorilor. Principalele varietăți de analiză factorială sunt analiza deterministă și analiza stocastică.

Analiza factorială deterministă se bazează pe o metodologie de studiu a influenței unor astfel de factori, a cărei relație cu un indicator economic generalizator este funcțională. Acesta din urmă înseamnă că indicatorul de generalizare este fie un produs, fie un coeficient de diviziune, fie o sumă algebrică a factorilor individuali.

Analiza factorială stocastică se bazează pe o metodologie de studiere a influenței unor astfel de factori, a cărei relație cu un indicator economic generalizant este probabilistică, în caz contrar - corelațională.

În prezența unei relații funcționale cu o schimbare a argumentului, există întotdeauna o schimbare corespunzătoare a funcției. Dacă există o relație probabilistică, modificarea argumentului poate fi combinată cu mai multe valori ale modificării funcției.

Analiza factorială este, de asemenea, subdivizată în Drept, altfel analiză deductivă și înapoi analiză (inductivă).

Primul tip de analiză realizează studiul influenţei factorilor prin metoda deductivă, adică în direcţia de la general la particular. În analiza factorială inversă influenţa factorilor se studiază prin metoda inductivă – în direcţia de la factori privaţi la indicatorii economici generalizatori.

Clasificarea factorilor care afectează eficacitatea organizației

Factorii a căror influență este studiată în timpul conduitei sunt clasificați după diverse criterii. În primul rând, acestea pot fi împărțite în două tipuri principale: factori interni , în funcție de activitatea acestuia , și factori externi independent de această organizaţie.

Factorii interni, în funcție de amploarea impactului lor asupra, pot fi împărțiți în principali și secundari. Principalele includ factori legate de utilizare și materiale, precum și factori datorați activităților de aprovizionare și marketing și alte câteva aspecte ale funcționării organizației. Principalii factori au un impact fundamental asupra indicatorilor economici generali. Factori externi, care nu depind de această organizare, sunt determinate de condițiile naturale și climatice (geografice), socio-economice, precum și de condițiile economice externe.

În funcție de durata impactului acestora asupra indicatorilor economici, putem distinge factori fixe și variabili. Primul tip de factori are un impact asupra performanței economice, care nu este limitată în timp. Factorii variabili afectează performanța economică doar pentru o anumită perioadă de timp.

Factorii pot fi împărțiți în extensiv (cantitativ) și intensiv (calitativ) pe baza esenţei influenţei lor asupra indicatorilor economici. Deci, de exemplu, dacă se studiază influența factorilor de muncă asupra volumului producției, atunci modificarea numărului de lucrători va fi un factor extensiv, iar modificarea productivității muncii unui muncitor va fi un factor intensiv.

Factorii care afectează performanța economică, în funcție de gradul de dependență al acestora de voința și conștiința angajaților organizației și a altor persoane, pot fi împărțiți în factori obiectivi si subiectivi. LA factori obiectivi pot fi atribuite condițiilor meteorologice, dezastrelor naturale care nu depind de activitatea umană. Factorii subiectivi depind în totalitate de oameni. Marea majoritate a factorilor ar trebui clasificați drept subiectivi.

Factorii pot fi, de asemenea, subdivizați, în funcție de sfera acțiunii lor, în factori de acțiune nelimitată și factori de acțiune limitată. Primul tip de factori operează peste tot, în orice ramuri ale economiei naționale. Al doilea tip de factori afectează numai în cadrul unei industrii sau chiar al unei organizații individuale.

În funcție de structura lor, factorii sunt împărțiți în simpli și complexi. Marea majoritate a factorilor sunt complexi, inclusiv mai multi părțile constitutive. Cu toate acestea, există și factori care nu pot fi împărțiți. De exemplu, productivitatea capitalului poate servi ca exemplu de factor complex. Numărul de zile în care echipamentul a funcționat într-o anumită perioadă este un factor simplu.

După natura impactului asupra indicatorilor economici generalizatori, există factori directi si indirecti. Astfel, modificarea produselor vândute, deși are un efect invers asupra mărimii profitului, ar trebui considerate factori direcți, adică un factor de ordinul întâi. O modificare a valorii costurilor materiale are un efect indirect asupra profitului, de exemplu. afectează profitul nu direct, ci prin cost, care este un factor de prim ordin. Pe baza acestui fapt, nivelul costurilor materiale ar trebui considerat un factor de ordinul doi, adică un factor indirect.

În funcție de posibilitatea de a cuantifica influența acestui factor asupra indicatorului economic general, există factori măsurabili și nemăsurabile.

Această clasificare este strâns legată de clasificarea rezervelor de îmbunătățire a eficienței. activitate economică organizații sau, cu alte cuvinte, rezerve pentru îmbunătățirea celor analizate indicatori economici.

Analiza economică factorială

În acele semne care caracterizează cauza, sunt numite factoriale, independente. Aceleași semne care caracterizează consecința sunt de obicei numite rezultante, dependente.

Se numește combinația de factori și semne rezultate care sunt în aceeași relație cauzală sistem de factori . Există, de asemenea, conceptul de model de sistem factori. Caracterizează relația dintre trăsătura rezultată, notată cu y, și trăsăturile factoriale, notate ca . Cu alte cuvinte, modelul sistemului factorial exprimă relația dintre indicatorii economici generali și factorii individuali care afectează acest indicator. În același timp, ca factori acționează și alți indicatori economici, care sunt motivele modificării indicatorului generalizator.

Model de sistem factorial poate fi exprimat matematic folosind următoarea formulă:

Stabilirea dependențelor între factorii generalizatori (eficienți) și factorii de influență se numește modelare economică și matematică.

Sunt studiate două tipuri de relații între indicatorii generalizatori și factorii care îi influențează:

  • funcțional (în caz contrar - conexiune determinată funcțional sau determinată rigid.)
  • conexiune stocastică (probabilistă).

conexiune funcțională- aceasta este o astfel de relație în care fiecărei valori a factorului (atribut factorial) îi corespunde o valoare nealeatoare bine definită a indicatorului de generalizare (atribut efectiv).

Conexiune stocastică- aceasta este o astfel de relație în care fiecare valoare a unui factor (atribut factorial) corespunde unui set de valori ale unui indicator de generalizare (atribut efectiv). În aceste condiții, pentru fiecare valoare a factorului x, valorile indicatorului de generalizare y formează o distribuție statistică condiționată. Ca urmare, o modificare a valorii factorului x numai în medie determină o modificare a indicatorului general y.

În conformitate cu cele două tipuri de relații considerate, există metode de analiză factorială deterministă și metode de analiză factorială stocastică. Luați în considerare următoarea diagramă:

Metode utilizate în analiza factorială. Schema nr. 2

Cea mai mare completitudine și profunzime a cercetării analitice, cea mai mare acuratețe a rezultatelor analizei este asigurată de utilizarea metodelor economice și matematice de cercetare.

Aceste metode au o serie de avantaje față de metodele tradiționale și statistice de analiză.

Astfel, ele oferă un calcul mai precis și mai detaliat al influenței factorilor individuali asupra modificării valorilor indicatorilor economici și, de asemenea, fac posibilă rezolvarea unui număr de probleme analitice care nu pot fi realizate fără utilizarea economică și matematică. metode.

Analiza factorială este unul dintre cele mai puternice instrumente statistice pentru analiza datelor. Se bazează pe procedura de combinare a grupurilor de variabile care se corelează între ele („pleiade de corelare” sau „noduri de corelare”) în mai mulți factori.

Cu alte cuvinte, scopul analizei factoriale este concentrarea informațiilor inițiale, exprimând un număr mare de trăsături considerate printr-un număr mai mic de caracteristici interne mai încăpătoare, care însă nu pot fi măsurate direct (și în acest sens sunt latente).

De exemplu, să ne imaginăm ipotetic un legislativ la nivel regional, format din 100 de deputați. Printre diversele probleme de pe ordinea de zi a votării se numără: a) un proiect de lege prin care se propune restaurarea monumentului lui V.I. Lenin mai departe piața Centrală oraș - centrul administrativ al regiunii; b) un apel către președintele Federației Ruse cu cererea de a returna întreaga producție strategică în proprietatea statului. Matricea de contingență arată următoarea distribuție a voturilor deputaților:

Monumentul lui Lenin (pentru) Monumentul lui Lenin (împotriva)
Apel la Președinte (pentru) 49 4
Apel la Președinte (împotrivă) 6 41

Evident, voturile sunt legate statistic: marea majoritate a deputaților care susțin ideea refacerii monumentului lui Lenin susțin și revenirea în proprietatea statului. întreprinderi strategice. În mod similar, cei mai mulți oponenți ai restaurării monumentului sunt în același timp oponenți ai revenirii întreprinderilor în proprietatea statului. În același timp, votul este complet nelegat unul de celălalt tematic.

Este logic să presupunem că relația statistică revelată se datorează existenței unui factor ascuns (latent). Legiuitorii, care își formulează punctul de vedere cu privire la o mare varietate de probleme, sunt ghidați de un set restrâns și restrâns de poziții politice. În acest caz, putem presupune prezența unei scindări ascunse în deputați după criteriul susținerii/respingerii valorilor socialiste conservatoare. Se remarcă un grup de „conservatori” (conform tabelului nostru de urgență - 49 de deputați) și adversarii acestora (41 de deputați). După identificarea unor astfel de diviziuni, putem descrie un număr mare de voturi individuale în termenii unui număr mic de factori latenți, în sensul că nu le putem detecta direct: în ipoteticul nostru parlament, nu a existat niciodată un vot în care parlamentarii ar fi au fost rugați să-și determine atitudinea față de valorile socialiste conservatoare. Detectăm prezența acestui factor pe baza unei analize semnificative a relațiilor cantitative dintre variabile. Mai mult, dacă în exemplul nostru sunt luate în mod deliberat variabilele nominale - suport pentru factura cu categoriile „pentru” (1) și „împotrivă” (0), atunci, în realitate, analiza factorială prelucrează în mod eficient datele de interval.

Analiza factorială este utilizată foarte activ atât în ​​știința politică, cât și în sociologia și psihologia „vecinate”. Unul dintre motivele importante pentru cererea mare pentru această metodă este varietatea de probleme care pot fi rezolvate cu ajutorul ei. Astfel, există cel puțin trei obiective „tipice” ale analizei factoriale:

reducerea (reducerea) dimensionalității datelor. Analiza factorială, evidențiind nodurile de trăsături interconectate și reducându-le la unii factori generalizați, reduce baza inițială a caracteristicilor descrierii. Rezolvarea acestei probleme este importantă într-o situație în care obiectele sunt măsurate printr-un număr mare de variabile și cercetătorul caută o modalitate de a le grupa în funcție de o caracteristică semantică. Trecerea de la multe variabile la mai mulți factori face posibilă compactarea descrierii, pentru a scăpa de variabilele neinformative și duplicate;

Dezvăluirea structurii obiectelor sau trăsăturilor (clasificare). Această problemă este aproape de cea care este rezolvată prin metoda analizei cluster. Dar dacă analiza cluster își ia valorile pentru mai multe variabile ca „coordonatele” obiectelor, atunci analiza factorială determină poziția obiectului în raport cu factori (grupuri de variabile înrudite). Cu alte cuvinte, cu ajutorul analizei factoriale se poate evalua asemănarea și diferența obiectelor în spațiul corelațiilor lor, sau în spațiul factorilor. Variabilele latente rezultate acționează ca axe de coordonate ale spațiului factorilor, obiectele luate în considerare sunt proiectate pe aceste axe, ceea ce face posibilă crearea unei reprezentări geometrice vizuale a datelor studiate, convenabilă pentru o interpretare semnificativă;

măsurare indirectă. Factorii, fiind latenți (neobservabili empiric), nu pot fi măsurați direct. Cu toate acestea, analiza factorială permite nu numai identificarea variabilelor latente, ci și cuantificarea valorii acestora pentru fiecare obiect.

Să luăm în considerare algoritmul și interpretarea statisticilor analizei factoriale folosind datele privind rezultatele alegerilor parlamentare din regiunea Ryazan din 1999 (un district federal) ca exemplu. Pentru a simplifica exemplul, să luăm statisticile electorale doar pentru acele partide care au depășit pragul de 5%. Datele sunt preluate în contextul comisiilor electorale teritoriale (pe orașe și raioane ale regiunii).

Primul pas este standardizarea datelor prin conversia lor în scoruri standard (așa-numitele scoruri L calculate folosind funcția de distribuție normală).

TEAK

(comisia electorală teritorială)

"Măr" "Unitate" bloc

Jirinovski

OVR CPRF THX
Ermishinskaya 1,49 35,19 6,12 5,35 31,41 2,80
Zaharovskaia 2,74 18,33 7,41 11,41 31,59 l b 3"
Kadomskaya 1,09 29,61 8,36 5,53 35,87 1,94
Kasimovskaia 1,30 39,56 5,92 5,28 29,96 2,37
Orașul Kasimovskaya 3,28 39,41 5,65 6,14 24,66 4,61
Același lucru în scorurile standardizate (scorurile g)
Ermishinskaya -0,83 1,58 -0,25 -0,91 -0,17 -0,74
Zaharovskaia -0,22 -1,16 0,97 0,44 -0,14 0,43
Kadomskaya -1,03 0,67 1,88 -0,87 0,59 -1,10
Kasimovskaia -0,93 2,29 -0,44 -0,92 -0,42 -0,92
Orașul Kasimovskaya 0,04 2,26 -0,70 -0,73 -1,32 0,01
etc. (total 32 de cazuri)
"Un mar" "Unitate" B J OVR CPRF THX
"Un mar"
"Unitate" -0,55
B J -0,47 0,27
OVR 0,60 -0,72 -0,47
CPRF -0,61 0,01 0,10 -0,48
THX 0,94 -0,45 -0,39 0,52 -0,67

Deja o analiză vizuală a matricei de corelații de perechi ne permite să facem presupuneri despre compoziția și natura pleiadelor de corelație. De exemplu, se găsesc corelații pozitive pentru „Uniunea Forțelor Dreapte”, „Iabloko” și blocul „Patrie - Toată Rusia” (perechile „Yabloko” - OVR, „Yabloko” - SPS și OVR - SPS). În același timp, aceste trei variabile sunt corelate negativ cu CPRF (sprijin pentru CPRF), într-o măsură mai mică cu Unity (sprijin pentru Unity) și cu atât mai puțin cu variabila BZ (sprijin pentru Blocul Jirinovski). Astfel, probabil că avem două pleiade de corelație pronunțate:

("Yabloko" + OVR + SPS) - Partidul Comunist al Federației Ruse;

("Yabloko" + OVR + SPS) - "Unitate".

Acestea sunt două pleiade diferite, nu una, deoarece nu există nicio legătură între Unitate și Partidul Comunist al Federației Ruse (0,01). În ceea ce privește variabila BZ, este mai dificil de făcut o presupunere, aici corelațiile sunt mai puțin pronunțate.

Pentru a ne testa ipotezele, trebuie să CALCULĂM valorile proprii ale factorilor (valori proprii), scorurile factorilor și încărcările factorilor pentru fiecare variabilă. Astfel de calcule sunt destul de complicate și necesită abilități serioase în lucrul cu matrice, așa că nu vom lua în considerare aspectul computațional aici. Vom spune doar că aceste calcule pot fi efectuate în două moduri: metoda componentelor principale (componentele principale) și metoda factorilor principali (factorii principali). Metoda componentei principale este mai comună, programele de statistică o folosesc „în mod implicit”.

Să ne oprim asupra interpretării valorilor proprii, a valorilor factoriale și a încărcărilor factorilor.

Valorile proprii ale factorilor pentru cazul nostru sunt următoarele:

bgcolor=alb>5
Factor Valoare proprie % variație totală
1 3,52 58,75
2 1,14 19,08
3 0,76 12,64
4 0,49 S.22
0,05 0.80
6 0,03 0,51
Total 6 100%

Cu cât valoarea proprie a factorului este mai mare, cu atât puterea explicativă a acestuia este mai mare (valoarea maximă este egală cu numărul de variabile, în cazul nostru 6). Unul dintre elementele cheie ale statisticilor de analiză factorială este indicatorul % de variație totală. Arată ce proporție din variația (variabilitatea) variabilelor explică factorul extras. În cazul nostru, ponderea primului factor depășește ponderea tuturor celorlalți factori combinați: explică aproape 59% din variația totală. Al doilea factor explică 19% din variație, al treilea - 12,6% și așa mai departe. Descendentă.

Având valorile proprii ale factorilor, putem începe să rezolvăm problema reducerii dimensiunii datelor. Reducerea se va produce datorită excluderii din model a factorilor care au cea mai mică putere explicativă. Și aici întrebarea cheie este câți factori să lăsați în model și ce criterii să urmați. Deci, factorii 5 și 6 sunt în mod clar superflui, care împreună explică puțin mai mult de 1% din întreaga variație. Dar soarta factorilor 3 și 4 nu mai este atât de evidentă.

De regulă, în model rămân factori, a căror valoare proprie depășește unitatea (criteriul Kaiser). În cazul nostru, aceștia sunt factorii 1 și 2. Cu toate acestea, este util să verificați corectitudinea eliminării a patru factori folosind alte criterii. Una dintre cele mai utilizate metode este analiza scree plot. Pentru cazul nostru, arată astfel:

Graficul și-a primit numele de la asemănarea cu versantul unui munte. „Scree” este un termen geologic pentru fragmentele de rocă care se acumulează la fundul unui versant stâncos. „Rock” este cu adevărat factori influenți, „scree” este zgomot statistic. Figurat vorbind, trebuie să găsiți un loc pe grafic unde „roca” se termină și începe „șapul” (unde scăderea valorilor proprii de la stânga la dreapta este foarte încetinită). În cazul nostru, alegerea trebuie făcută din prima și a doua inflexiune corespunzătoare la doi și patru factori. Lăsând patru factori, obținem o acuratețe foarte mare a modelului (mai mult de 98% din variația totală), dar îl facem destul de complex. Lăsând doi factori, vom avea o parte semnificativă neexplicată a variației (aproximativ 22%), dar modelul va deveni concis și ușor de analizat (în special, vizual). Astfel, în acest caz, este mai bine să sacrifici o anumită precizie în favoarea compactității, lăsând primul și al doilea factor.

Puteți verifica adecvarea modelului obținut folosind matrici speciale de corelații reproduse și coeficienți reziduali (corelații reziduale). Matricea corelațiilor reproduse conține coeficienții care au fost recuperați din cei doi factori rămași în model. De o importanță deosebită în ea este diagonala principală, pe care sunt situate comunitățile variabilelor (în tabelul cu caractere cursive), care arată cât de exact modelul reproduce corelația unei variabile cu aceeași variabilă, care ar trebui să fie unitatea.

Matricea coeficienților reziduali conține diferența dintre coeficienții originali și cei reproduși. De exemplu, corelația reprodusă între variabilele ATP și Yabloko este 0,88, în timp ce cea inițială este 0,94. Rest = 0,94 - 0,88 = 0,06. Cu cât valorile reziduale sunt mai mici, cu atât calitatea modelului este mai mare.

Corelații reproduse
"Un mar" "Unitate" B J OVR CPRF THX
"Un mar" 0,89
"Unitate" -0,53 0,80
B J -0,47 0,59 0,44
OVR 0,73 -0,72 -0,56 0,76
CPRF -0,70 0,01 0,12 -0,34 0,89
THX 0,88 -0,43 -0,40 0,66 -0,77 0,88
Cote reziduale
"Un mar" "Unitate" B J OVR CPRF THX
"Un mar" 0,11
"Unitate" -0,02 0,20
B J 0,00 -0,31 0,56
OVR -0,13 -0,01 0,09 0,24
CPRF 0,09 0,00 -0,02 -0,14 0,11
THX 0,06 -0,03 0,01 -0,14 0,10 0,12

După cum se poate observa din matrice, modelul cu doi factori, fiind în general adecvat, nu explică bine relațiile individuale. Astfel, generalitatea variabilei BZ este foarte scăzută (doar 0,56), valoarea coeficientului rezidual de legătură dintre BZ și „Unitate” este prea mare (-0,31).

Acum este necesar să decidem cât de importantă este o reprezentare adecvată a variabilei BJ pentru acest studiu particular. Dacă importanța este mare (de exemplu, dacă studiul este dedicat analizei electoratului acestui partid), este corect să revenim la modelul cu patru factori. Dacă nu, se pot lăsa doi factori.
Ținând cont de caracterul educațional al sarcinilor noastre, lăsăm un model mai simplu.

Încărcările factoriale pot fi reprezentate ca coeficienți de corelație ai fiecărei variabile cu fiecare dintre factorii identificați 1ak, corelația dintre valorile primei variabile factor și valorile variabilei „Mere” este -0,93. Toate încărcările factorilor sunt date în matricea de mapare a factorilor-

Cu cât relația variabilei cu factorul luat în considerare este mai strânsă, cu atât valoarea încărcării factorilor este mai mare. Semnul pozitiv al încărcării factorilor indică o directă, iar semnul negativ indică feedback-ul variabilei cu factorul.

Având valorile sarcinilor factoriale, putem construi o reprezentare geometrică a rezultatelor analizei factoriale. Pe axa X, trasăm sarcinile de variabile pe factorul 1, pe axa Y, încărcările de variabile pe factorul 2 și obținem un spațiu factorial bidimensional.

Înainte de a trece la o analiză semnificativă a rezultatelor obținute, să mai efectuăm o operație - rotația. Importanța acestei operații este dictată de faptul că nu există una, ci multe variante ale matricei de încărcări factoriale care explică în mod egal relațiile variabilelor (matricea intercorelațiilor). Este necesar să alegeți o soluție care să fie mai ușor de interpretat în mod semnificativ. Aceasta este considerată o matrice de încărcare în care valorile fiecărei variabile pentru fiecare factor sunt maximizate sau minimizate (aproape de unu sau zero).

Luați în considerare un exemplu schematic. Există patru obiecte situate în spațiul factori, după cum urmează:

Încărcările asupra ambilor factori pentru toate obiectele sunt semnificativ diferite de zero și suntem forțați să folosim ambii factori pentru a interpreta poziția obiectelor. Dar dacă „rotim” întreaga structură în sensul acelor de ceasornic în jurul intersecției axelor de coordonate, obținem următoarea imagine:

În acest caz, sarcinile pe factorul 1 vor fi aproape de zero, iar sarcinile pe factorul 2 vor fi aproape de unitate (principiul structurii simple). În consecință, pentru o interpretare semnificativă a poziției obiectelor, vom implica un singur factor - factorul 2.

Există destul de un numar mare de metode de rotație a factorilor. Astfel, grupul de metode de rotație ortogonală păstrează întotdeauna un unghi drept între axele de coordonate. Acestea includ vanmax (minimizează numărul de variabile cu o încărcare mare de factori), quartimax (minimizează numărul de factori necesari pentru a explica variabila), equamax (o combinație a celor două metode anterioare). Metodele de rotație oblică nu păstrează neapărat un unghi drept între axe (ex. obiimin direct). Metoda promax este o combinație de metode de rotație ortogonală și oblică. În cele mai multe cazuri, este utilizată metoda vanmax, care dă rezultate bune pentru majoritatea sarcinilor de cercetare a politicilor. În plus, ca și în cazul multor alte metode, se recomandă să experimentați diverse tehnici rotație.

În exemplul nostru, după rotația prin metoda varimax, obținem următoarea matrice a încărcărilor factorilor:

În consecință, reprezentarea geometrică a spațiului factorilor va arăta astfel:


Acum putem trece la o interpretare semnificativă a rezultatelor obținute. Opoziţia cheie - scindarea electorală - conform primului factor este formată de Partidul Comunist al Federaţiei Ruse, pe de o parte, iar Iabloko şi Uniunea Forţelor Dreapte (într-o măsură mai mică OVR) - pe de altă parte. Din punct de vedere al conținutului – pe baza specificului atitudinilor ideologice ale subiecților numiți ai procesului electoral – putem interpreta această demarcație ca o scindare „stânga-dreapta”, care este „clasică” pentru știința politică.

Opoziția pe factorul 2 este formată din OVR și Unity. „Blocul Zhirinovsky” se învecinează cu acesta din urmă, dar nu putem judeca în mod fiabil poziția sa în spațiul factorilor din cauza particularităților modelului, care explică prost relațiile acestei variabile particulare. Pentru a explica această configurație, este necesar să reamintim realitățile politice ale campaniei electorale din 1999. La acea vreme, lupta din cadrul elitei politice a dus la formarea a două eșaloane ale „partidului puterii” - „Unitatea” și „ Patria - Toată Rusia”. Diferența dintre ele nu era de natură ideologică: de fapt, populației i s-a oferit să aleagă nu dintre două platforme ideologice, ci dintre două grupuri de elită, fiecare dintre acestea având resurse semnificative de putere și sprijin regional. Astfel, această scindare poate fi interpretată ca „putere-elite” (sau, simplificând oarecum, „putere-opoziție”).

În general, obținem o reprezentare geometrică a unui anumit spațiu electoral al regiunii Ryazan pentru aceste alegeri, dacă înțelegem spațiul electoral ca spațiu de alegere electorală, structura alternativelor politice cheie („divizări”). Combinația acestor două diviziuni a fost foarte tipică pentru alegerile parlamentare din 1999.

Comparând rezultatele analizei factoriale pentru aceeași regiune la diferite alegeri, putem aprecia prezența continuității în configurația alegerii electorale a spațiului teritorial. De exemplu, o analiză factorială a alegerilor parlamentare federale (1995, 1999 și 2003) desfășurate în Tatarstan a arătat o configurație stabilă a spațiului electoral. Pentru alegerile din 1999, în model a mai rămas un singur factor cu o putere explicativă de 83% a variației, ceea ce a făcut imposibilă construirea unei diagrame bidimensionale. Coloana corespunzătoare arată încărcările factorilor.

Dacă te uiți cu atenție la aceste rezultate, vei observa că aceeași scindare principală este reprodusă în republică de la alegeri la alegeri: „partidul puterii” este tot restul.” În 1995, „partidul puterii” era bloc „Casa noastră este Rusia” (NDR), în 1999 - OVR, în 2003 - „Rusia Unită”. De-a lungul timpului, doar „detaliile” se schimbă - numele „partidului puterii”. Noua „etichetă” politică. se încadrează foarte uşor în matricea statică a unei alegeri politice unidimensionale.

La sfârșitul capitolului, vom oferi unul sfaturi practice. Succesul dezvoltării metodelor statistice, în general, este posibil doar cu intensiv munca practica cu programe speciale (deja menționate SPSS, Statistica sau cel puțin Microsoft Excel). Nu este o coincidență că prezentarea tehnicilor statistice este realizată de noi în modul algoritmilor de lucru: acest lucru permite elevului să parcurgă în mod independent toate etapele analizei, stând la computer. Fără încercări de analiză practică a datelor reale, ideea posibilităților metodelor statistice în analiza politică va rămâne inevitabil generală și abstractă. Și astăzi capacitatea de a aplica statistica pentru a rezolva atât probleme teoretice, cât și aplicate este o componentă fundamentală a modelului unui om de știință politică.

Controlați întrebările și sarcinile

1. Ce niveluri de măsurare corespund valorilor medii - mod, mediană, medie aritmetică? Ce măsuri de variație sunt tipice pentru fiecare dintre ele?

2. Din ce motive este necesar să se țină cont de forma de distribuție a variabilelor?

3. Ce înseamnă afirmația „Există o relație statistică între două variabile”?

4. Ce Informatii utile despre relațiile dintre variabile se poate obține pe baza analizei tabelelor de contingență?

5. Ce se poate învăța despre relația dintre variabile pe baza valorilor testelor statistice chi-pătrat și lambda?

6. Definiți conceptul de „eroare” în cercetarea statistică. Cum poate fi utilizat acest indicator pentru a evalua calitatea modelului statistic construit?

7. Care este scopul principal al analizei de corelație? Ce caracteristici ale unei relații statistice dezvăluie această metodă?

8. Cum se interpretează valoarea coeficientului de corelație Pearson?

9. Descrieți metoda de analiză a dispersiei. Ce alte metode statistice folosesc statisticile ANOVA și de ce?

10. Explicați semnificația termenului „ipoteză nulă”.

11. Ce este o linie de regresie, ce metodă se folosește pentru a o construi?

12. Ce arată coeficientul R în statisticile finale ale analizei de regresie?

13. Explicați termenul „metodă de clasificare multidimensională”.

14. Explicați principalele diferențe dintre gruparea folosind analiza cluster ierarhică și K-means.

15. Cum poate fi utilizată analiza clusterului pentru a studia imaginea liderilor politici?

16. Care este sarcina principală rezolvată prin analiza discriminantă? Definiți o funcție discriminantă.

17. Numiți trei clase de probleme rezolvate folosind analiza factorială. Definiți termenul „factor”.

18. Descrieți cele trei metode principale de verificare a calității modelului în analiza factorială (criteriul lui Kaiser, criteriul „scree”, matricea corelațiilor reproduse).

  • Migrația internațională a resurselor financiare în contextul analizei factoriale
  • 25. J.-B. Say a intrat în istoria științei economice ca autor al teoriei factoriale a valorii. Care sunt principalele prevederi ale acestei teorii?
  • Studiu de fezabilitate al proiectului de construcție și analiza garanțiilor pentru creditul de construcție solicitat
  • Toate fenomenele și procesele de activitate economică a întreprinderilor sunt interconectate și interdependente. Unele dintre ele sunt legate direct, altele indirect. Prin urmare, o problemă metodologică importantă în analiza economică este studiul și măsurarea influenței factorilor asupra mărimii indicatorilor economici studiați.

    Analiza factorială în literatura de specialitate este interpretată ca o secțiune de analiză statistică multivariată care combină metode de estimare a dimensiunii unui set de variabile observate prin studierea structurii matricelor de covarianță sau de corelație.

    Analiza factorială își începe istoria în psihometrie și este în prezent utilizată pe scară largă nu numai în psihologie, ci și în neurofiziologie, sociologie, științe politice, economie, statistică și alte științe. Principalele idei ale analizei factoriale au fost stabilite de psihologul și antropologul englez F. Galton. Dezvoltarea și implementarea analizei factorilor în psihologie a fost realizată de oameni de știință precum: Ch.Spearman, L.Thurstone și R.Kettel. A fost elaborată analiza factorială matematică Hotelling, Harman, Kaiser, Thurstone, Tuckerși alți oameni de știință.

    Acest tip de analiză permite cercetătorului să rezolve două sarcini principale: să descrie subiectul măsurării în mod compact și în același timp cuprinzător. Cu ajutorul analizei factoriale este posibilă identificarea factorilor responsabili de prezența relațiilor statistice liniare de corelații între variabilele observate.

    Obiectivele analizei factoriale

    De exemplu, atunci când analizează scorurile obținute pe mai multe scale, cercetătorul constată că acestea sunt asemănătoare între ele și au un coeficient de corelație ridicat, caz în care poate presupune că există unele variabilă latentă, care poate fi folosit pentru a explica similaritatea observată a estimărilor obținute. O astfel de variabilă latentă se numește un factor care afectează numeroși indicatori ai altor variabile, ceea ce duce la posibilitatea și necesitatea de a o marca ca cea mai generală, de ordin superior.

    Astfel, doi obiectivele analizei factoriale:

    • determinarea relațiilor dintre variabile, clasificarea acestora, adică „clasificarea R obiectivă”;
    • reducerea numărului de variabile.

    Pentru a identifica cei mai importanți factori și, în consecință, structura factorilor, este cel mai justificat utilizarea metoda componentelor principale. Esența acestei metode este înlocuirea componentelor corelate cu factori necorelați. O altă caracteristică importantă a metodei este capacitatea de a restricționa componentele principale cele mai informative și de a exclude restul din analiză, ceea ce simplifică interpretarea rezultatelor. Avantajul acestei metode este, de asemenea, că este singura metodă justificată matematic de analiză factorială.

    Analiza factorilor- o metodologie pentru un studiu și măsurare cuprinzătoare și sistematice a impactului factorilor asupra valorii indicatorului efectiv.

    Tipuri de analiză factorială

    Există următoarele tipuri de analiză factorială:

    1) Determinist (funcțional) - indicatorul efectiv este prezentat ca un produs, privat sau sumă algebrică a factorilor.

    2) Stochastic (corelație) - relația dintre indicatorii de performanță și factorii este incompletă sau probabilistică.

    3) Direct (deductiv) - de la general la particular.

    4) Revers (inductiv) - de la particular la general.

    5) cu o singură etapă și cu mai multe etape.

    6) Static și dinamic.

    7) Retrospectivă și prospectivă.

    Analiza factorială poate fi, de asemenea explorare- se efectuează în studiul structurii factorilor latenți fără o ipoteză despre numărul de factori și sarcinile acestora și confirmatoare concepute pentru a testa ipoteze despre numărul de factori și sarcinile acestora. Implementarea practică a analizei factorilor începe cu verificarea condițiilor acesteia.

    Condiții obligatorii pentru analiza factorială:

    • Toate semnele trebuie să fie cantitative;
    • Numărul de caracteristici ar trebui să fie de două ori numărul de variabile;
    • Proba trebuie să fie omogenă;
    • Variabilele sursă trebuie să fie distribuite simetric;
    • Analiza factorială se realizează pe variabile corelate.

    În analiză, variabilele care sunt puternic corelate între ele sunt combinate într-un singur factor, ca urmare, varianța este redistribuită între componente și se obține cea mai simplă și clară structură a factorilor. După combinare, corelația componentelor din cadrul fiecărui factor între ele va fi mai mare decât corelarea lor cu componentele din alți factori. Această procedură face posibilă și izolarea variabilelor latente, ceea ce este deosebit de important în analiza percepțiilor și valorilor sociale.

    Etapele analizei factoriale

    De regulă, analiza factorială se realizează în mai multe etape.

    Etapele analizei factoriale:

    Etapa 1. Selectarea factorilor.

    Etapa 2. Clasificarea și sistematizarea factorilor.

    Etapa 3. Modelarea relației dintre indicatorii de performanță și factori.

    Etapa 4. Calculul influenței factorilor și evaluarea rolului fiecăruia dintre aceștia în modificarea valorii indicatorului efectiv.

    Etapa 5 Utilizarea practică a modelului factorilor (calculul rezervelor pentru creșterea indicatorului efectiv).

    După natura relației dintre indicatori, există metode deterministeȘi analiza factorială stocastică

    Analiza factorială deterministă este o metodologie de studiere a influenței factorilor a căror relație cu indicatorul de performanță este funcțională, adică atunci când indicatorul de performanță al modelului factorial este prezentat ca un produs, sumă privată sau algebrică a factorilor.

    Metode de analiză factorială deterministă: Metoda de substituție a lanțului; Metoda diferențelor absolute; Metoda diferențelor relative; Metoda integrală; Metoda logaritmului.

    Acest tip de analiză factorială este cel mai comun, deoarece, fiind destul de simplu de utilizat (comparativ cu analiza stocastică), vă permite să înțelegeți logica principalilor factori ai dezvoltării întreprinderii, să cuantificați influența acestora, să înțelegeți ce factori și în ce proporție, este posibil și oportun să se schimbe pentru îmbunătățirea eficienței producției.

    Analiza stocastică este o metodologie de studiere a factorilor a căror relație cu indicatorul de performanță, spre deosebire de cel funcțional, este incompletă, probabilistă (corelație). Dacă cu o dependență funcțională (completă), o modificare corespunzătoare a funcției are loc întotdeauna cu o schimbare a argumentului, atunci cu o relație de corelare, o modificare a argumentului poate da mai multe valori ale creșterii funcției, în funcție de combinarea altor factori care determină acest indicator.

    Metode de analiză factorială stocastică: Metoda de corelare a perechilor; Analiza corelației multiple; Modele matrice; Programare matematică; Metoda de cercetare operațională; Teoria jocului.

    De asemenea, este necesar să se facă distincția între analiza factorilor statică și dinamică. Primul tip este utilizat atunci când se studiază influența factorilor asupra indicatorilor de performanță pentru data corespunzătoare. Un alt tip este o metodologie pentru studierea relațiilor cauză-efect în dinamică.

    Și, în sfârșit, analiza factorială poate fi retrospectivă, care studiază motivele creșterii indicatorilor de performanță pentru perioadele trecute, și prospectivă, care examinează comportamentul factorilor și indicatorilor de performanță în viitor.