Psykiatriska tillstånd kommer sällan ensamma (del 3)
I det här brevet kommer jag att beskriva den statistiska tekniken faktoranalys och hur den har använts sedan början av 1900-talet för att studera våra kognitiva förmågor
Tidigare brev i denna serie har identifierat flera utmaningar med att mäta psykiatriska tillstånd. En utmaning är att många mätinstrument för samma tillstånd ofta fokuserar på olika typer av symtom, vilket kan leda till att de fångar upp olika aspekter tillstånden som de avser att mäta (del 1). En annan utmaning är att samma symtom kan ingå i flera olika tillstånd och att personer med ett visst tillstånd har en ökad risk att utveckla ytterligare tillstånd, vilket kan göra det svårt att skilja emellan dem (del 2).
I det här brevet kommer jag att diskutera faktoranalys, en statistisk teknik som bland annat används för att studera intelligens. Kunskaper om faktoranalys är viktiga för att förstå kommande brev i serien.
Många av nyhetsbrevets läsare förefaller att ha läst minst ett par psykologikurser och bör därför vara bekanta med “g-faktorn” eller bara g. För övriga läsare framstår detta nog som rena grekiskan. Låt oss därför ta det från början.
Vad är intelligens?
I mitten av 1990-talet samlades 52 kända intelligensforskare och publicerade denna konsensusdefinition för intelligens (Gottfredson, 1997):
Intelligence is a very general mental capability that, among other things, involves the ability to reason, plan, solve problems, think abstractly, comprehend complex ideas, learn quickly and learn from experience. It is not merely book learning, a narrow academic skill, or test-taking smarts. Rather, it reflects a broader and deeper capability for comprehending our surroundings - “catching on,” “making sense” of things, or “figuring out” what to do.
Intelligenstest är standardiserade instrument som är utformade för att mäta ett brett spektrum av kognitiva förmågor, bland annat logiskt tänkande, problemlösning, verbala och spatiala färdigheter, arbetsminne och processhastighet. Dessa förmågor kan hjälpa oss att lära oss nya saker, att lösa problem och att fatta svåra beslut. Av dessa skäl är de användbara i en mängd olika sammanhang, från utbildning till yrkeslivet och i sociala sammanhang. Det är dock viktigt att komma ihåg att intelligenstest inte är avsedda att mäta samtliga individuella skillnader i mänskliga egenskaper. Vi människor skiljer oss även åt i våra personlighets- och karaktärsdrag, kreativitet och andra egenskaper som är viktiga för våra utfall i livet men som inte ingår i intelligenstest.
Faktorbegreppet kommer från faktoranalys, vilket är statistisk teknik som används för att sammanfatta datamönster. Vad innebär det? Ponera att vi har delat ut ett intelligenstest med 60 frågor till ett 1200 deltagare. När vi har fått tillbaka testerna registrerar vi resultaten i ett kalkylblad.
Varje rad i kalkylbladet avser en deltagare och varje kolumn hur de presterade på varje delfråga. Kalkylbladet består således av 1200 rader och 60 kolumner. Om vi snabbt tittar på siffrorna i ett antal enskilda kolumner kan vi se att deltagarnas resultat skiljer sig åt ganska mycket ifrån varandra. Denna variation är i linje med tidigare forskning om intelligens, som har visat att det finns en betydande individuell variation i kognitiva förmågor. Inom statistiken kallas varje kolumn för en variabel, eftersom de representerar ett värde som kan variera.
Om vi istället tittar på de radvisa siffrorna ser vi att skillnaderna är betydligt mindre. Även detta är i linje med forskningen om intelligens, som har funnit att mätningar av olika typer av kognitiva förmågor har en positiv korrelation. Det innebär att personer som presterar väl på en delfråga också tenderar att prestera väl på andra delfrågor. På motsvarande sätt tenderar personer som presterar sämre på en delfråga också att prestera sämre på andra delfrågor. Det är därför sällsynt att någon har mycket höga poäng på vissa delfrågor och mycket låga poäng på andra delfrågor. Av dessa skäl tenderar de radvisa siffrorna vara mer lika varandra.
Den snabba granskningen skulle få oss att komma fram till två slutsatser:
Det finns en positiv korrelation mellan samtliga delfrågor i testet. Ju bättre någon presterar på en given fråga, desto bättre kommer den att prestera på övriga frågor.
För samma individer skulle vi därtill se att delfrågor som mäter specifika kognitiva förmågor, såsom logiskt tänkande eller verbala förmågor, är starkare korrelerade med varandra än delfrågor som mäter olika typer av kognitiva förmågor.
Dessa slutsatser implicerar att det finns minst två olika typer av förmågor, där den ena typen är av en mer generell typ och förklarar individernas prestationer över samtliga delfrågor medan den andra typen är mer specifik och förklarar individernas prestationer för enskilda deltester som mäter specifika kognitiva förmågor.
Hur kan vi identifiera och separera de generella och specifika typerna av kognitiva förmågor? Du gissade rätt, det är här faktoranalysen kommer in i bilden.
Våra variabler (delfrågorna i testet eller kolumnerna i kalkylbladet) har vi kunnat mäta direkt. De består som bekant av deltagarnas svar som redan är insamlade. Inom faktoranalys kallas dessa typer av variabler för manifesta variabler. Manifest innebär här att de är “synliga” eller mätbara.
Baserat på våra två slutsatser ovan är vi emellertid intresserade av att identifiera två variabler som inte är direkt mätbara, nämligen generella respektive specifika kognitiva förmågor. Inom faktoranalys kallas dessa latenta variabler där latent helt enkelt innebär att vi inte kan mäta dem direkt. Faktoranalysen ger oss möjligheten att mäta dessa indirekt. Hur funkar det?
Faktoranalytiska modeller är förvisso komplexa i sin matematiska utformningar, men grundidén är desto enklare. Modellerna granskar hur delfrågorna, eller de manifesta variablerna, är korrelerade med varandra och antar att det måste finnas bakomliggande faktorer (latenta variabler) som orsakar dessa korrelationer. Moderna faktoranalytiska modeller testar sedermera hur många av dessa bakomliggande faktorer som krävs för att förklara så mycket som möjligt av korrelationsstrukturerna mellan de manifesta variablerna, eller de mönster av korrelationer som finns mellan delfrågorna i datamaterialet.
För vårt fiktiva intelligenstest förväntar vi oss att modellen tar fram minst två bakomliggande faktorer: en generell faktor som förklarar korrelationerna mellan samtliga deltest (slutsats 1 ovan), och ett antal specifika faktorer som förklarar varför korrelationerna mellan frågorna inom varje deltest är starkare än korrelationerna mellan frågor i olika deltest (slutsats 2 ovan).
Den generella faktorn fångar således upp en persons generella kognitiva förmågor, medan de specifika faktorerna istället fokuserar på snävare typer av kognitiva förmågor, såsom verbala, spatiala och logiska förmågor.
Spearmans tvåfaktorteori
Den brittiske psykologen Charles Spearman genomförde den första studien av intelligens med faktoranalytiska ansatser. Resultaten redovisade han i artikeln “‘General Intelligence’ Objectively Determined and Measured” som publicerades i American Journal of Psychology redan 1904. Imponerande nog var Spearman blott en doktorand när han uppfann den första faktoranalytiska modellen. Det datamaterial som han hade till sitt förfogande var ändock mindre imponerande. Den bestod nämligen av 23 pojkar från en gymnasieskola i den Berkshire-regionen som ligger cirka en timmes bilfärd söder om mina hemtrakter här i Oxford.
Spearmans grunddata kan sammanfattas i en korrelationsmatris som visar sambanden mellan de olika deltesterna i hans instrument. Alla korrelationer var positiva, vilket innebär att höga poäng på ett deltest i genomsnitt var associerade med höga poäng på andra deltest. Effektstorlekarna varierade dock, mellan en korrelation på 43 procent mellan musik och tonhöjdsdiskriminering och en korrelation på 85 procent mellan klassisk litteratur och franska:
I sin faktoranalys av korrelationerna mellan dessa deltester fann Spearman att en gemensam faktor (eller latent variabel), som han kallade g för generell intelligens, förklarade 63 procent av korrelationerna. Spearmans faktoranalysmodell var dock rudimentär jämfört med moderna faktoranalysmodeller och kunde enbart identifiera en gemensam faktor. Han argumenterade därför att de återstående 37 procenten av korrelationerna förklarades av en kombination av samtliga deltest-specifika förmågor, vilka han för enkelhetens skull kallade S. Denna slutsats har kommit att kallas Spearmans tvåfaktorteori. Om vi skulle illustrera Spearmans modell schematiskt skulle den se ut på följande vis:
I faktoranalysmodeller representeras latenta variabler, såsom g, med cirklar, medan manifesta variabler, såsom enskilda deltest, representeras med rektanglar. I den givna grafen illustreras de mätbara deltesterna med de gråa rektanglarna i mitten.
De gråa rektanglarna korrelerar med varandra, vilket tyder på att de delar på minst en gemensam faktor. Denna faktor, som Spearman kallade g, representerar den generella faktorn för kognitiva funktioner. Pilarnas riktningar indikerar att det är g som förklarar korrelationerna mellan deltesterna.
Spearmans modell kunde som bekant endast identifiera g, men han antog att specifika kognitiva förmågor, som han benämnde S, bidrog till de kvarvarande korrelationerna. De lila cirklarna representerar dessa specifika förmågor. Anledningen till att det finns flera S-cirklar beror på att de specifika förmågorna skiljer sig för varje deltest. Med nyare faktoranalytiska modeller kan man, som jag kommer att redovisa längre ned, undersöka hur pass mycket varje enskild faktor bidrar till korrelationerna.
Alla mätningar är förenade med ett visst mått av mätfel. Dessa fel kan orsakas av en mängd olika faktorer, såsom ofullständiga eller felaktiga svar, eller brister i testinstrumentet. De orangefärgade cirklarna med epsilon-symbolen (ε) representerar de slumpmässiga mätfel som finns i varje deltest.
Ett modernt intelligenstest: WAIS-IV
David Wechsler, chefspsykolog vid Bellevuesjukhuset i New York under större delen av sin karriär, publicerade 1955 den första utgåvan av Wechsler Adult Intelligence Scale (WAIS).1 Wechlerskalan är en av de mest populära intelligenstesterna i världen och används för att bedöma kognitiv förmåga hos personer mellan 16 och 90 år gamla. Den senaste upplagan av Wechlerskalan ges ut av utbildningsföretaget Pearson.
Till skillnad mot Spearmans studie byggde den uppdaterade Wechlerskalan på ett nationellt representativt urval av 2200 amerikanska deltagare där deltagarna fick besvara ett mer omfattande frågebatteri som var designad för att fånga fler specifika kognitiva förmågor.2
Wechlerskalan inkluderar en generell faktor som förklarar korrelationerna mellan samtliga delfrågor (Full Scale IQ, vilket motsvarar g) och ytterligare fyra faktorer som mäter verbala förmågor, perceptuella förmågor, arbetsminne och processhastighet:

Sammanvägda analyser av intelligenstester genomförda i såväl västliga3 som icke-västliga4 länder med tusentals deltagare har konsekvent visat stöd för den generella faktorn för kognitiva förmågor, eller g. Ett annat sätt att validera g är att låta samma person genomföra ett flertal olika intelligenstester och se hur väl g korrelerar mellan testerna. I studier där man har gjort detta har man sett att individerna får väldigt snarlika resultat mellan testerna.5
Dessa studier visar därtill att g förklarar cirka 40 till 50 procent av de individuella skillnaderna i kognitiva förmågor. Det senare är något lägre än Spearmans resultat (63 procent). Detta är dock väntat då de första studierna inom olika fält tenderar att ha något optimistiska värden innan de harmoniseras genom replikationsstudier. Forskare brukar kalla det här fenomenet för “vinnarens förbannelse” (eng. winner’s curse), vilket är ett uttryck som ursprungligen kommer från auktionsvärlden och avser det faktum att budvinnare tenderar att lägga alltför höga bud i förhållande till objektens faktiska värden. Påfallande ofta sker detta med anledning av att budgivarna har begränsad information om objektens värden. På motsvarande sätt kan det vara vanskligt för forskare att värdera hur pass optimistiska resultat som de har fått innan andra har genomfört liknande analyser.
Hur ser mekanismerna ut?
Inom psykometri, vetenskapen om psykologiska mätningar av mänskliga beteenden och egenskaper, har det förts en debatt om huruvida kognitiva förmågor bäst förklaras av en generell faktor, ett flertal specifika faktorer, eller en kombination av båda. Den senaste forskningen och de mest använda intelligensskalorna stödjer den sistnämnda förklaringsmodellen. Det råder emellertid stor oenighet om g är relaterad till de specifika faktorerna.
Somliga har förespråkat att en så kallad bifaktormodell (eng. bifactor model) bäst förklarar intelligensdata. I en bifaktormodell förklaras varje enskild delfråga av två faktorer: g och en specifik förmåga.6 En förenklad illustration av modellen redovisas nedan:7
I figuren visas en bifaktormodell för en fiktiv analys av ett intelligenstest med 12 delfrågor. De fyra specifika kognitiva förmågor som testets delfrågor är avsedda att mäta är verbala förmågor (delfrågor 1-3), perceptuella förmågor (delfrågor 4-6), arbetsminne (delfrågor 7-9) och processhastighet (delfrågor 10-12). Analysen visar att alla delfrågor förklaras av två faktorer: g och en specifik faktor.
En del läsare har säkert noterat att g och och de specifika faktorerna inte är korrelerade med varandra i figuren. Hur kan det komma sig?
Lite längre upp nämnde jag att g förklarar cirka 40-50 procent av individuella skillnaderna i kognitiva förmågor. Det innebär att det finns en hel del kvarvarande variation som de specifika förmågorna förklarar efter att man har tagit hänsyn till deras överlapp med g. Annorlunda uttryckt isolerar modellen de unika bidragen av de specifika faktorerna efter att deras gemensamma variation (g) har justerats för.
Kritiker av bifaktormodellen för intelligens menar att de mekanismerna mellan de specifika faktorerna är så pass komplexa att de inte kan särskiljas på det viset. I Wechslerskalans tekniska manual kan man läsa följande (Wechsler et al., 2008, s. 2-3):
[…] cognitive functions are interrelated, functionally and neurologically, making it difficult to measure a pure domain of cognitive functioning. Even traditional measures of narrow domains, such as processing speed, involve the ability of individuals to comprehend verbal instruction, discriminate between visual stimuli, process the information, and indicate their response by performing a motoric function. Although the results of factor analytic studies suggest the presence or absence of a measured domain, the results may not capture the variety of cognitive abilities required to complete a subtest task.
Utvecklarna av Wechslerskalan förordar därför en annan typ av faktoranalytisk modell som kallas för den hierarkiska modellen. I den nedanstående figuren har jag omformulerat bifaktormodellen ovan till en hierarkisk modell:
I den hierarkiska modellen förklaras delfrågorna av en hierarki av kognitiva funktioner som är relaterade till varandra. De individuella delfrågorna (nivå 1), förklaras av bredare kognitiva domäner (de specifika kognitiva förmågorna; nivå 2), vilka i sin tur förklaras av g (nivå 3).
Till skillnad mot bifaktormodellen där g antas ha en direktverkande effekt på de individuella delfrågorna antar den hierarkiska modellen att g indirekt påverkar de individuella delfrågorna via de specifika faktorerna. Det rör sig således om två olika sätt att se på hur mekanismerna verkar.
Om man har samlat in intelligensdata kan man testa huruvida bifaktormodellen eller den hierarkiska modellen förklarar datamaterialet bäst. Resultaten av studier där man har gjort sådana jämförelser har dock inte varit entydiga. Det finns ett flertal mer tekniska detaljer som gör det vanskligt att dra några generella slutsatser. Den intresserade kan med fördel läsa översiktsartikeln av Markon (2019) för fler detaljer.
Finns det bara fyra specifika faktorer?
Inom psykometri råder oenighet även beträffande vilka specifika faktorer som är mest betydelsefulla för mätningen av intelligens. Den exakta kombinationen och typen av specifika faktorer som är relevanta för intelligensmätningar beror nämligen på vilka indikatorer som inkluderas i de statistiska modellerna. Psykometrikerna ägnar stor möda åt att förbättra sina modeller genom att ständigt utforska och pröva nya indikatorer. Resultatet av denna process är att olika studier kan påvisa olika specifika faktorer som har betydelse för intelligens.
Detta står i kontrast till g som inte är lika känslig för de inkluderade indikatorerna. Detta är skälet till att den, till skillnad mot de specifika faktorerna, har replikerats så pass brett genom en mängd olika studier och kontexter.
Sammanfattning
Under sitt doktorandprojekt genomförde Charles Spearman en studie med 23 brittiska gymnasiepojkar för att undersöka om det fanns en koppling mellan olika kognitiva förmågor. Han fann att de pojkar som presterade väl på ett deltest även ofta presterade väl på andra deltest. Detta ledde honom till att utveckla faktoranalysen — en statistisk metod som kan användas för att identifiera gemensamma faktorer i data. Spearman använde faktoranalysen för att identifiera en generell kognitiv förmåga, som han kallade g.
Spearmans forskning har inspirerat omfattande forskning på kognitiva förmågor. Man har funnit att g finns i hela världen, i såväl västliga som icke-västliga länder, oaktat vilka intelligenstester som har använts. Hur g relaterar till specifika kognitiva förmågor är dock fortfarande en öppen fråga. Det finns en mängd olika teorier om antalet specifika kognitiva förmågor, men det råder än så länge inget konsensus om den saken heller.
Det här brevet är långt ifrån uttömmande. Några av er kommer att undra vad som hände med distinktionen mellan flytande och kristalliserad intelligens, andra kommer att fråga sig var den så kallade Flynn-effekten kommer in i bilden och ytterligare några kommer att undra om det inte finns några könsskillnader i intelligenstester. Jag har försökt täcka det viktigaste som ni behöver att ha med er för att förstå nästkommande brev.
För längre översikter rekommenderar jag böckerna “Intelligence: A Very Short Introduction” av Ian Deary, professor emeritus i psykologi vid University of Edinburgh, och “Intelligence: All that matters” av Stuart J. Ritchie, tidigare docent i psykologi vid Kings College London men numera vetenskapsjournalist.
Nästa brev i serien
Vad skulle hända om man istället för kognitiva funktioner skulle faktoranalysera beteenderelaterade anpassningsproblem bland barn och ungdomar? Prenumerera för att inte missa svaret!
Omslagsbild: Ries Bosch / Unsplash.
Informationen om WAIS-IV i inlägget kommer från dess tekniska rapport: Wechsler, D. (2008). Wechsler Adult Intelligence Scale—Fourth Edition Technical and Interpretive Manual. San Antonio, TX: Pearson.
Selektionen av deltagarna möjliggjorde för utvecklarna att skapa ett test som var representativt för den amerikanska befolkningen såsom den såg ut i 2005 års folkräkning med avseende på ålder, kön, “ras”/etnisk bakgrund, geografisk region och utbildningsnivå. Utvecklarna stratifierade materialet i totalt 13 ålderskategorier med minst 100 deltagare i varje ålderskategori, från de som var 16-17 år gamla till de som var 85-90 år gamla. En svensk översättning och standardisering av Wechslerskalan finns tillgänglig på företagets hemsida.
Carroll, J. B. (1993). Human cognitive abilities: A survey of factor-analytic studies. Cambridge University Press.
Warne, R. T., & Burningham, C. (2019). Spearman’s g found in 31 non-Western nations: Strong evidence that g is a universal phenomenon. Psychological Bulletin, 145(3), 237-272.
Korrelationerna är nästan perfekta (r≥0,95) för mer omfattande intelligenstester (Johnson et al., 2008).
Bifaktormodellens namn är något förvirrande då en sådan modell kan innehålla fler än två faktorer. Det viktiga är att det enbart är två faktorer, en generell och en specifik faktor, som förklarar varje enskild mätbar indikator i modellen.
För att förbättra läsbarheten av grafen har jag inte inkluderat symboler för mätfel. Detta gäller även den efterkommande figuren för hierarkiska modeller.