Psykiatriska tillstånd kommer sällan ensamma (del 8)
I den avslutande delen av denna serie diskuterar jag den kritik som har framförts mot den generella faktorn för psykopatologi. Bör "p-faktorn" förkastas eller har den en plats i fältet?
I ett antal brev har jag under de senaste månaderna sammanfattat litteraturen som har försökt att besvara frågan om varför psykiatriska tillstånd överlappar med varandra.
Vad har vi hittills lärt oss?
I del 1 fick vi lära oss om skattningsskalor och deras bristfälliga generaliserbarhet då de i hög grad fokuserar på väldigt skilda symtom. I del 2 lärde oss vi oss om vad som hände med diagnosen damp som var populär under 1990-talet och om epidemiologiska studier som har visat på de starka överlappen mellan neuropsykiatriska funktionsnedsättningar och andra psykiatriska tillstånd. Det framgick att en delförklaring till varför överlappen existerar kan bero på att många symtom i diagnostiska manualer delas mellan ett flertal tillstånd.
Vi gick vidare i del 3 till att lära oss mer om den statistiska tekniken faktoranalys och om hur den har använts för att studera intelligens sedan 1920-talets början. Det visade sig, i del 4, att faktoranalytiska modeller inte enbart har använts för att förstå intelligens utan även tidiga anpassningsproblem bland barn. När barns problematiska beteenden började att analyseras med faktoranalytiska metoder kunde forskare identifiera två gemensamma faktorer som förklarade sambanden mellan specifika typer av beteenden; internaliserande anpassningsproblem som riktades inåt och externaliserande anpassningsproblem som riktades utåt.
Under flera decennier betraktades personer med beteendeproblem att ha endera variant av anpassningsproblem, men med tiden blev det uppenbart att det fanns ett betydande överlapp mellan de två kategorierna av anpassningsproblem, såväl bland barn som vuxna. Den insikten fick flera utvecklingspsykologer att fråga sig om det inte fanns en underliggande faktor som förklarade överlappen mellan specifika typer av beteenden; internaliserande anpassningsproblem som riktades inåt, och externaliserande anpassningsproblem som riktades utåt.
Mycket riktigt fick vi i del 5 lära oss att korrelationer mellan psykiatriska symtom och tillstånd kunde fångas upp i en gemensam faktor som med tiden har kommit att kallas för p, eller p-faktorn efter den generella faktorn för psykopatologi. I del 6 presenterades ett antal tvilling- och familjebaserade studier som genomgående har funnit stöd för att p-faktorn i betydande grad är ärftlig, vilket innebär att samma genetiska riskfaktorer tenderar att förklara skillnader i ett flertal psykiatriska tillstånd.
Avslutningsvis lärde vi oss i del 7 att p-faktorn är associerad med ett större antal relevanta långtidsutfall även efter det att hänsyn tagits till bedömareffekter, mätbara sociodemografiska faktorer, deltagarnas intelligensnivå och familjära förväxlingsfaktorer (ärftlighet och delad uppväxtmiljö). Sambanden gäller dock enbart på gruppnivå. Det finns i dagsläget inga studier som har undersökt p-faktorns förmåga att på individnivå predicera (förutsäga) utfallen.
Det faktum att p-faktorn är associerad med ett flertal relevanta långtidsutfall talar till fördel för dess vetenskapliga giltighet, eller validitet. Det finns emellertid även en hel del som talar emot dess validitet också, vilket vi nu i seriens sista del ska fördjupa oss i.
Ingen vet hur p-faktorn bör tolkas
En av de stora debatterna inom fältet just nu handlar om hur p-faktorn bör tolkas. Enligt ett perspektiv utgör p-faktorn blott ett beskrivande mått för ansamlingen av psykiatrisk sjukdomsbörda vid ett givet mättillfälle. Andra går dock längre och menar att p-faktorn mäter sårbarheten för att utveckla psykiatriska tillstånd och i bredare bemärkelse även funktionsnedsättningar i vardagen. Vilket av perspektiven är det korrekta? I dagsläget finns det inget entydigt svar på den frågan.
För att förstå frågans komplexitet måste vi inledningsvis förstå betydelsen av statistiska modeller. Ponera att vi har genomfört en svensk enkätstudie som avser replikera Benjamin Lahey med fleras första p-faktorstudie från 2012 som jag sammanfattade i del 5. Efter datainsamlingen har vi således tillgång till ett material av ett större antal deltagare som var för sig har 11 binära indikatorer för psykiatriska tillstånd.
I våra statistiska modeller specificerar vi hur indikatorerna, eller de psykiatriska tillstånden, är relaterade till varandra. När vi har specificerat färdigt en modell undersöker vi dess modellanpassning, eller hur väl modellen förklarar relationerna mellan variablerna i datamaterialet. Vi kan även specificera flera modeller och jämföra om någon modell passar datamaterialet bättre än andra modeller.
Jag förstår att det här nu låter väldigt abstrakt. Låt oss därför bli mer praktiska.
Lahey och hans kollegor var inledningsvis intresserade av att undersöka överlappen mellan internaliserande och externaliserande anpassningsproblem. Efter en initial faktoranalys framgick det dock att de internaliserande anpassningsproblemen kunde delas upp i två distinkta underkategorier som forskarna benämnde distress (emotionell påfrestning)1, vilket kännetecknades av svår depression, generaliserat ångest och negativ stress, samt fears (rädslor), som istället utmärktes av fobier och panikångest. Dessa två underkategorier kunde identifieras av det enkla faktumet att indikatorerna för dessa kategorier var mer korrelerade med varandra än med övriga indikatorer för internaliserande anpassningsproblem.
Samma data, olika modeller
Vi skulle nu kunna använda oss av den här informationen för att specificera den nedanstående statistiska modellen där de 11 indikatorerna (grå rutor) förklaras av tre latenta variabler (lila cirklar; [1] emotionell påfrestning, [2] rädslor samt [3] externaliserande anpassningsproblem). Modellen kallas för en korrelerad faktormodell då den inkluderar tre faktorer som är korrelerade med varandra. Korrelationerna mellan faktorerna indikeras av de orangefärgade pilarna.
Ni som inte hänger med här kan med fördel återgå till del 3 i serien där skillnaden mellan latenta och manifesta variabler beskrivs mer ingående. Kortfattat är latenta variabler sådana variabler som inte kan mätas direkt, utan enbart indirekt genom analyser av korrelationer mellan ett antal mätbara (manifesta) variabler.
Låt oss ta den latenta variabeln “emotionell påfrestning” i figuren ovan som exempel. Vi har inte mätt “emotionell påfrestning” på ett direkt sätt utan vi har indirekt mätt den med tre indikatorer (svår depression, dystymi och generaliserat ångestsyndrom). Dessa indikatorer är så pass starkt korrelerade med varandra att de antas förklaras av en gemensam faktor som forskarna har benämnt ”emotionell påfrestning”.
Det är viktigt att förstå att den faktor eller latenta variabel som forskarna har identifierat är en renodlad statistisk konstruktion. Den statistiska modellen som forskarna har använt kan inte bevisa att det finns en inneboende sårbarhet för emotionell påfrestning bland deltagarna. Modellen visar endast att indikatorerna för emotionell påfrestning är korrelerade med varandra men inte varför de är det. Det är alltså forskarna själva som har tolkat den statistiska konstruktionen som en inneboende psykologisk egenskap. Det senare steget är emellertid inget som man enbart kan motivera på basis av den presenterade statistiska modellen.
Det finns många möjliga förklaringar till varför de observerade korrelationerna mellan indikatorerna för emotionell påfrestning skulle kunna uppstå. En förklaring är att de delvis delar samma symtom. En annan förklaring är att tillstånden delar samma orsaksfaktorer. En tredje förklaring är att ett givet tillstånd i sig skulle kunna orsaka en ökad risk för att personen utvecklar andra tillstånd inom samma kategori. Samma argument gäller även de övriga två faktorerna (rädslor samt externaliserande anpassningsproblem.)
Med samma datamaterial som vi ovan använde för att specificera den korrelerade faktormodellen skulle vi istället kunna specificera en hierarkisk modell enligt nedan.
Skillnaden mellan den korrelerade faktormodellen och den hierarkiska modellen är att vi i det senare fallet använder oss av korrelationerna mellan de tre latenta variablerna (emotionell påfrestning, rädslor och externaliserande anpassningsproblem) för att mäta en överordnad latent variabel, nämligen p-faktorn.
Den hierarkiska modellen antar att det finns en överordnad p-faktor (gul cirkel) som orsakar de tre underordnade egenskaperna (de röda pilarna till de lila cirklarna), vilka i sin tur orsakar korrelationerna mellan indikatorerna (de gröna pilarna till de grå rutorna.)
Man kan jämföra de två modellerna med varandra med avseende på deras modellanpassning, eller hur väl modellerna kan förklara relationerna mellan variablerna i datamaterialet. Om den hierarkiska modellen visar sig ha en bättre modellanpassning än den korrelerade faktormodellen skulle detta ge ett empiriskt stöd för förekomsten av p-faktorn. Detta beror på att p-faktorn endast är inkluderad i den hierarkiska modellen.
Det empiriska stödet för p-faktorn skulle i sådana fall enbart avse dess förekomst som en statistisk konstruktion. För att kunna dra slutsatser om p-faktorns psykiatriska meningsfullhet krävs andra typer av evidens.
P-faktorn kan även modelleras på andra sätt. En mer populär modellspecifikation är bifaktormodellen som på många vis liknar den hierarkiska modellen men bygger på helt andra antaganden om relationerna mellan p-faktorn och de specifika faktorerna:
I bifaktormodellen antas p-faktorn vara en övergripande, latent faktor som har en direktpåverkan på de enskilda psykiatriska tillstånden. Detta kan jämföras med den hierarkiska modellen där p-faktorn istället antas påverka de enskilda psykiatriska tillstånden på ett indirekt sätt via de tre specifika latenta variablerna (emotionell påfrestning, rädslor och externaliserande anpassningsproblem.)
Vilken av dessa modeller som är den “korrekta” är inte helt enkelt att identifiera. Låt oss i det följande diskutera åtta kritiska argument som har riktats mot p-faktorlitteraturen:
#1 Olika modeller, samma anpassning
Jag har ovan försökt att illustrera hur forskare kan modellera samband mellan ett större antal variabler med statistiska modeller. I redogörelsen fick ni bekanta er med ett antal typiska modeller som har använts för att studera överlappen mellan psykiatriska tillstånd men sanningen är att det finns väldigt många varianter av dessa modeller som man skulle kunna specificera.
Inom statistiken är det ett vanligt problem hur man väljer vilken modell som bäst beskriver ett givet datamaterial. Det finns ofta hundratals, om inte tusentals, olika modeller som kan specificeras, och i regel bygger modellerna på olika antaganden om de underliggande mekanismerna som förklarar sambanden mellan variablerna av intresse.
Ett problem som kan uppstå när man väljer den mest lämpliga statistiska modellen är att det är möjligt att specificera flera modeller som är statistiskt ekvivalenta, det vill säga som ger likvärdiga resultat när de testas mot datamaterialet. Detta innebär att det inte alltid är möjligt att avgöra vilken modell som är den bästa enkom med statistiska metoder.
Eiko Fried, docent i klinisk psykologi vid universitetet i Leiden, är en av de främsta kritikerna av p-faktorlitteraturen och har länge argumenterat för att fältet fokuserar alltför mycket på att granska hur ett fåtal modeller passar datamaterial med statistiska anpassningsmått.
I sin artikel “Lack of Theory Building and Testing Impedes Progress in The Factor and Network Literature”, som publicerades i Psychological Inquiry (2020) argumenterade han för att fältet behövde utveckla och integrera mer teoretiska perspektiv i det metodologiska arbetet. Detta delvis med anledning av de begränsningar som uppstår till följd av statistisk ekvivalens (Fried, 2020, s. 275):
There are many reasons why we cannot escape theory: statistical equivalence is one of them.
#2 Bifaktormodeller är för flexibla
Ni som har följt den här serien har säkerligen uppmärksammat att de flesta av de redovisade studierna som har identifierat förekomsten av p-faktorn har baserats på någon variant av en bifaktormodell.
Är den verkligen så pass överlägsen andra modeller? Nja. Svaret är i vanlig ordning mer komplext än vad man skulle kunna tro. Låt oss närma oss komplexiteten med ett enklare exempel.
En klädesdesigner har fått i uppdrag av en kund att sy en klänning. Designern syr upp tre prototyper som kunden provar. Klänningarna sitter generellt sett bra på kunden, men det finns delar som behöver anpassas för att passa kundens kroppstyp bättre.
När designern och kunden diskuterar vilken av prototyperna som kunden i slutändan vill ha, visar det sig att kunden gör generella bedömningar av prototyperna. Kunden beaktar inte i detta läge de delar som behöver anpassas. Generellt sett vill kunden ha ett av de tre alternativen.
I jämförelser av statistiska modellers anpassningar till givna datamaterial är det vanligt att de tester som används endast bedömer modellernas övergripande anpassningsförmåga. Detta innebär att eventuellt dåliga anpassningar i enskilda delar av modellerna kan, precis som i exemplet med klänningarna, gå obemärkta förbi.
Marina Bornovalova, forskare i psykologi vid University of South Florida, och hennes kollegor illustrerade det här problemet med empiriska data i artikeln “Appropriate Use of Bifactor Analysis in Psychopathology Research: Appreciating Benefits and Limitations” som publicerades i Biological Psychiatry (2020).
Forskarlaget specificerade två bifaktormodeller på indikatorer för dels intelligens, dels sociala attityder. De övergripande (globala) testerna för modellanpassning visade att båda modellerna hade väldigt god anpassning till datamaterialen, trots att det är tveksamt att det skulle finnas en generell faktor för sociala attityder.
Låt oss titta närmare på den första modellen där intelligens undersöktes:

Faktorn för generell intelligens (“G”), inkluderades i modellen tillsammans med ytterligare tre faktorer (“F”) för specifika kognitiva förmågor (“A”, “B” och “C”). De nio mätbara indikatorerna i mitten av figuren laddade både på g-faktorn och något av de tre specifika faktorerna.
Vi ser att de tre förstnämnda indikatorerna laddade väldigt starkt på g-faktorn med faktorladdningar (korrelationer) som varierade mellan 0,75 till 0,79. Detta innebar att g-faktorn förklarade mellan 56 och 62 procent av variationen i de aktuella indikatorerna.2
Vi noterar något svagare faktorladdningar för de övriga indikatorerna, vilka varierade mellan 0,53 till 0,66. Detta innebar på motsvarande vis att g-faktorn förklarade mellan 28 och 44 procent av variationen i dessa sex indikatorer. Sammantaget kan man dra slutsatsen att g-faktorn förklarade en betydande andel av variationen i samtliga indikatorer som ingick i modellen.
Nedan återfinns en liknande bifaktormodell för indikatorer som istället mätte sociala attityder. Även denna visade sig, som bekant, ha en god övergripande anpassning till datamaterialet.

En granskning av faktorladdningarna visade emellertid att endast indikatorerna för kategorin "C" var starkt korrelerade med den generella faktorn (“G”), med faktorladdningar som varierade mellan 0,71 och 0,75. Detta innebar att den generella faktorn för sociala attityder förklarade mellan 50 och 56 procent av variationen i attitydindikatorerna i den kategorin. Faktorladdningarna för indikatorerna i de två övriga kategorierna ("A" och "B") var dock väldigt små och förklarade under 5 procent av variationen.
Resultaten från analysen indikerade således att den generella faktorn för sociala attityder inte var särskilt generell då den enbart förklarade en betydande andel av variationen i ett fåtal av modellens indikatorer. Om man enbart hade förlitat sig på globala modellanpassningstest skulle man i det aktuella fallet ha valt en felaktig modell.
Andra tekniska problem
Många av de statistiska tester som i dagsläget används för att jämföra modellanpassning mellan bifaktormodeller och alternativa modeller tenderar att överskatta bifaktormodellens modellanpassning.
Detta bekräftades för ett antal år sedan i samband med att Roman Kotov, docent i psykologi vid Stony Brook University, och hans medarbetare publicerade artikeln “Are Fit Indices Used to Test Psychopathology Structure Biased? A Simulation Study” i Journal of Abnormal Psychology (2019).
Datorsimuleringar är en kraftfull metod inom kvantitativ forskning för att bland annat studera hur statistiska tester fungerar under olika förutsättningar. I den aktuella studien av Kotov med flera undersöktes i vilken utsträckning statistiska tester för modellanpassning gav korrekta svar. För att kunna bedöma detta behövde forskarna ett “facit”, det vill säga en korrekt bedömning av vilken specifik modell som passade datamaterialet bäst.
Ett problem med att använda redan insamlade datamaterial för det här ändamålet är att de alltid innehåller systematiska och slumpmässiga fel. Dessa fel kan vara svåra att kontrollera för, vilket gör det svårt att bedöma huruvida ett givet test ger ett korrekt svar.
Ett alternativ är att med hjälp av datorn generera, eller simulera, ett större antal datamaterial som har de specifika egenskaper som man vill kontrollera för. Genom att variera egenskaperna hos datamaterialet kan man studera hur testerna presterar under olika förutsättningar. I den aktuella studien varierades bland annat antal deltagare (urvalsstorlek), typ av indikatorer (psykiatriska symtom eller psykiatriska diagnoser), korrelationer mellan indikatorerna och de latenta variablerna (faktorladdningarna). Forskarna inkluderade även ett antal felspecificerade modeller för att undersöka om testerna kunde identifiera dessa.
Den grundläggande modellen som användes för att simulera datamaterialen i den aktuella studien visas i figuren nedan.
Forskarna lät variera 180 statistiska egenskaper för varje modellvariant och simulerade 500 datamaterial per modellvariant. Sålunda studerade forskarna totalt 90 000 datamaterial. Skillnaderna mellan de fiktiva deltagarna i de simulerade datamaterialen bestämdes av slumpen, men dessa skillnader var begränsade av modellspecifikationerna.
Det framgår av figuren ovan att forskarnas grundmodell var en korrelerad faktormodell med tre faktorer (“F1”, “F2” och “F3”). Givet detta hade forskarna förväntat sig att de statistiska testerna skulle visa att den korrelerade faktormodellen förklarade datamaterialen bäst. Det var ju “facit”.
Tvärtemot detta visade det sig dock att testerna tenderade att förorda bifaktormodellen framför den korrelerade faktormodellen. Det vill säga, det går helt enkelt inte att lita på de övergripande statistiska testerna för modelljämförelser. Enligt författarnas förmenande kan man inte förlita sig på dessa statistiska tester utan måste genomföra fördjupade analyser av modellernas egenskaper samt tolkningsbarheten av dess olika komponenter.
Overall, results suggest that comparisons of bifactor models to alternatives using fit indices may be misleading and call into question the evidentiary meaning of previous studies that identified the bifactor model as superior based on fit. We highlight the importance of comparing models based on substantive interpretability and their utility for addressing study aims, the methodological significance of model equivalence, as well as the need for implementation of statistical metrics that evaluate model quality.
#3 Ospecifika kriterier för kriterievaliditet
I det föregående brevet i serien ägnade jag stor möda åt att beskriva hur förespråkare för p-faktorn har adresserat frågan om dess kriterievaliditet:
När forskare för ett tiotal år sedan publicerade de första studierna som identifierade p-faktorn fanns det en del som ifrågasatte måttets validitet, eller dess vetenskapliga giltighet. De undrade huruvida p-faktorn faktiskt mätte det utvecklarna av modellen avsåg att mäta, nämligen en generell sårbarhet för att utveckla psykiatriska tillstånd.
Ett sätt att adressera denna kritik är att se huruvida p-faktorn korrelerar med teoretiskt relevanta riskmarkörer och utfall, något som kallas för kriterievaliditet (eng. criterion validity). Om p-faktorn är en valid eller giltig mätare av generell sårbarhet för psykiatriska tillstånd, bör den korrelera med faktorer som potentiellt skulle kunna öka riskerna för att utveckla specifika psykiatriska tillstånd, såsom genetiska riskfaktorer, tidigt trauma och andra typer av stressfyllda livshändelser. Den bör också korrelera med utfall som är relevanta för sårbarheten, såsom förekomsten av senare psykiatriska tillstånd, inklusive deras svårighetsgrad, samt suicidala och antisociala beteenden.
Den efterkommande sammanställningen visade att förespråkarna med tiden har visat att p-faktorn är associerad med flera relevanta långtidsutfall, även efter justering för bedömareffekter, sociodemografiska faktorer, intelligensnivå och familjära förväxlingsfaktorer.
Kritikerna menar emellertid att förespråkarna har haft väldigt vaga kriterier när de har testat för kriterievaliditeten av p-faktorn.
I en ännu opublicerad artikel med titeln “A critical evaluation of the p-factor literature” som leddes av Ashley Watts, psykologiforskare vid Vanterbuilt University, och Eiko Fried, jämfördes bland annat publicerade korrelationer mellan p-faktorn och negativ emotionalitet. Det senare begreppet avser benägenheten att i hög grad uppleva och uttrycka negativa känslor, såsom sorg, ilska, ångest och skuld.
En rimlig förväntan vore att p-faktorn, om den mätte samma fenomen i olika studier, skulle ha en relativt likvärdig korrelation med negativ emotionalitet i studierna. Tvärtemot detta visade resultaten att de publicerade korrelationerna mellan p-faktorn och negativ emotionalitet i hög utsträckning varierade (r=0,13 till 0,88). Mer konkret innebär detta att p-faktorn förklarade mellan 2 och 77 procent av variationen i negativ emotionalitet:
#4 Inga stabila faktorladdningar
Sambanden mellan de psykiatriska tillstånden och p-faktorn, eller deras faktorladdningar, är viktiga för oss att förstå då de ger oss en indikation på vilka typer av tillstånd som p-faktorn främst mäter (se del 5 för detaljer).
I figuren nedan illustrerade Watts och hennes kollegor faktorladdningar från 15 olika studier. Faktorladdningarna är representerade som punkter, där varje färg representerar en enskild studie. Om en studie publicerade flera modeller presenteras samtliga faktorladdningar från studien i samma färg.
Om p-faktorn mäter samma fenomen mellan olika studier förväntar vi oss att faktorladdningarna för specifika psykiatriska tillstånd är relativt likvärdiga. Detta innebär exempelvis att en faktorladdning på 0,7 för ett visst tillstånd i en studie bör motsvara en faktorladdning på 0,7 för samma tillstånd i en annan studie.
Tvärtemot detta ser vi att faktorladdningar varierar kraftigt mellan de olika studierna. Detta gäller inte bara mellan olika studier, utan även inom studierna (mellan specifika modeller.) Till exempel kan en faktorladdning på 0,7 för ett visst tillstånd i en studie motsvara en faktorladdning på 0,1 i en annan studie.
Denna variation i faktorladdningar innebär att p-faktorn i olika och samma studier mäter helt olika saker. Detta är ett allvarligt problem eftersom det gör det vanskligt att jämföra resultat mellan studier och att dra slutsatser om den underliggande psykiatriska sjukligheten.
Den skeptiske läsaren kanske invänder här med att resultaten skulle kunna förklaras av att studierna undersöker olika typer av urval och mäter psykiatriska tillstånd med olika instrument.
För att adressera detta valde Watts och hennes kollegor att specifikt undersöka studier som hade använt sig av ASEBA-instrumenten (Achenbach System of Empirically Based Assessment), vilka är utvecklade för att undersöka anpassningsproblem och generell funktionsförmåga bland barn och ungdomar.
Med hjälp av detta angreppssätt kunde forskarna således begränsa analyserna till samma typ av mätinstrument och relativt likartade urval. Trots detta visade det sig att faktorladdningarna för instrumentets tre subskalor (ångest-depression, tillbakadragenhet-depression och tankeproblem) på p-faktorn kraftigt variera. Detta understryker återigen att p-faktorer från olika studier tenderar att mäta olika fenomen.
#5 Det finns många generella faktorer och de korrelerar
Inom psykometrin, eller vetenskapen om psykologiska mätningar av mänskliga beteenden och egenskaper, har man länge tillämpat faktoranalytiska modeller för att studera ett brett urval av mänskliga egenskaper och beteenden. I den här serien har vi hittills enbart fokuserat på faktorerna för generell intelligens (g) och psykopatologi (p).
De läsare som är bekanta med den psykologiska litteraturen känner säkerligen till femfaktormodellen för personlighetsdrag. Genom att ställa en mängd frågor till deltagare om deras personlighetsdrag kan man påfallande ofta identifiera fem dimensioner (faktorer) som mäter (1) emotionell stabilitet, (2) öppenhet för nya intryck, (3) vänlighet och omtänksamhet (eng. agreeableness), (4) samvetsgrannhet (bland annat prestationsvilja och självdisciplin) och (5) extraversion (bland annat utåtriktning, självsäkerhet och spänningssökande).
Det många inte känner till är att psykometriker även har undersökt korrelationerna mellan dessa fem faktorer och identifierat en generell faktor för personlighetsdrag. Denna faktor antas mäta graden av social effektivitet bland individer (van der Linden, 2017, s. 36f):
The main proposition in the substantive account of the [general factor of personality, GFP] is that the construct represents a tendency toward socially desirable behavior. Such behavior will positively influence how a person is evaluated by others, leading to the development of a “good reputation” and, consequently, to an increased probability of being selected as a mate, a coworker, and a leader […]. Accordingly, the GFP can be considered a social effectiveness factor […].
Om en persons personlighetsdrag blir så pass avvikande och oflexibla att de orsakar betydande lidande för personen själv och/eller dess omgivning har denne utvecklat ett personlighetssyndrom. Det visar sig att olika dimensioner av personlighetssyndrom också kan förklaras av en generell faktor. Det råder dock mer oenighet kring vad denna generella faktor faktiskt mäter men ett generellt fynd verkar vara att faktorn främst fångar symtom för borderline personlighetssyndrom, såsom svårigheter med att reglera känslor, impulser och sociala relationer.
Joshua Oltmanns, forskare i psykologi vid Southern Methodist University, genomförde tillsammans med sina kollegor en studie där de undersökte sambanden mellan p-faktorn och de generella faktorerna för personlighetsdrag och personlighetssyndrom. Resultaten redovisades i artikeln “General Factors of Psychopathology, Personality, and Personality Disorder: Across Domain Comparisons” som publicerades i Clinical Psychological Science förra året.
I den första delstudien, som genomfördes som en nätbaserad enkätundersökning med 474 deltagare, fann Oltmanns och hans kollegor att de generella faktorerna för personlighetsdrag (GFP) och personlighetssyndrom (GPD) var starkt korrelerade (r=-0,9). Detta innebär att de två faktorerna i hög grad är överlappande, vilket vi förväntar oss att se om personer med extrema värden på personlighetsdrag också har förhöjda värden på skalan för personlighetssyndrom. Det här resultatet replikerades i den andra delstudien som bestod av av enkätundersökning av cirka 1600 äldre deltagare.
Forskarna fann därefter att korrelationen mellan p-faktorn och den generella faktorn för personlighetssyndrom var liknande (r=0,92) och att motsvarande korrelation mellan p-faktorn och generella faktorn för personlighetsdrag enbart var något lägre (r=0,70).
Författarna argumenterar för att de senare resultaten är något egendomliga bland annat för att det inte finns mycket som talar för att p-faktorn främst skulle mäta symtom för borderline personlighetssyndrom:
The current results might also question some of the existing substantive interpretations of a respective general factor. For example, it did appear to be compelling to suggest that g-PD is largely equivalent to borderline personality organization (Kernberg, 1984) given the prominence of BPD diagnostic criteria within some g-PD studies (Sharp et al., 2014; Wright et al., 2016). However, it would be difficult to suggest that borderline personality organization also largely defines the general factor of psychopathology and general personality. It might seem comparably difficult to suggest that a disposition toward psychopathology (Caspi et al., 2014) provides an apt description of the general factor of personality, or conversely that social ineffectiveness (Rushton & Irwing, 2011; van der Linden et al., 2017) provides an apt description of the general factor of psychopathology. Yet, the results of the current study suggest that the p factor, GFP, and g-PD may share much in common.
Det är viktigt att komma ihåg att borderline personlighetssyndrom har sitt ursprung i ett brett spektrum av psykiatriska symtom som länge var svåra att kategorisera på grund av överlappningar mellan olika diagnoser. Dessutom har kliniker medgivit att det tidigare har förekommit en olycklig tendens att slentrianmässigt ge diagnosen borderline personlighetssyndrom till svårbehandlade patienter med komplexa problem.3 Samtidigt förekommer det även en hel del underdiagnosticering av tillståndet; en amerikansk studie visade exempelvis att 40 procent av patienter som hade blivit diagnosticerade med borderline personlighetssyndrom tidigare hade fått en felaktig diagnos av bipolär sjukdom, vilket kunde jämföras med 10 procent bland deltagarna utan borderline personlighetssyndrom (Ruggero et al., 2010). Med tanke på detta är det inte helt orimligt att den generella faktorn för personlighetssyndrom kan överlappa med p-faktorn.
#6 När p-faktorn blev d-faktorn
Valerie Brandt, docent och lektor i psykologi vid University of Southhampton, och hennes kollegor publicerade förra året den uppmärksammade artikeln “First evidence of a general disease (“d”) factor, a common factor underlying physical and mental illness” i World Psychiatry.
Författarna argumenterade för att en generell faktor förklarade överlappen mellan psykiatriska och somatiska sjukdomar som mättes i ett urval av strax under 8600 vuxna brittiska deltagare. Denna faktor benämndes d-faktorn efter engelskans begrepp för sjukdomar (diseases) och identifierades i en bifaktormodell:
Therefore, we found that the data were best explained by a bifactor model with a mental conditions factor, a physical conditions factor, and an additional underlying disease dimension, reflecting a general vulnerability to develop any of the included conditions. Therefore, our results support the assumption of the existence of a general “d” factor in adults.
De metodologiska problem som uppstår när man ska bekräfta förekomsten av generella faktorer med hjälp av bifaktormodeller har jag ovan redan avhandlat. Den här studien utgör inget undantag från den regeln.
Jag måste medge att när jag inledningsvis fick syn på den här studien trodde jag att det var något av ett satiriskt inlägg i debatten om p-faktorn. Det stämmer förvisso att personer med psykiatriska tillstånd i högre utsträckning än den övriga delen av befolkningen utvecklar somatiska sjukdomar (Momen, 2020) men det innebär inte att psykiatriska och somatiska sjukdomar per automatik kan klassificeras som ett gemensamt fenomen.
Det är som att säga att utbildningsprestationer och hjärt- och kärlsjukdomar mäter samma underliggande fenomen enkom för att det föreligger en korrelation dem emellan.
Det är möjligt att mäta en mängd utbildningsrelaterade indikatorer, såsom betyg från grund- och gymnasieskolan och den högsta uppnådda utbildningsnivån. Det är också möjligt att mäta motsvarande indikatorer för hjärt-kärlsjukdomar, såsom diagnos för kranskärlssjukdom, hjärtsvikt, stroke och/eller högt blodtryck. Dessa faktorer är korrelerade med varandra, vilket innebär att de tenderar att förekomma tillsammans (personer med låg utbildningsnivå har förhöjda risker att utveckla hjärt- och kärlsjukdomar). En bifaktor-modell skulle därtill kunna användas för att identifiera en generell faktor som förklarar överlappen mellan samtliga indikatorer. Det hade emellertid inte betytt att utbildning och hjärt- och kärlsjukdomar utgör samma fenomen.
#7 Vad tillför de komplexa modellerna?
I artikeln “The p factor is the sum of its parts, for now” som publicerades i World Psychiatry (2021) ställde Eiko Fried och hans medförfattare frågan om det blir någon skillnad om man istället för komplexa faktoranalytiska modeller beräknar p-faktorn genom att summera antalet tillstånd som individer möter kriterier för.
För att besvara frågeställningen använde författarna ett större amerikanskt datamaterial som tidigare hade använts för att beräkna p-faktorn (Lahey et al., 2012). Bifaktormodellen från originalstudien är illustrerad nedan:
Fried och hans kollegor undrade om det verkligen behövdes en så pass komplex modell som baseras på så pass många starka antaganden om man bara intresserar sig för att mäta graden av deltagarnas psykiatriska sjuklighet. Då de hade tillgång till samma datamaterial valde de att summera de psykiatriska tillstånden till en skala som varierade mellan 0 (inga psykiatriska tillstånd) och 11 (samtliga psykiatriska tillstånd).
De undersökte därefter korrelationen, eller samstämmigheten, mellan den här enklare summerade skalan med den mer komplexa p-faktorskalan. Det visade sig att skalorna var nästan perfekt korrelerade med varandra. För deltagarna blev det ingen större skillnad i hur de blev rankade med den enklare eller mer komplexa p-faktorskalan. Varför används då den komplexa modellen?
Fried har i andra sammanhang argumenterat för att mer komplexa statistiska modeller kan skapa något av en illusion om att det finns bakomliggande orsaksmekanismer (Fried, 2020, s. 275):
The statistical p factor is indeed well replicated, but what this factor reflects cannot be determined by observing a covariance matrix. As shown by Kovacs & Conway (2019), such statements provide “an illusion of explanation: Positing a general factor gives the false impression that there is a psychological explanation, whereas the actual explanation is purely statistical”. The above mentioned paper concludes that the “replication of a general factor underscores the importance and utility of transdiagnostic treatment” (Carragher et al., 2016). But the statistical model does not provide conclusive information about the data generating (i.e., causal) mechanism, and inferences about treatment based on such data therefore remain speculative.
Den större poängen är att p-faktorn primärt är ett beskrivande mått i så måtto att den beskriver ansamlingen av psykiatriska symtom eller tillstånd vid en viss tidpunkt. Huruvida den kan tillskrivas andra betydelser kräver mer teoretiska analyser eller teoretiskt informerade statistiska analyser. Fried och medförfattare (2021, s. 70):
The p factor literature has been largely atheoretical and primarily concerned with description of data – a crucial first step to establish phenomena that can then be explained. But let us not lose sight of the fact that p is an effect that needs to be explained (i.e., explanandum), not something that does the explaining (i.e., explanans).
#8 Svaga förklaringsmodeller
Forskare har presenterat en mängd olika potentiella tolkningar av p-faktorn men sammantaget har inget visat sig vara tillräckligt starkt.
En av de mer vanliga tolkningarna är att p-faktorn representerar en generell sårbarhet för att utveckla psykiatriska tillstånd. Kritiker som Fried och hans kollegor är dock inte övertygade om detta och menar att en skala som mäter sårbarheten för att utveckla psykiatriska tillstånd bör inkludera indikatorer för dess riskmarkörer snarare än själva tillstånden (Fried et al., 2021, s. 70):
Whether competing accounts of p offer better explanations, such as the idea that it represents liability, requires that models be estimated on variables that actually denote liability, rather than variables denoting severity and comorbidity.
Ett sätt att kringgå detta har varit att tillämpa tvilling- och familjebaserade modeller som har visat ärftliga faktorer i hög grad förklarar variationen i p-faktormätningar. Det bör dock i sammanhanget nämnas att molekylärgenetiska studier inte har funnit stöd för p-faktorn, potentiellt med anledning av deras mer restriktiva inklusionskriterier (se del 6 för detaljer.) Den frågan som aktualiseras här är huruvida det är meningsfullt att uppskatta de relativa bidragen från arv och miljö till ett så pass otydligt utfall.
På basis av empiriska fynd har andra forskare föreslagit att p-faktorn antingen kännetecknas av lägre kognitiva förmågor, tankestörningar, negativ emotionalitet, svårigheter med reglering av känslor och aktivitetsnivå eller olika kombinationer av dessa faktorer.4 Förslagen är dock inte helt övertygande, eftersom de inte kan förklara överlappen mellan samtliga former av psykiatriska tillstånd. Dessutom är de empiriska fynden långt ifrån entydiga, vilket bland annat framgår av avsnittet om faktorladdningar ovan.
Bör p-faktorn förkastas?
I det här brevet har jag försökt att sammanfatta den kritik som har riktats emot p-faktorlitteraturen. Inledningsvis diskuterade jag problemet med statistiska tester för modelljämförelser där statistisk ekvivalens och bias till förmån för bifaktormodeller gör att forskare i högre utsträckning tenderar att identifiera p-faktorn, även om den inte utgör en realistisk representation av verkligheten.
Sedermera gick vi vidare till den empiriska litteraturen som har visat korrelationer mellan p-faktorn och negativ emotionalitet samt faktorladdningar för enskilda psykiatriska tillstånd varierar stort mellan studier, men även inom studier (mellan olika modeller.) Detta tyder på att p-faktorn inte är en stabil eller konsekvent företeelse.
Detta efterföljdes av en genomgång av överlappen mellan ett flertal generella faktorer och utvidgningen av p-faktorn till att även inkludera somatiska sjukdomar (“d-faktorn”). Därefter lärde vi oss att det inte blir några större skillnader om man ignorerar de komplexa faktoranalytiska modellerna och istället bara summerar antalet psykiatriska diagnoser för att beräkna en enklare p-faktorskala. Avslutningsvis diskuterades de svaga teoretiska förklaringsmodellerna för p-faktorn.
Det vore orimligt att helt förkasta p-faktorn då den utgör ett relevant beskrivande verktyg för att sammanfatta överlappen mellan psykiatriska tillstånd i ett givet datamaterial. Man bör dock tolka måttet i ljuset av de begränsningar som har lyfts fram i det här brevet. Det innebär exempelvis att det inte förefaller vara särskilt meningsfullt att jämföra p-faktorskattningar mellan olika studier då dessa med all sannolikhet mäter helt olika fenomen.
Jag är därtill alltmer tveksamt inställd till analyser där forskare använder p-faktorn för att justera för “generell psykopatologi” för att på så vis isolera effekterna av det specifika psykiatriska tillståndet på utfallet. Ponera exempelvis att ett forskarlag är intresserade av att undersöka sambandet mellan depression och våldsbrottslighet. Genom att justera för p-faktorn i sina analyser kan de undersöka hur depression, efter att bidragen av p-faktorn har beaktats, är associerad med utfallet.
Rent statistiskt föreligger det inga problem med det här angreppssättet men frågan är vad “nettoeffekten” av depression efter att hänsyn har tagits till p-faktorn faktiskt innebär på ett konceptuellt och kliniskt plan. Det behövs betydligt mer forskning för att förstå den komplexiteten.
Vi behöver även mer forskning för att förstå hur p-faktorn utvecklas genom människans livsförlopp. De flesta studier som har genomförts på p-faktorn har antingen mätt det vid ett enskilt mättillfälle eller tagit ett genomsnittsvärde över flera mätttillfällen. Det innebär att p-faktorn i dagsläget främst beskriver skillnader mellan individer men inte inom individer (över tid). Den senare typen av individuella skillnader, liksom dess orsaker och konsekvenser bör vidare kunna informera vår förståelse om hur psykiatriska sjuklighet ansamlas genom livsförloppet.
Det här är ett väldigt aktivt forskningsfält och jag kommer säkerligen att ha anledning att återkomma till p-faktorn i kommande brev men för den här gången sätter jag punkt.
Omslagsbilden är AI-genererad.
Begreppet distress är ett mångfacetterat begrepp som inte har en direkt motsvarighet i svenskan. Psykiskt lidande är en annan möjlig översättning.
Genom att kvadrera faktorladdningarna kan man beräkna andel förklarad variation. I det här fallet varierade den från 56 procent (0,75^2=0,56) till 62 procent (0,79^2=0,62).
Se exempelvis Vaillant (1992). Detta har även har bekräftats i svensk kontext.