Česká a slovenská psychiatrie

Česká a slovenská psychiatrie

Časopis
Psychiatrické společnosti ČLS JEP
a Psychiatrickej spoločnosti SLS

původní práce / original article

FLYNNŮV EFEKT V ČESKÉ VERZI WECHSLEROVY INTELIGENČNÍ ŠKÁLY PRO DOSPĚLÉ, TŘETÍ REVIZE

THE FLYNN EFFECT IN WECHSLER ADULT INTELLIGENCE SCALE, THIRD REVISION, CZECH VERSION

Filip Havlík1,2, Ondřej Bezdíček1,2

1 Laboratoř neuropsychologie J. Diamanta, Neurologická klinika a Centrum klinických neurověd 1. LF UK a VFN v Praze
2 Pražská vysoká škola psychosociálních studií

SOUHRN

Havlík F, Bezdíček O. Flynnův efekt v české verzi Wechslerovy inteligenční škály pro dospělé, třetí revize

Cíl: Nárůst o cca 0,3 bodu IQ za rok v testech inteligence, ale i některých kognitivních testech, byl pojmenován podle autora jako Flynnův efekt. Cílem této práce je zjistit, zda je efekt přítomný i v nejpoužívanějším inteligenčním testu v ČR.

Materiál a metoda: Pomocí české verze Wechslerovy inteligenční škály pro dospělé, třetí revize (WAIS-III) byl otestován soubor osob (n = 45) ve věku od 20 do 29 let a porovnán se stejně starou skupinou z normativní studie z roku 2010 (n = 222).

Výsledky: Analýzou těchto dat nebyl v žádné z hlavních škál (CIQ, VIQ a PIQ) nalezen statisticky významný rozdíl, nicméně byl pozorován statisticky významný rozdíl ve třech ze čtrnácti subtestů WAIS-III (Doplňování obrázků, Podobnosti, Matrice).

Závěr: Vliv Flynnova efektu na normativní data WAIS-III je v současné době nejspíše nízký.

Klíčová slova: Flynnův efekt, inteligenční testy, WAIS-III, Wechslerova inteligenční škála pro dospělé, třetí revize

SUMMARY

Havlík F, Bezdíček O. The Flynn effect in Wechsler Adult Intelligence Scale, third revision, Czech version

Objective: An increase of about 0.3 IQ points per year in intelligence tests and also in some cognitive tests was denoted as the Flynn effect. This study aims to test the presence of the Flynn effect with the most used Czech intelligence test.

Method: We tested subjects aged from 20 to 29 by the Wechsler Intelligence Scale for Intelligence, Third Revision Czech version (WAIS-III). We compared the Czech normative sample from 2010 (n = 222) and a sample obtained between years 2015 and 2017 (n = 45).

Results: Based on data analysis, none of the scales (VIQ, PIQ and CIQ) showed statistically significant differences, however, three of the subtests did (Picture Completion, Similarities, Matrix Reasoning).

Conclusion: As a conclusion, an influence of the Flynn effect cannot be traced in the present normative data of WAIS-III.

Key words: Flynn effect, intelligence tests, Wechsler Adult Intelligence Scale, third revision, WAIS-III


ÚVOD

Nárůst IQ skórů v testech inteligence z generace na generaci o cca 0,33 bodu za rok poprvé popsal James Flynn a podle něho se dnes nazývá jako Flynnův efekt (FE). Toto pojmenování poprvé použili Herrnstein a Murray ve své slavné knize o rozdílech v inteligenci mezi rasovými a sociálními skupinami a jejich příčinách.1 Tento nárůst v průměrné úrovni inteligence nepochybně přispívá ke zkreslení normativních srovnání výsledků v inteligenčních testech, proto je nutné při vyhodnocení testů se starými normami (tj. nad dvacet let od doby vzniku) tento efekt zohlednit v interpretaci (za dvě dekády se jedná o cca 6 bodů IQ), a proto se také často po přibližně dvaceti letech přistupuje k  restandardizaci testu a tvorbě nové normativní studie.

FLYNNŮV EFEKT

Flynn v roce 1984 publikoval článek poskytující výsledky jeho první práce na toto téma, kde porovnával IQ skóry získané v testu inteligence normovaném dříve s dosaženým IQ skórem v testu normovaném později v osmi různých kombinacích testů (různých verzí Wechslerových škál a škály Stanford-Binet): WB-I, WISC, WAIS, WPPSI, WISC-R, WAIS-R, SB-L, SB-M a SB-LM. Pro tuto analýzu použil téměř 7 500 subjektů. Výsledkem analýzy byl průměrný rozdíl v těchto osmi kombinacích testů IQ skór od 0,25 do 0,44 bodu/rok s mediánem 0,33.2

Toto zjištění podnítilo řadu dalších studií, které byly provedeny v  nejrůznějších zemích, a to nejen v USA,3 ale i například v Polsku, 4 Nizozemsku5 nebo Keni.6 Zkoumal se také vztah FE a osob s hendikepem, jako je porucha učení,7 levostranná a  pravostranná hipokampální skleróza8 nebo hluchota.9 Objevilo se s pozitivními výsledky také několik velice rozsáhlých metaanalytických studií.10,11 Dále byl tento efekt pozorován i v testech kognitivních schopností. Rönnlund a Nilsson12 pozorovali nárůst skórů v testech zaměřených na deklarativní paměť a zrakově-prostorové funkce. Dickinson a Hiscock13 v Testu cesty a Nehra, Sreenivas, Kaur, Chopra a Bajpai14 v paměťové škále postgraduálního institutu (Post Graduate Institute - Memory Scale).

V posledních letech se však ukázal i reverzní Flynnův efekt (RFE), z čehož lze usuzovat na nelinearitu efektu. O RFE referují například Dutton a Lynn.15 Pro podrobnější přehled RFE srov. Dutton, Linden a Lynn.16

Pozornost byla také věnována příčině FE. Bylo navrženo mnoho možných vysvětlení, mezi která lze řadit genetické faktory, kvalitnější nutrici, vyšší úroveň a dostupnost lékařské péče, psychometrickou chybu, opakovanou expozici psychologickým testům a různé strategie vyplňování, změny ve vzdělávání, i  environmentální změny (urbanizace).

Genetickými faktory argumentuje například Mingroni17 poukazující mimo jiné na to, že ve studiích monozygotních dvojčat se neukazuje vliv environmentálních faktorů na změnu v dosažených IQ skórech, tudíž se jako přijatelné vysvětlení jeví právě genetické faktory. Tomu oponuje Woodley18 tvrdící, že mezi korelací testů či subtestů sytících g-faktor se sekulárním ziskem (tj. nárůstem skórů pro FE) se neukazuje žádný signifikantní vztah, respektive že g-faktor pozitivně korelující s dědičností nevykazuje korelace s  FE.

S jinou myšlenkou přichází Lynn19 a nabízí jako vysvětlení FE lepší nutrici. Objevující se nárůst i u dětí školou nepovinných, větší porodní váha a  celosvětové zlepšení stravovacích podmínek v první polovině 20. století dle tohoto autora tuto hypotézu podporuje. Naopak v rozporu s těmito argumenty je zjištění, že největší zisky v IQ skóru dosahují právě dospělí.11

Vztah mezi FE a lepší, dostupnější lékařskou péčí nachází zase Steen.20 Ten vybírá třicet nemocí nově nebo novým způsobem léčených v posledních desetiletích a k nim udává v IQ skórech jejich dopad na inteligenční výkon v  testech. Podle tohoto autora celkový dopad léčby uvedených nemocí přibližně odpovídá nárůstu IQ v FE.

Na příčinu FE se lze dívat i pod společným jmenovatelem psychometrické nebo statistické chyby. Takovýto pohled podporují metodologické chyby při srovnávání různých verzí testů,21 inkonzistence měření některých testů v různých kohortách,5 nebo změny v normálním rozložení při zachování střední hodnoty.22

Dalšími kandidáty na příčinu jsou zvýšené hádání23,24 a naučení se efektivním strategiím pro řešení psychologických testů díky časté expozici testovým materiálům.25

Někteří autoři zase vycházejí z úzké vazby mezi vzděláním a inteligencí a  domnívají se, že školní reformy a dostupnost vzdělání mohou způsobit zisk okolo 0,33 bodu IQ/rok.2,3,26

Poslední kategorií, aspirující na vysvětlení mezigeneračních rozdílů, je kategorie environmentálních změn. Hypotézy v této kategorii se opírají o  předpoklad, že se prostředí, ve kterém žijeme, stává čím dál komplexnějším a  náročnějším na kognitivní schopnosti. Tuto komplexitu a náročnost zvyšují například moderní technologie a intenzivní urbanizace v 20. století.27

Ačkoliv nepanuje jednotná shoda o příčinách FE, podrobné hodnocení potenciálních a nejpravděpodobnějších příčin na základě svých zjištění poskytují v metaanalytické studii Pietschnig a Voracek.11 Tito autoři se přiklánějí k environmentální hypotéze, konkrétně k hypotéze rychlosti života zahrnující vzdělání, nutrici a redukci patogenů. Jako důvody pro přiklonění se k této variantě uvádějí dobrou shodu modelu s jejich výsledky i poznatky z jiných studií, kdy zjistili vyšší zisk ve fluidní inteligenci oproti krystalické a také nelineární vývoj FE.

Zda FE zkresluje výsledky vyšetření i v ČR v některých široce užívaných inteligenčních testech, bylo doposud ověřeno pouze u dětí.28 Pozitivní výsledky Lacigy a Cíglera28 byly získány pomocí Testu intelektového potenciálu a Testu číselných řad na dětech ve věku od 12 do 15 let. V této práci jsme se rozhodli přispět k analýze FE v ČR na základě nejpoužívanějšího inteligenčního testu v klinickém prostředí, tj. české verze Wechslerovy inteligenční škály pro dospělé, třetí revize (WAIS-III).29,30

K výběru WAIS-III pro sběr dat přispělo několik faktorů. Mezi ty nejdůležitější je nutno zařadit jeho použití již v původní práci Jamese Flynna, 2 i když se jednalo o jinou verzi, a jeho významnou frekvenci použití v české diferenciální diagnostice.29,30

METODA

Soubor

Za kritéria pro zařazení do výzkumu byl zvolen věk od 20 do 29 let tak, aby odpovídal věkové skupině v normativní studii WAIS-III pro ČR (n = 222; tzv. normativní soubor). Vylučující kritéria: v minulosti prodělané neurologické onemocnění s dopady na kognici (kraniotrauma, cévní mozková příhoda, neurodegenerativní onemocnění, komoce mozková s bezvědomím), aktuálně probíhající nebo chronické psychické onemocnění s dopady na kognici (aktuální deprese, psychotická onemocnění), abúzus návykových látek (chronický alkoholismus, užívání psychotropních látek) a užívání psychofarmak (antidepresiva, anxiolytika - benzodiazepiny), antipsychotika, popřípadě jiná psychotropika s vlivem na kognitivní funkce. Tato kritéria splnilo 45 osob (tzv. porovnávací soubor), které byly do výzkumu následně zařazeny. Pohlaví subjektů bylo relativně vyvážené (42 % mužů; 58 % žen). Vzdělání se pohybovalo od 13 do 21 let. Přehled složení vzorku je v tab. 1.

Česká a slovenská psychiatrie

Sběr dat

Sběr dat porovnávacího souboru probíhal od roku 2015 do roku 2017, zatímco normativní studie WAIS-III byla uveřejněna v r. 2010 (sběr dat cca 2005-2008). Probandi v obou skupinách byli vybíráni nenáhodným způsobem. Primárně byli osloveni studenti Pražské vysoké školy psychosociálních studií (PVŠPS) a lidé z autorova okolí. Všichni probandi nejdříve prošli anamnestickým rozhovorem, následně vyplnili dotazník týkající se dalších anamnestických údajů a poté administrací WAIS-III provedené zacvičeným psychometrickým laborantem (první autor) pod dohledem atestovaného klinického psychologa (druhý autor). Test byl vždy administrován celý, se všemi doplňkovými subtesty (Hledání symbolů, Řazení čísel a písmen, Skládání objektů, Symboly - opis).30

Statistická analýza

Od majitele normativních dat k české verzi WAIS-III, společnosti Hogrefe-Testcentrum, jsme s jejich laskavým svolením obdrželi deskriptivní statistiku hrubých skórů jednotlivých subtestů a vážených skórů hlavních škál (CIQ, PIQ a VIQ, tj. museli jsme se obejít bez hrubých dat od jednotlivých jedinců v normativním souboru; n = 222), zatímco v porovnávacím souboru jsme měli k dispozici všechna hrubá data (n = 45). Dále počet subjektů a jejich pohlaví jsou uvedené v procentech. Údaje o vzdělání k analýzám poskytnuty nebyly. Průměry se směrodatnými odchylkami subtestů, odpovídající příslušným indexům (VP, PU, PP, RZ), byly převedeny na sdružené průměry a sdružené směrodatné odchylky pro každý jednotlivý index a následně v této podobě porovnávány.

Pro ověření normality rozložení byl použit Shapirův-Wilkův test, který ukázal na hladině významnosti a > 0,05 normální rozdělení ve všech subtestech kromě tří (Doplňování obrázků p < 0,001; Razení obrázků p = 0,020; Porozumění p = 0, 001). Rozdělení dat v normativním souboru bylo neznámé, nicméně na základě centrální limitní věty byl použit Studentův dvojvýběrový nepárový t-test pro různé rozptyly na hladině významnosti a < 0,05. Výpočty byly provedeny ve statistickém programu IBM SPSS 22.

VÝSLEDKY

Deset ze čtrnácti sledovaných parametrů (subtestů WAIS-III) mělo chabě vyšší průměrnou hodnotu v porovnání normativních dat z roku 2010 s daty z roku 2015/2017, ve třech (Doplňování obrázků, Podobnosti a Matrice) dokonce statisticky významnou, avšak se střední velikostí účinku (tab. 2). Žádný z  těchto rozdílů se neukázal jako statisticky významný v celkových skórech CIQ, VIQ, PIQ. Rozdíl v CIQ byl -1,71 bodu IQ f(136) = -0,766, p = 0,445; v PIQ 0, 01 bodu IQ t(142) = -1,618, p = 0,972; a ve VIQ -2,45 bodu IQ t(97) = 0,035, p = 0,108. Přehled výsledků podává tab. 2.

Česká a slovenská psychiatrie

DISKUSE

Oproti jiným zahraničním studiím10,11,31,32 a také české studii na dětech28 jsme nenalezli statisticky významný rozdíl mezi normativními výsledky z WAIS-III a souborem z let 2015-17 v celkových skórech WAIS-III (CIQ, VIQ, PIQ). Výsledky nenaznačují přítomnost významného FE v  českých normativních datech WAIS-III. Nicméně je nutno zohlednit dílčí rozdíly v subtestech Doplňování obrázků, Podobnosti a Matrice, kde jsme nalezli statisticky významný rozdíl u všech tří subtestů se střední velikostí účinku, která byla nejvyšší v případě Matric (n2 je indikátor obdobný R 2 z vícenásobné regresní analýzy).

Mezi faktory vedoucí k tomuto výsledku počítáme zejména krátký čas mezi vydáním norem a rokem sběru druhého setu dat. FE nemusí být konstantní a může se projevovat pouze v určitých časových obdobích, tudíž rozdíl pěti až deseti let (normativní data k WAIS-III byla sebrána cca mezi lety 2005 a 2008) nemusí být pro jeho zaznamenání dostačující. Další, méně pravděpodobnou možností je změna v příčinách FE. I když dosahují lékařská péče, technologie a výživa stále vyšší úrovně, mezi kritickými roky nedošlo k žádnému významnému skoku.

Pro porozumění FE považujeme v českém prostředí za podstatnější, než jsou výsledky, analýzu limitů této studie, respektive možností zkoumání FE v české diagnostice. Mezi ně patří zejména malý vzorek čítající 45 osob v porovnávacím souboru a nemožnost porovnat dosažené vzdělání v obou souborech, jelikož tento údaj u normativního souboru nebyl dostupný. I když podobnost souborů, co do vzdělání, nemohla být statisticky ověřena a vzdělání porovnávacího souboru z  let 2015-17 neodpovídá průměru české populace, který bychom očekávali na základě statistik Českého statistického úřadu,33 lze se domnívat, že tento soubor alespoň částečně odpovídá vzorku z normativní studie. Český manuál pro WAIS-III uvádí,30 že v celkovém souboru čítajícím 600 osob je 22 % osob se základní, 65,17 % se střední a 12,83 % s vysokou školou, což by se mohlo blížit průměru 14,6 roku v souboru porovnávacím. Rovněž je v manuálu uvedeno zvýšené zastoupení vysokoškoláků v kategorii 20-24 let, což je významná část věkové skupiny, na kterou se zaměřil tento výzkum. Mezi další limity studie patří také nenáhodnost výběru probandů a nemožnost provést důkladné statistické analýzy na úrovni hrubých skórů jednotlivých osob, jelikož hrubá normativní data nebyla k dispozici. Dále pokud bychom sestavili intervaly spolehlivosti pro velikost účinku, bylo by zřejmé, že při daných velikostech vzorku, očekávané velikosti účinku 0,3 IQ/rok a rozestupu 7 let by interval spolehlivosti pro pozorované průměry byl cca CI 95 % = [-2,7; 6,9] bodu IQ, tj. při daných statistických souborech nejsme schopni statisticky spolehlivě prokázat FE. Za třetí, nepřítomnost hrubých dat v normativním souboru snižuje věrohodnost provedených statistik. Za čtvrté, v návaznosti na výsledky studie Lacigy a Cíglera28 bychom podotkli, že tito autoři však měli cca 6krát větší časový rozestup mezi vzorky (reportují 44 let). Dle separátních statistických analýz by při odstupu cca 5-10 let, jako je tomu v naší studii, byly jejich výsledky rovněž pravděpodobně nesignifikantní. Pokud proto vezmeme v úvahu délku časového odstupu, výsledky předložené studie nejsou v rozporu s  dřívějšími výsledky Lacigy a Cíglera!28 Na tuto námitku bychom však odpověděli, že jako klinici doufáme, že normativní data WAIS-III se nebudou používat dalších 44 let bez restandardizace na novém normativním souboru (s WAIS-IV či WAIS-V) obdobně jako v zahraničí. Psychologická korporace u většiny restandardizací dodržuje rozestup cca 15-20 let právě pro FE a zastarávání norem a změny v demografii dané populace.

ZÁVĚR

I přes výše uvedené limity této studie se domníváme, že naše výsledky mohou poskytnout podnět pro další a rozsáhlejší zkoumání FE v českém prostředí u  WAIS-III, a zejména naznačit komplexnost zkoumání FE ve WAIS-III v dostupném českém datovém souboru. Považujeme tyto nálezy za podstatné pro diagnostickou praxi. Dále jsou naše výsledky povzbudivé ve smyslu prozatímního neprokazatelného zastarávání českých normativních dat ve WAIS-III pro FE, byť statisticky zpochybnitelného. Nutno však vzít v úvahu významné, ve výběrovém souboru patrné inkrementy ve výkonu WAIS-III ve třech ze čtrnácti subtestů. Nicméně zahrnovat FE do interpretace normativních dat WAIS-III (obzvláště u  celkových skórů) se nám v klinické praxi jeví z diferenciálnědignostického pohledu v současné době jako empiricky neodůvodněné.

Poděkování

Autoři děkují studentům PVŠPS a jejich rodinným příslušníkům za pomoc při sběru dat. Dále bychom chtěli společnosti Hogrefe-Testcentrum, jmenovitě dr. Václavu Havlůjovi, poděkovat za laskavé svolení k analýze části normativních dat WAIS-III a dr. Pavlu Královi, Ph.D., za laskavou pomoc v selekci souboru pro přiřazení. Rádi bychom rovněž poděkovali nezávislým recenzentům za přínos ke zkvalitnění studie.

LITERATURA


Celá stať v dokumentu PDF
Čes a slov Psychiatr 2018;114(5): 193 -198

Zpět