Псіхалогія
Дэвід Майерс
Выдавец: Беларускі Фонд Сораса
Памер: 560с.
Мінск 1997
Даследчыкі ажыццявілі стандартызацыю тэста SAT у 1941 г., у тэсціраванні брала ўдзел група ў складзе 10 654 сту
Узровень інтэлекту любога чалавека можна прадставіць як пэўнае адхіленне ад сярэдняй. У дадатку апісваюцца статыстычныя вымярэнні гэтага адхілення (яго называюць “стандартным адхіленнем”).
дэнтаў [Carroll, 1982]. Яны адвольна вызначылі прыблізны сярэдні паказчык для кожнай часткі (вербальнай і матэматычнай) у 500 балаў (у той час як для большасці тэстаў ён склаў 100 балаў). Дыяпазон сярэдніх велічынь знаходзіўся ў межах ад 400 да 600 балаў і ўключаў 68% вынікаў (мал. 11.4). У стандартызацыі тэста прымалі ўдзел добра падрыхтаваныя маладыя людзі, па сутнасці яны прадстаўлялі эліту, асабліва калі ўзяць пад увагу час — 1941 год. Гэтая ўзорная група значна адрознівалася ад кантрольных груп, што набіраліся з масы насельніцтва для стандартызацыі тэстаў Векслера і Стэнфард—Бінэ. Чалавек, які набірае 500 балаў у кожнай частцы тэста SAT, напэўна, перавысіць значэнне 100 у тэсце на інтэлект.
Параўнаўшы сучасныя варыянты тэста з яго першай версіяй 50гадовай даўнасці, калі адбылася яго стандартызацыя, вы заўважыце, што тая першая група з 10 654 студэнтаў адказвала на зусім іншыя пытанні, чым мы зараз. Аднак сучасныя тэставыя заданні статыстычна прыроўнены да заданняў усіх папярэдніх варыян
292 Частка 4 Пазнанне і мысленне
85 100 115 130 145
Каэфіцыент разумовых здольнасцей Вехслера
Мал. 11.3. Нармальная крывая. Выніковыя паказчыкі тэстаў утвараюць на схеме нармальную крывую, якая па форме нагадвае звон. Напрыклад, сярэдні паказчык для тэста Векслера — 100 балаў. 68% звестак трапляюць у межы 15 балаў вышэй і ніжэй за 100. Каля 95% — укладваюцца ў межы 30 балаў з аднаго або другога боку.
таў гэтага тэста. Вось і атрымліваецца, што сучасны тэст вымяраецца з дапамогай шкалы 1941 года.
Дзякуючы магчымасці параўнання, тэст SAT стаў свайго роду барометрам узроўыіо адукаванасці. У перыяд з 1963 па 1980 гады паказчыкі пачалі няўхільна падаць (мал. 11.5). У 1981 годзе толькі 30% лепшых вынікаў перавысілі сярэдняе значэнне 1963 года. Чым гэта можна растлумачыць? Ці не зніжэннем, як думаюць многія, узроўню адукацыі ў Амерыцы?
Звернемся да гісторыі. У 60х гадах лік паступаючых у каледжы, што выконвалі тэст, значна ўзрос, і сярод іх аказаліся людзі з даволі нізкім узроўнем адукацыі [Astin & Garber, 1982], 3 павелічэннем колькасці тэсціраваных сярэднія паказчыкі, натуральна, сталі зніжацца.
Але як растлумачыць спад у 70х гадах, калі колькасць абітурыентаў, што выконвалі тэст, стабілізавалася? Што гэта —
вынік замены кнігі тэлебачаннем? Следства павелічэння тэрміну вучобы і колькасці факультатыўных дысцыплін, спрашчэння падручнікаў і паслабкі ў хатніх заданнях [Turnbull, 1986]? Альбо ў сувязі з ростам сям’і ў 50х гадах проста знізіўся кантроль старэйшых за дзецьмі. Відавочна, што на зніжэнне тэставых адзнак паўплывалі ўсе гэтыя фактары.
У адрозненне ад SAT, тэсты Векслера і Стэнфард — Бінэ перыядычна праходзяць паўторную стандартызацыю, каб утрымаць сярэдняе значэнне на ўзроўні 100 балаў. Сёння пры выкананні тэста WAISR ваш вынік будзе прыроўнены да паказчыкаў кантрольных груп перыяду з 1976 па 1980 год, а не 30х гадоў. А што мы заўважым, калі параўнаем тэставыя паказчыкі бліжэйшых па часе кантрольных груп з паказчыкамі 30х гадоў: рост ці падзенне? Цікава, што ў той час, як вынікі тэста SAT пайшлі ўніз, балы тэстаў на
Мал. 11.4. Калі ў 1941 г. праводзілася стандартызацыя тэста, сярэдні паказчык для кожнага раздзела быў вызначаны ў 500 балаў. 68% вынікаў аказаліся ў межах вышэй за 100 балаў і ніжэй за 500. Такім чынам, 115 балаў па шкале Векслера для дарослых адпавядаюць 600 балам па шкале SAT. Аднак гэтыя два паказчыкі не эквівалентныя, бо агульнаадукацыйны ўзровень кантрольных груп не быў аднолькавым.
Раздзел 11 Інтэлект 293
інтэлект выраслі [Flynn, 1987]. Вынік, за які вы сёння атрымаеце 100 балаў, у 30я гады прынёс бы вам 114. Гэта не толькі амерыканскі феномен: падобны рост назіраецца і ў іншых развітых краінах свету.
Дык як быць з такім парадоксам: зніжаецца ўзровень адоранасці, як сведчаць даныя тэста SAT, або павышаецца, як паказваюць адзнакі тэста Векслера? Папершае, трэба мець на ўвазе, што зніжэнне паказчыкаў у тэсце SAT адбылося часткова зза перападу ўзроўню адукаванасці абітурыентаў 60х гадоў. Акрамя таго, методыка Векслера была разлічана на самых розных людзей, а не толькі на паступаючых у каледжы, як у выпадку з тэстам SAT. Людзі ўвогуле — а значыць і кантрольныя групы — сталі больш пісьменныя і адукаваныя, чым у 30х гадах. Акрамя таго, трэба памятаць, што SAT ацэньвае адначасова і агульную адоранасць, і паспяховасць у вучобе, якія не выраслі ў адрозненне ад умення рашаць праблемныя задачы, што правяраецца тэстамі на інтэлект. Гэтыя факты дапамагаюць растлумачыць, чаму паказчыкі больш складанага тэста SAT знізіліся, a тэста WAISR — выраслі.
Надзейнасць. Вынікі добрага тэсту павінны быць стабільнымі; карацей кажучы, тэст павінен быць надзейным. Для праверкі надзейнасці тэста даследчыкі звычайна праводзяць паўторнае тэсціраванне з дапамогай таго ж тэста або другога яго варыянта. Калі паказчыкі супадаюць ці карэліруюць паміж сабою, тэст можна лічыць надзейным. Ёсць і другі варыянт: раздзяліць яго папалам і паглядзець, ці адпавядаюць адзін аднаму вынікі, атрыманыя пры адказах на цотныя і няцотныя пытанні.
Чым вышэй карэляцыя паміж вынікамі першага і паўторнага тэсціравання альбо паміж вынікамі дзвюх частак тэста, тым вышэй яго стабільнасць. Самы нізкі ўзровень карэляцыі (1,0) сведчыць пра поўнае несупадзенне паміж дзвюма групамі паказчыкаў, г. зн. адны вышэй, a другія ніжэй. Нулявы ўзровень гаворыць пра адсутнасць надзейнасці. Самы высокі ўзровень карэляцыі (+1,0) сведчыць пра поўную ўзгодненасць, г. зн. з ростам пер
Гады
Мал. 11.5. Паміж 1963 і 1980 гадамі сярэднія вынікі тэста SAT значна знізіліся, хоць нядаўна назіраўся невялікі пад’ём [паводле the College Board],
шага паказчыка расце і другі. Тэсты, пра якія гаварылася вышэй — Стэнфард— Бінэ, WAISR і WISC, SAT і ўступны тэст у каледжах, — маюць вельмі высокую надзейнасць — каля +0,9. Пры паўторным тэсціраванні вынікі аказваюцца блізкімі да першапачатковых.
Валіднасць. Высокая надзейнасць не гарантуе высокай валіднасці тэста — г. зн., што ён сапраўды вымярае тое, што павінен вымяраць і прадказвае тое, што ад яго і чакалася. Калі для вымярэння росту некалькіх чалавек вы карыстаецеся кравецкай стужкай, вашы вынікі будуць мець высокую надзейнасць, але нізкую валіднасць. Як у такім выпадку вызначыць — валідны тэст ці не? Некаторым тэстам дастаткова мець змястоўную валіднасць: гэта азначае, што яны сапраўды маюць дачыненне да якасцей, якія ацэньваюцца. Тэст на права ваджэння аўтамабіля мае змястоўную валіднасць, бо прыводзіць прыклады сітуацый, з якімі на практыцы сутыкаецца вадзіцель. Тэст на засваенне якоганебудзь вучэбнага матэрыялу таксама мае змястоўную валіднасць, бо ацэньвае вашыя веды гэтага курса.
294 Частка 4 Пазнанне і мысленне
ВЫНІКІ ПАДРЫХТОЎКІ
Дапусцім, што пасля таго, як вы выканалі тэст SAT, уступны тэсту юрыдычны ці медыцынскі каледж або здалі пісьмовы выпускны экзамен, вы засталіся незадаволеныя сваімі вынікамі. Ці можна разлічваць на тое, што ў другой спробе, прайшоўшы шырока разрэкламаваны курс падрыхтоўкі да тэста, вы даб’яцеся большых поспехаў? Знаёмства з тэстам, з парадкам яго правядзення, несумненна, дапаможа вам. Але вы даможацеся таго ж, калі будзеце выконваць трэніровачныя тэсты, даступныя кожнаму абітурыенту. Дык ці ёсць сэнс праходзіць складаныя курсы падрыхтоўкі? Такія курсы дапамагаюць асвяжыць у памяці веды, асабліва па матэматыцы. На іх можна атрымаць некалькі карысных парад адносна працэсу правядзення тэста. Напрыклад, на першыя пытанні раздзела, на якія 80 ці больш працэнтаў удзельнікаў даюць правільныя адказы, самы “найдзейны” варыянт звычайна бывае слушным, а вось у
апошніх пытаннях, дзе 75% памыляюцца, самы “відавочны” адказ часцей няправільны.
Нягледзячы на спецыяльныя метады і спосабы выкладання, на падрыхтоўчых курсах і насуперак абяцанням палепшыць вынікі, тры незалежныя даследаванні паказалі, што ладрыхтоўчыя курсы павялічвалі колькасць балаў у сярэднім толькі на 15 адзінак па 200800бальнай шкале [Der Simonian & Laird, 1983; Kulik & others, 1984; Messick & Jungeblut, 1981]. Такі нязначны рост быў прыкметны асабліва пры складаных, галаваломных заданнях [Powers, 1986]. Таму найлепшая парада пры падрыхтоўцы да SAT — добрасумленна вучыцца, пастаянна асвяжаць у памяці свае веды па алгебры і геаметрыі і знаёміцца са структурай тэста. Калі вы гэта зробіце, вы будзеце выглядаць не горш за тых, хто наведваў падрыхтоўчыя курсы.
Іншыя тэсты ацэньваюцца па ступені адпаведнасці пэўнаму крытэрыю, г. зн. уласнай меры таго, што тэст прызначаны ацаніць. Для некаторых тэстаў такім крытэрыем з’яўляюцца будучыя дасягненні. Напрыклад, тэсты на агульную адоранасць характарызуюцца прадказальнай валіднасцю, г. зн. яны павінны прадказваць будучыя поспехі.
Ці з’яўляецца прадказальная валіднасць тэстаў на інтэлект такой жа высокай, як і іх надзейнасць? Як любяць гаварыць крытыкі, не і яшчэ раз не. Для ранняга ўзросту яна сапраўды вялікая, але ў далейшым слабее. Тэсты на агульную адоранасць дакладна прадказваюць паспяховасць дзіцяці ў пачатковай школе, і ў гэтым выпадку карэляцыя вынікаў тэста і школьных адзнак складае +0,60 . Тэст SAT прагназуе адзнакі першакурсніка з меншай дакладнасцю, тут карэляцыя складае ўжо толькі +0,40. Што тычыцца ўступнага тэста для аспірантаў GRE (тэст на агульную адоранасць, падобны на SAT), то карэляцыя яго вынікаў з адзнакамі аспіранта яшчэ меншая: усяго +0,30 (GRE, 1990). Як растлумачыць, што прадказальная валіднасць падае па меры таго, як людзі ўздымаюцца па адукацыйнай лесвіцы?
Параўнайце: поспехі лінейных ігракоў у амерыканскім футболе цалкам залежаць ад вагі цела. Ігрок, што важыць каля 100 кг, напэўна, абыграе свайго 70кілаграмовага суперніка. Аднак калі вага цела знаходзіцца ў межах ад 93 да 107 кг, карэляцыя паміж вагой і паспяховасцю гульні сыходзіць на нуль. Чым вузей дыяпазон паказчыкаў вагі, тым цяжэй прадказваць поспехі на падставе вагі цела.