Частотны слоўнік беларускай мовы
Выдавец: Выдавецтва БДУ
Памер: 232с.
Мінск 1976
Прадстаўлены ў нашым слоўніку фактычны матэрыял дае магчымасць увогуле дакладна выдзеліць першую тысячу па частотнасці слоў беларускай мовы. Гэта словы, якія сустрэліся ў тэкстах 31 раз і часцей. Яны прыводзяцца як у пачатку частотнага спісу, так і ў алфавітным парадку пасля ўласна частотнага раздзелу слоўніка. У семантычных адносінах ядро слоўніка складаецца з дастаткова разнастайнай лексікі. Так, напрыклад, сярод назоўнікаў прадстаўлена вялікая група назваў асоб як агульных (чалавек, мужчына, жанчына, дзіця, хлопец, хлапчук, дзяўчына, дзяўчаты, дзяўчынка, людзі), так і больш спецыялізаваных: назвы роднасці і сваяцтва (бацька, маці, мама, тата, сын, дачка, брат, жонка, дзядзька, цётка, дзед), назвы асоб па прафесіі (рабочы, настаўнік, доктар, старшыня, начальнік), у тым ліку ваенныя (баец, салдат, генерал, камандзір, партызан), назвы асоб паводле сацыяльных адносін (сябар, вораг, су
8
сед, госць, таварыш, пан), назвы груп асоб (сям’я, брыгас)а, наро'д). У тысячы найбольш частых слоў прадстаўлена і група слоў, што абазначаюць часткі цела чалавека (рука, вока, галава, твар, нага, сэрца, плячо, палец, нос, вуха, грудзі, спіна), а таксама словы, якія абазначаюць тыповыя ўчынкі, дзеянні, праявы чалавека: голас, крок, сляза. У ядро слоўніка амаль поўнасцю ўвайшлі асноўныя назвы адрэзкаў часу (час, дзень, год, ноч, хвіліна, вечар, момант, гадзіна, раніца, вясна, тыдзень), важнейшыя словы, звязаныя з надвор’ем (вецер, снег, дождж). Група геаграфічных тэрмінаў адлюстравана такімі словамі, як лес, поле, бераг, зямля, рака, балота, вёска, горад, раён, станцыя, месца, дарога, вуліца. Жыллё чалавека прадстаўлена словамі хата, дом, двор, кватэра, сцяна, дзверы, акно, печ, парог, падлога, стол, ложак. Есць у ядры назвы раслін (дрэва, куст, трава, дуб) і жывёл (конь, карова, сабака, птушка), частак навакольнага свету (неба, сонца, камень, вада, паветра). У ядры прадстаўлена і значная група лексікі, якая абазначае дзейпасць чалавека, працу і вучобу (работа, праца, завод, калгас, школа, клас, сход, план, газета), побыт, адзенне, ежу (бот, кішэнь, агонь, хлеб, грошы), моўную дзейнасць (слова, адказ, пытанне, размова) і іншыя формы волевыяўлення, пачуцці і інш. (ласка, позірк, усмешка, выгляд, выпадак, злосць, сіла. увага, думка). У складзе назоўнікаў, якія сустрэліся 60 разоў і часцей і ўвайшлі ў першую палову тысячы найбольш частых слоў беларускай мовы, ёсць таксама назвы сродкаў транспарту (машына і воз), абстрактныя словы (праўда, канец, бок, жыццё), назвы міфічных істот (бог, чорт). Ужо гэты пералік найбольш частых беларускіх назоўнікаў дае магчымасць пераканацца, што ў ядры лексікі беларускай мовы ў першую чаргу прадстаўлены словы найбольш шырокага ўжывання, звязаныя з жыццём чалавека наогул: толькі ў некаторых выпадках адбываецца канкрэтызацыя гэтых назваў. Аналагічную карціну даюць і найбольш частыя дзеясловы,
9
а таксама прыметнікі і прыслоўі. Зразумела, што сярод найбольш частых слоў найбольш поўна прадстаўлены займеннікі і лічэбнікі, а таксама службовыя словы. Гэтыя нешматлікія словы выконваюць важную ролю ў тэкстах, часта паўтараюцца і сустракаюцца сярод найбольш частых слоў кожнай мовы. Беларуская мова тут не выключэнне.
Усяго ў нашым слоўніку зарэгістравана 21 754 словы. Гэта значыць, што такая колькасць розных слоў сустрэлася ў 290 фрагментах мастацкай прозы па тысячы слоў у кожным. Для параўнання можна ўказаць, што на 301 674 словаўжыванні тэкстаў белетрыстыкі, даследаваныя ў славацкім частотным слоўніку, адзначаецца 19 130 розных слоў, на 300 тыс. словаўжыванняў з мастацкай літаратуры, прааналізаваных у латышскім частотным слоўніку, зафіксавана 17 769 розных слоў, на 400 тыс. словаўжыванняў дзіцячай літаратуры ў рускім частотным слоўніку Э. А. Штэйнфельдт адзначана 24 224 розныя словы. Паколькі некаторае змяншэнне колькасці розных слоў у славацкай і латышскай мовах магло ўзнікнуць у сувязі з тым, што даследаваліся буйныя фрагменты ці творы, у адрозненне ад нашых фрагментаў па тысячы слоў, можна лічыць, што колькасць розных слоў на адпаведную велічыню выбаркі ў беларускай мове супадае з нормай сучасных еўрапейскіх літаратурных моў.
Размеркаванне лексікі, аналізуемай у нашым слоўніку паводле частаты, ілюструецца ў табліцы 1. Недастаючыя да 290 тыс. словаўжыванні — гэта ўласныя імёны і лічбы.
У табліцы 2 адзначана так званая эфектыўнасць слоўніка, гэта значыць частка абследаванага тэксту, якая мае адпаведную колькасць найбольш частых слоў. Частка тэксту вымяраецца тут у словах; калі б падлікі вяліся ў фанемах ці літарах, вынік атрымаўся б іншы, таму што найбольш частыя словы адпаведна з правілам Цыпфа — самыя кароткія (гл. таксама табліцу 6). Паводле гэтых дадзеных, 150 найбольш частых слоў складаюць звыш
10
T a б л і ц a I
Рангі Частата Колькасць слоў Агульная частата слоў з гэтай частатой Сумарная частата слоў з гэтай і большай частатой
1—2 Звыш 10 000 2 23 067 23 067
3—34 1 001—10 000 32 82 111 105 178
35—63 501—1 000 29 18 738 123916
64—80 401—500 17 7 833 131 749
81—113 301—400 33 11 560 143 309
114—167 201—300 54 13 391 156 700
168—305 101—200 138 18 900 175 600
306—341 91—100 36 3 406 179 006
342—385 81—90 44 3 760 182 766
386—430 71—80 45 3 394 186 160
431—490 61—70 60 3 930 190 090
491—598 51—60 108 5 948 196 038
599—777 41—50 179 8 096 204 134
778—888 36—40 110 4 184 208 318
889—998 31—35 110 3612 211 930
999—1 198 26—30 199 5 687 217617
1 199—1 446 21—25 248 5 673 223 290
1 447—1 912 16—20 466 8 346 231 636
1 913—2 710 11—15 798 10 161 241 797
2 7114 659 6—10 1949 14 791 256 588
4 660—5 470 5 811 4 055 260 643
5 471—6 594 4 1124 4 496 263 139
6 595—8 431 3 1837 5511 270 650
8 432—11 839 2 3408 6816 277 466
11 84021 754 1 9915 9915 287 381
11
T a б л і ц a 2
Колькасцьнайбольш частых слоў Найніжэйшая часта га Сумарная частата Доля тэксту
I 11 711 11 711 0,04
2 11 356 23 067 0,08
5 5 882 44 530 0,15
10 3 350 66 424 0,23
30 1 039 101 080 0,34
50 656 116 838 0,40
100 348 139 129 0,48
150 229 153 091 0,53
300 102 175 094 0,60
500 60 190 690 0,66
1000 30 211 990 0,74
2000 15 232 956 0,81
5000 5 258 293 0,90
паловы тэксту, a 500 найбольш частых слоў — дзве трэці. Гысяча самых частых слоў — гэта прыблізна тры чацвёртыя, тэксту, а дзве тысячы — чатыры пятыя. Пяць тысяч слоў складаюць дзевяць дзесятых тэксту. Такім чынам, надзейна адабранае «ядро» слоўніка з тысячы слоў «пакрывае» прыблізна тры чацвёртыя тэксту. 3 другога боку, можна меркаваць, што калі ў тым ці іншым мастацкім творы сустрэнецца значная паўтараемасць слоў, якія ў нашым слоўніку не трапілі да гэтага «ядра», гэта абумоўлена пэўнымі ўмовамі, асаблівасцямі, якія неабходна ўдакладніць у парадку канкрэтнага якаснага аналізу.
Першая тысяча слоў, нягледзячы на тое, што ў тэксце да слоў гэтай тысячы належаць у сярэднім тры з кожных чатырох слоў, не можа забяспечыць поўнага разумення тэксту. Справа ў тым, што гэтыя тры чацвёртыя тэксту
12
ў значнай меры нясўць граматычную інфармацыю, яны складаюць неабходны фон, без якога разуменне тэксту зусім немагчыма. Але менавіта ў апошняй, чацвёртай, частцы тэксту выказваецца канкрэтны сэнс думкі, тое, што ў найбольшай меры адрознівае дадзеную думку ад іншых, яе спецыфіка. Таму аказваецца, што «зняццё» найбольш частых слоў агаляе, выкрывае спецыфічны змест тэксту. Гэта можна прасачыць на прыкладах, узятых з новых твораў сучасных беларускіх пісьменнікаў, якія не былі прааналізаваны ў слоўніку. Кожны з фрагментаў змяшчае каля ста слоў. Словы, што ўваходзяць у першую тысячу, надрукаваны ў тэкстах курсівам. Аналіз паказвае, што выказаныя меркаванні пра эфектыўнасць слоўніка пацвярджаюцца на гэтых выпадкова выбраных тэкстах. Прыкладна 75% урыўкаў складаюць словы з ліку найбольш частых (табл. 3).
П р ы к л а д ы:
/
Пасля доўгага перапынку ён даў волю свайму захапленню, калі будаваў дачу. Ды не толькі тады, калі будаваў, але ўсе пяць гадоў, калі жыў, адпачываў; лепшы адпачынак — разьба. Тады ж прывёз з лясніцтва тоўстыя ліпавыя і бярозавыя круглякінарыхтоўкі. Госці дзівіліся на круглякі, пы.таліся — навошта яны? «Пайду на пенсію — займуся разьбой». Да пенсійнага ўзросту заставалася ўсяго... трынаццаць гадоў. Ігнатовіч неяк сказаў: «Струхлеюць твае круглякі да пенсіі». Але той жа Ігнатовіч, знаходзячыся ў замежнай камандзіроўцы, прывёз яму ў падарунак набор выдатных разцоў, такія ў нас не вырабляюць; адзін — для грубай апрацоўкі — нават электрычны.
(I. Ш а м я к і н. Атланты і карыятыды)
13
II
Першае, што я зрабіў наступнага дня, гэта ададраў дошкі ад дзвярэй таго адзінага закалочанага пакоя, у якім толькі і мог знікнуць Малы Чалавек, калі ён быў істотай з плоці і крыві. Цвікі заржавелі, філёнкі на дзвярах былі цэлымі, у пакоі ляжаў пласт пылу на тры пальцы. Там ніхто не мог схавацца, і я зноў закалаціў дзверы. ІІасля я абследаваў усе пакоі ў другім крыле і пераканаўся, што схавацца там няма дзе. Had калідорам, дзе я чуў крокі, была гара, на якой таксама не было слядоў. Справа былі дзверы ў мой пакой і пакой гаспадыні, глухі мур і за ім парк.
(У. К а р а т к е в і ч. Дзікае паляванне караля Стаха)
III
Але ён ійюў. Ён сабраў у сабе ўсё, на што яшчэ здольна было яго знясіленае цела, і, памагаючы сабе вінтоўкай, з натугай пераступаў нагамі. Сцягно яго пакутна балела, ступні ён ужо і не адчуваў нават, мокры ад крыві бўрак змёрз і закасцянеў, другі не да канца надзеты, загнуўся на палове халявы, доўгім носам грабучы снег. Сотнікаў ведаў, што повідну іх схопяць, але гэта ўжо не адзывалася ў ім вялікай трывогай — яго апанавала абыякавасць да ўсяго, што не было болем, яго рэальнай штохвіліннай, а не ўяўнай пакутай. Каб не Рыбак, ён бы, мусіць, даўно ўжо скончыў гэтыя марныя пакуты, але цяпер, насля ўсяго, што той зрабіў для яго, у Сотнікава ажылі зачаткі нейкага абавязку ў адносінах да намаганняў таварыша.
(В. Б ы к а ў. Сотнікаў)
У адзначаных фрагментах менавіта апошняя чвэрць слоў нясе на сабе асноўную сэнсавую нагрузку. У фрагменце з рамана Шамякіна гэта такія словы, як разьба,
14
разец, пенсія, пенсійны, заставацца, займацца, выдатны, вырабляць, набор, замежны, камандзіроўка, будаваць, дача, адпачынак, адпачываць, перапынак, ліпавы, бярозавьі, кругляк, лясніцтва. А ва ўрыўку гаворыцца пра тое, што Максім Карнач будаваў дачу і займаўся любімым адпачынкам — разьбою з бярозавых і ліпавых круглякоўнарыхтовак. У фрагмент з твора Караткевіча не тра