• Газеты, часопісы і г.д.
  • Частотны слоўнік беларускай мовы

    Частотны слоўнік беларускай мовы


    Выдавец: Выдавецтва БДУ
    Памер: 232с.
    Мінск 1976
    95.41 МБ
    Прадстаўлены ў нашым слоўніку фактычны матэрыял дае магчымасць увогуле дакладна выдзеліць першую тысячу па частотнасці слоў беларускай мовы. Гэта словы, якія сустрэліся ў тэкстах 31 раз і часцей. Яны прыводзяцца як у пачатку частотнага спісу, так і ў алфавітным парадку пасля ўласна частотнага раздзелу слоўніка. У семантычных адносінах ядро слоўніка складаецца з дастаткова разнастайнай лексікі. Так, напрыклад, сярод назоўнікаў прадстаўлена вялікая група назваў асоб як агульных (чалавек, мужчына, жанчына, дзіця, хлопец, хлапчук, дзяўчына, дзяўчаты, дзяўчынка, людзі), так і больш спецыялізаваных: назвы роднасці і сваяцтва (бацька, маці, мама, тата, сын, дачка, брат, жонка, дзядзька, цётка, дзед), назвы асоб па прафесіі (рабочы, настаўнік, доктар, старшыня, начальнік), у тым ліку ваенныя (баец, салдат, генерал, камандзір, партызан), назвы асоб паводле сацыяльных адносін (сябар, вораг, су
    8
    сед, госць, таварыш, пан), назвы груп асоб (сям’я, брыгас)а, наро'д). У тысячы найбольш частых слоў прадстаўлена і група слоў, што абазначаюць часткі цела чалавека (рука, вока, галава, твар, нага, сэрца, плячо, палец, нос, вуха, грудзі, спіна), а таксама словы, якія абазначаюць тыповыя ўчынкі, дзеянні, праявы чалавека: голас, крок, сляза. У ядро слоўніка амаль поўнасцю ўвайшлі асноўныя назвы адрэзкаў часу (час, дзень, год, ноч, хвіліна, вечар, момант, гадзіна, раніца, вясна, тыдзень), важнейшыя словы, звязаныя з надвор’ем (вецер, снег, дождж). Група геаграфічных тэрмінаў адлюстравана такімі словамі, як лес, поле, бераг, зямля, рака, балота, вёска, горад, раён, станцыя, месца, дарога, вуліца. Жыллё чалавека прадстаўлена словамі хата, дом, двор, кватэра, сцяна, дзверы, акно, печ, парог, падлога, стол, ложак. Есць у ядры назвы раслін (дрэва, куст, трава, дуб) і жывёл (конь, карова, сабака, птушка), частак навакольнага свету (неба, сонца, камень, вада, паветра). У ядры прадстаўлена і значная група лексікі, якая абазначае дзейпасць чалавека, працу і вучобу (работа, праца, завод, калгас, школа, клас, сход, план, газета), побыт, адзенне, ежу (бот, кішэнь, агонь, хлеб, грошы), моўную дзейнасць (слова, адказ, пытанне, размова) і іншыя формы волевыяўлення, пачуцці і інш. (ласка, позірк, усмешка, выгляд, выпадак, злосць, сіла. увага, думка). У складзе назоўнікаў, якія сустрэліся 60 разоў і часцей і ўвайшлі ў першую палову тысячы найбольш частых слоў беларускай мовы, ёсць таксама назвы сродкаў транспарту (машына і воз), абстрактныя словы (праўда, канец, бок, жыццё), назвы міфічных істот (бог, чорт). Ужо гэты пералік найбольш частых беларускіх назоўнікаў дае магчымасць пераканацца, што ў ядры лексікі беларускай мовы ў першую чаргу прадстаўлены словы найбольш шырокага ўжывання, звязаныя з жыццём чалавека наогул: толькі ў некаторых выпадках адбываецца канкрэтызацыя гэтых назваў. Аналагічную карціну даюць і найбольш частыя дзеясловы,
    9
    а таксама прыметнікі і прыслоўі. Зразумела, што сярод найбольш частых слоў найбольш поўна прадстаўлены займеннікі і лічэбнікі, а таксама службовыя словы. Гэтыя нешматлікія словы выконваюць важную ролю ў тэкстах, часта паўтараюцца і сустракаюцца сярод найбольш частых слоў кожнай мовы. Беларуская мова тут не выключэнне.
    Усяго ў нашым слоўніку зарэгістравана 21 754 словы. Гэта значыць, што такая колькасць розных слоў сустрэлася ў 290 фрагментах мастацкай прозы па тысячы слоў у кожным. Для параўнання можна ўказаць, што на 301 674 словаўжыванні тэкстаў белетрыстыкі, даследаваныя ў славацкім частотным слоўніку, адзначаецца 19 130 розных слоў, на 300 тыс. словаўжыванняў з мастацкай літаратуры, прааналізаваных у латышскім частотным слоўніку, зафіксавана 17 769 розных слоў, на 400 тыс. словаўжыванняў дзіцячай літаратуры ў рускім частотным слоўніку Э. А. Штэйнфельдт адзначана 24 224 розныя словы. Паколькі некаторае змяншэнне колькасці розных слоў у славацкай і латышскай мовах магло ўзнікнуць у сувязі з тым, што даследаваліся буйныя фрагменты ці творы, у адрозненне ад нашых фрагментаў па тысячы слоў, можна лічыць, што колькасць розных слоў на адпаведную велічыню выбаркі ў беларускай мове супадае з нормай сучасных еўрапейскіх літаратурных моў.
    Размеркаванне лексікі, аналізуемай у нашым слоўніку паводле частаты, ілюструецца ў табліцы 1. Недастаючыя да 290 тыс. словаўжыванні — гэта ўласныя імёны і лічбы.
    У табліцы 2 адзначана так званая эфектыўнасць слоўніка, гэта значыць частка абследаванага тэксту, якая мае адпаведную колькасць найбольш частых слоў. Частка тэксту вымяраецца тут у словах; калі б падлікі вяліся ў фанемах ці літарах, вынік атрымаўся б іншы, таму што найбольш частыя словы адпаведна з правілам Цыпфа — самыя кароткія (гл. таксама табліцу 6). Паводле гэтых дадзеных, 150 найбольш частых слоў складаюць звыш
    10
    T a б л і ц a I
    Рангі	Частата	Колькасць слоў	Агульная частата слоў з гэтай частатой	Сумарная частата слоў з гэтай і большай частатой
    1—2	Звыш 10 000	2	23 067	23 067
    3—34	1 001—10 000	32	82 111	105 178
    35—63	501—1 000	29	18 738	123916
    64—80	401—500	17	7 833	131 749
    81—113	301—400	33	11 560	143 309
    114—167	201—300	54	13 391	156 700
    168—305	101—200	138	18 900	175 600
    306—341	91—100	36	3 406	179 006
    342—385	81—90	44	3 760	182 766
    386—430	71—80	45	3 394	186 160
    431—490	61—70	60	3 930	190 090
    491—598	51—60	108	5 948	196 038
    599—777	41—50	179	8 096	204 134
    778—888	36—40	110	4 184	208 318
    889—998	31—35	110	3612	211 930
    999—1 198	26—30	199	5 687	217617
    1 199—1 446	21—25	248	5 673	223 290
    1 447—1 912	16—20	466	8 346	231 636
    1 913—2 710	11—15	798	10 161	241 797
    2 7114 659	6—10	1949	14 791	256 588
    4 660—5 470	5	811	4 055	260 643
    5 471—6 594	4	1124	4 496	263 139
    6 595—8 431	3	1837	5511	270 650
    8 432—11 839	2	3408	6816	277 466
    11 84021 754	1	9915	9915	287 381
    11
    T a б л і ц a 2
    Колькасцьнайбольш частых слоў	Найніжэйшая часта га	Сумарная частата	Доля тэксту
    I	11 711	11 711	0,04
    2	11 356	23 067	0,08
    5	5 882	44 530	0,15
    10	3 350	66 424	0,23
    30	1 039	101 080	0,34
    50	656	116 838	0,40
    100	348	139 129	0,48
    150	229	153 091	0,53
    300	102	175 094	0,60
    500	60	190 690	0,66
    1000	30	211 990	0,74
    2000	15	232 956	0,81
    5000	5	258 293	0,90
    паловы тэксту, a 500 найбольш частых слоў — дзве трэці. Гысяча самых частых слоў — гэта прыблізна тры чацвёртыя, тэксту, а дзве тысячы — чатыры пятыя. Пяць тысяч слоў складаюць дзевяць дзесятых тэксту. Такім чынам, надзейна адабранае «ядро» слоўніка з тысячы слоў «пакрывае» прыблізна тры чацвёртыя тэксту. 3 другога боку, можна меркаваць, што калі ў тым ці іншым мастацкім творы сустрэнецца значная паўтараемасць слоў, якія ў нашым слоўніку не трапілі да гэтага «ядра», гэта абумоўлена пэўнымі ўмовамі, асаблівасцямі, якія неабходна ўдакладніць у парадку канкрэтнага якаснага аналізу.
    Першая тысяча слоў, нягледзячы на тое, што ў тэксце да слоў гэтай тысячы належаць у сярэднім тры з кожных чатырох слоў, не можа забяспечыць поўнага разумення тэксту. Справа ў тым, што гэтыя тры чацвёртыя тэксту
    12
    ў значнай меры нясўць граматычную інфармацыю, яны складаюць неабходны фон, без якога разуменне тэксту зусім немагчыма. Але менавіта ў апошняй, чацвёртай, частцы тэксту выказваецца канкрэтны сэнс думкі, тое, што ў найбольшай меры адрознівае дадзеную думку ад іншых, яе спецыфіка. Таму аказваецца, што «зняццё» найбольш частых слоў агаляе, выкрывае спецыфічны змест тэксту. Гэта можна прасачыць на прыкладах, узятых з новых твораў сучасных беларускіх пісьменнікаў, якія не былі прааналізаваны ў слоўніку. Кожны з фрагментаў змяшчае каля ста слоў. Словы, што ўваходзяць у першую тысячу, надрукаваны ў тэкстах курсівам. Аналіз паказвае, што выказаныя меркаванні пра эфектыўнасць слоўніка пацвярджаюцца на гэтых выпадкова выбраных тэкстах. Прыкладна 75% урыўкаў складаюць словы з ліку найбольш частых (табл. 3).
    П р ы к л а д ы:
    /
    Пасля доўгага перапынку ён даў волю свайму захапленню, калі будаваў дачу. Ды не толькі тады, калі будаваў, але ўсе пяць гадоў, калі жыў, адпачываў; лепшы адпачынак — разьба. Тады ж прывёз з лясніцтва тоўстыя ліпавыя і бярозавыя круглякінарыхтоўкі. Госці дзівіліся на круглякі, пы.таліся — навошта яны? «Пайду на пенсію — займуся разьбой». Да пенсійнага ўзросту заставалася ўсяго... трынаццаць гадоў. Ігнатовіч неяк сказаў: «Струхлеюць твае круглякі да пенсіі». Але той жа Ігнатовіч, знаходзячыся ў замежнай камандзіроўцы, прывёз яму ў падарунак набор выдатных разцоў, такія ў нас не вырабляюць; адзін — для грубай апрацоўкі — нават электрычны.
    (I. Ш а м я к і н. Атланты і карыятыды)
    13
    II
    Першае, што я зрабіў наступнага дня, гэта ададраў дошкі ад дзвярэй таго адзінага закалочанага пакоя, у якім толькі і мог знікнуць Малы Чалавек, калі ён быў істотай з плоці і крыві. Цвікі заржавелі, філёнкі на дзвярах былі цэлымі, у пакоі ляжаў пласт пылу на тры пальцы. Там ніхто не мог схавацца, і я зноў закалаціў дзверы. ІІасля я абследаваў усе пакоі ў другім крыле і пераканаўся, што схавацца там няма дзе. Had калідорам, дзе я чуў крокі, была гара, на якой таксама не было слядоў. Справа былі дзверы ў мой пакой і пакой гаспадыні, глухі мур і за ім парк.
    (У. К а р а т к е в і ч. Дзікае паляванне караля Стаха)
    III
    Але ён ійюў. Ён сабраў у сабе ўсё, на што яшчэ здольна было яго знясіленае цела, і, памагаючы сабе вінтоўкай, з натугай пераступаў нагамі. Сцягно яго пакутна балела, ступні ён ужо і не адчуваў нават, мокры ад крыві бўрак змёрз і закасцянеў, другі не да канца надзеты, загнуўся на палове халявы, доўгім носам грабучы снег. Сотнікаў ведаў, што повідну іх схопяць, але гэта ўжо не адзывалася ў ім вялікай трывогай — яго апанавала абыякавасць да ўсяго, што не было болем, яго рэальнай штохвіліннай, а не ўяўнай пакутай. Каб не Рыбак, ён бы, мусіць, даўно ўжо скончыў гэтыя марныя пакуты, але цяпер, насля ўсяго, што той зрабіў для яго, у Сотнікава ажылі зачаткі нейкага абавязку ў адносінах да намаганняў таварыша.
    (В. Б ы к а ў. Сотнікаў)
    У адзначаных фрагментах менавіта апошняя чвэрць слоў нясе на сабе асноўную сэнсавую нагрузку. У фрагменце з рамана Шамякіна гэта такія словы, як разьба,
    14
    разец, пенсія, пенсійны, заставацца, займацца, выдатны, вырабляць, набор, замежны, камандзіроўка, будаваць, дача, адпачынак, адпачываць, перапынак, ліпавы, бярозавьі, кругляк, лясніцтва. А ва ўрыўку гаворыцца пра тое, што Максім Карнач будаваў дачу і займаўся любімым адпачынкам — разьбою з бярозавых і ліпавых круглякоўнарыхтовак. У фрагмент з твора Караткевіча не тра