• Газеты, часопісы і г.д.
  • Частотны слоўнік беларускай мовы

    Частотны слоўнік беларускай мовы


    Выдавец: Выдавецтва БДУ
    Памер: 232с.
    Мінск 1976
    95.41 МБ
    Т а б л і ц a 3
    Аўтар фрагмента	Твор	Агульная колькасць слоў	Колькасць слоў з ядра	Доля слоў з ядра ў тэксце 	
    I. Шамякін	Атланты і ка			
    	рыятыды	102	63	0,62
    Я. Брыль	Вітраж	90	71	0,79
    I. Навуменка	Мост	115	79	0,69
    У. Караткевіч	Дзікае паляван			
    	не караля Стаха	98	82	0,84
    В. Быкаў	Сотнікаў	134	103	0,77
    		539	398	0,74
    пілі ў лік найчасцейшых такія словы, як адарваць, дошкі, філёнкі, цвік, заржавець, закалаціць, якія маюць прамое дачыненне да спробы героя знайсці Малога Чалавека ў закалочаным пакоі... Урывак пра пакуты Сотнікава, калі ён паранены ішоў праз поле, уключае такія не найчасцейшыя словы, як здольна, знясілены, памагаючы, натуга, пераступаць, сцягно, ступня, балець, змёрз, закасцянеў, бўрак, халява, надзеты, апанаваць, абыякавасць, пакута, рэальны, уяўны, намаганне; ясна, што гэтыя словы цесна звязаны са зместам фрагмента, якраз яны і перадаюць асноўную яго спецыфіку.
    Такім чынам, выяўленне слоўнікавага ядра ў пэўнай
    15
    меры дазваляе выявіць таксама спецыфічную лексіку тую, якая не увайшла ў ядро, але на якую падае вялікая’ нагрузка у перадачы зместу мастацкага твора. У гэтым плане становіцца ясным, што было б памылкай абмяжоўвацца вывучэннем толькі ядра лексікі, а трэба звяртаць увагу на лексіку менш частую, у тым ліку і такую якая прадстаулена ў матэрыялах слоўніка нават адзінк’авымі
    Т а б л і ц a 4
    Колькасць найбольш частых слоў	Доля найбольш частых слоў у тэксце	Доля найбольш частых слоў у слоўпіку
    1	0,04	0,000 05
    5	0,15	0,000 23
    10	0,23	0,000 46
    30	0,34	0,001 38
    50	0,40	0,002 30
    100	0,48	0,004 60
    300	0,60	0,01379
    500	0,66	0,022 98
    1000	0,74	0,045 97
    2000	0,81	0,091 94
    5000	0,90	0,229 84
    прыкладамі. Трэба ўлічыць, што доля гэтай лексікі ў слоўніку знаходзіцца ў адваротных адносінах да яе долі Ў трксце. У табліцы 4 паказана доля пэўных частак лексікі ў слоўніку параўнальна з іх доляй у тэксце. 3 табліцы відаць, што тысяча слоў, якая складае менш 5% слоўніка прааналізаваных фрагментаў, займае 74% тэксту, а дзве тысячы слоў, якія пакрываюць звыш 80% тэксту, складаюць толькі 9% слоўніка.
    Так званыя частотныя зоны слоўніка ў мастацкай лііаратуры выконваюць важныя функцыі, своеасаблівыя 16
    для кожнай з частотных зон. Найбольш частыя словы складаюць істотны лексікаграматычны фундамент, на якім будуецца аснова тэксту, а рэдкія словы складаюць вартасныя для мастацкага твора надбудовы. Рэдкія словы, якія сустракаюцца адзіндва разы ў нашым матэрыяле, патрабуюць, з аднаго боку, больш глыбокага статыстычнага аналізу, таму што пры значным павелічэнні матэрыялу (у некалькі дзесяткаў разоў) адбудзецца далей.шае размежаванне рэдкіх слоў на сапраўды рэдкія і такія, якія рэдка сустрэліся толькі ў абмежаваным моўным матэрыяле. 3 другога боку, рэдкія словы неабходна падвергнуць якаснаму аналізу, які можа падказаць іх структурную функцыю ў мове мастацкага твора ў радзе выпадкаў і без далейшай статыстычнай апрацоўкі.
    Разам з тьім вядома, што і частыя словы не аднолькава размяркоўваюцца ў тэксце, а таму і іх вывучэнне можа быць праведзена ў якаснастылістычным плане. У табліцы 5 прадстаўлена размеркаванне некаторых найбольш частых слоў: і, у, не, але, ты.
    Найбольш згуртаваным вакол сярэдняй сутракаемасціў тысячы аказваецца размеркаванне слова але (а= = 3J6). Найбольшае рассеянне з пяці прааналізаваных слоў уласціва слову і, самага частага з прааналізаваных (ст= 10,01). Меры дысперсіі іншых слоў: для у ст=7,28, для ты 7,81, для не — 8,94. Гэта значыць, шго слова але большменш раўнамерна сустракаецца ў розных фрагментах тэксту, у той час як выкарыстанне слова і, a таксама слоў не, ты, у значна вар’іруецца па тысячах. 1 этым пацвярджаецца выказаная А. Я. Шайкевічам думка аб тым, што нават найбольш частыя рускія словы, такія, як й, в, могуць служыць паказчыкамі стылявых адрозненняў. Асаблівай увагі ў гэтым плане заслугоўвае, наадварот, малая дысперсія ў размеркаванні слова але, якое, значыць, менш стылістычна афарбавана, бо больш раўнамерна сустракаецца ў розных фрагментах тэкстаў. Што датычыць слова ты, то тут, магчыма. ттбя ўлічыць
    2 Зак, 27
    17
    тую спецыфічную акалічнасць, што гэта слова (як.дарэчы, і слова я) адносна часта наогул не сустрэлася ў прааналізаваных тэкстах, што звязана з агульнай жанравастылістычнай і зместавай характарыстыкай тэкстаў.
    Рысункі 1—5 даюць наглядную карціну эмпірычнага размеркавання гэтых слоў (трэба ўлічваць, што мэтазгодным было адкласці розныя маштабы на асі ардынат, на якой адкладзены частоты дадзенага слова ў тысячы). Зразумела, для вырашэння праблемы размеркавання моўных адзінак у тэарэтычным плане патрэбна было б прааналізаваць значна большы фактычны матэрыял.
    Прыведзеныя факты, натуральна, не адлюстроўваюць усіх тых матэрыялаў, якія атрыманы ў выніку працы над частотным слоўнікам беларускай мовы. Можна пры гэтым адзначыць, што цікавыя з’явы чакаюць нас не толькі сярод найбольш частых слоў і не толькі ў статыстычных характарыстыках беларускага слоўнікавага складу.
    Т а б л і ц a 5
    Частата ў тысячы	Колькасць тысяч са словамі				
    	і	У	не	але	ты
    0	0	0	4	5	37
    1				19	19
    2				30	26
    3				30	26
    4				36	21
    5			1	47	17
    6				32	16
    7				30	15
    8			2	24	15
    9			3	9	15
    10			о	8	12
    11	1		5	7	8
    18
    Працяг табл. 5
    Частата ў тысячы	Колькасць тысяч са словамі				
    	і	У	не	але	ты
    12			4	4	13
    13		2	7	3	9
    14	1	3	6	3	6
    15		1	3	1	6
    16		5	9	0	8
    17	1	8	15	1	4
    18	1	5	17	1	4
    19	5	7	8		
    20		8	7		
    21	2	12	13		
    22	2	10	11		2
    23	6	12	16		
    24		14	11		2
    25	5	17	11		
    26	5	16	14		1
    27	3	21	11		
    28	7	13	13		2
    29	4	8	8		
    30	8	16	14		1
    31	6	15	7		1
    32	8	16	13		
    33	8	15	9		
    34	6	12	4		1
    35	15	11	10		
    36	15	11	4		
    37	8	8	1		1
    38	18	8	2		
    39	10	2	4		
    40	15	1	10		
    19
    Працяг табл. 5
    Частата ў тысячы	Колькасць тысяч са словамі				
    	і	У	не	але	ты
    41	16	1	2		1
    42	12	1	2		
    43	4	2	3		
    44	6	1	1		
    45	17	2	0		
    46	12	1	1		
    47	9				
    48	5	1			
    49	5	1			
    50	7	1	1		
    51	5	1	1		
    52	5				
    53	6				
    54	8				
    55	3				
    56	2				
    57	1				
    58	4				
    59	1	1			
    60	2				
    61	0				
    62	1				
    Ужо зараз, напрыклад, можна адзначыць, што ў слоўнікавую картатэку частотнага слоўніка трапіла значная колькасць так званых «адвержаных» слоў, якія не ўключаны ў слоўнік. Так, напрыклад, у «Беларускарускі слоўнік» 1962 года не былі ўключаны такія словы, як бето
    20
    навы, бібула, благародны, блазенскі, блазенства, блаславенне, блудлівы, брацец, брыдзюк, буйнаваты, буркатаць, бэйбус, бялявіцца, га, гліняк, глушэча, грыбавішча, гультайнічаць, дзятлік і шмат іншых. Трэба спадзявацца, што такія і падобныя да іх словы трапяць у новыя
    Рыс. 4
    Рыс. 5
    беларускія слоўнікі, у першую чаргу ў тлумачальны слоўнік беларускай мовы, які павінен адлюстраваць усё багацце слоўнікавага складу беларускай мовы. Трэба мець пры гэтым на ўвазе, што такое, напрыклад, слова, як га,— гэта жывая з’ява мовы, а не факт асобных жанраў ці стыляў, цікава, што слова га сустрэлася ў абследаваным масіве 22 разы у 16 фрагментах, аўтарамі якіх
    21
    з’яўляюцца Я. Брыль, М. Зарэцкі, У. Карпаў, Я. Маўр, П. Пестрак, I. Пташнікаў, Э. Самуйлёнак, К. Чорны, С. Шушкевіч і іншыя; слова дзела сустрэлася 9 разоў у 8 фрагментах, што ўказвае, што наўрад ці можна яго безумоўна адкідваць пры разглядзе слоўніка беларускай мовы, незалежна ад таго, як кваліфікаваць яго з пункту гледжання стылявой прыналежнасці ці паходжання. Але гэта ўжо іншая справа, якая патрабуе асобнай увагі і асобных разважанняў.
    Некаторыя лінгвастатычныя каментарыі да частотнага слоўніка беларускай мовы даюцца ў артыкуле В. В. Нешытога, змешчаным у дадатку.
    Частотны слоўнік беларускай мовы падрыхтаваны калектывам кафедры агульнага і славянскага мовазнаўства Беларускага дзяржаўнага універсітэта імя У. I. Леніна. У выпісцы слоў з тэкстаў удзельнічаюць студэнты філалагічнага факультэта. Студэнты таксама прымалі ўдзел у першаснай апрацоўцы выпісаў: зверцы іх з арыгіналамі, а таксама размеркаванні па літарах. Актыўны ўдзел у гэтай рабоце над першым томам прынялі студэнты: М. Шашко, А. Верабей, I. Усціновіч, Т. Лапа, Г. Прылуцкая, Г. Ладуцька, Т. Зімяніна, С. Анціпенка, Т. Карасёва, 3. Мурашка, I. Заяц, Л. Цудня, Т. Ганчарова, Н. Палазкова, Л. Пілат і інш. Агульны прынцып пабудовы слоўніка распрацаваў праф. А. Я. Супрун. Яму належыць кіраўніцтва падрыхтоўкай канкрэтных інструкцый для выпіскі, размяшчэння лексікі, навуковае рэдагаванне слоўніка і напісанне ўступнага артыкула. Працу па ўкладанню дадзенага тома выканала дац. Н. С. Мажэйка. У падрыхтоўцы тэкстаў для выпіскі, арганізацыі збору матэрыялаў прымала ўдзел ст. лабарантка кафедры Г. П. Раманчыкава.
    Першая частка слоўніка прадстаўляе сабой спіс слоў у парадку змяншэння іх частаты. Спачатку прыводзяцца найбольш частыя словы, потым менш частыя і г. д. Словы з частатой 15 і болей змешчаны ў адну калонку. Пры
    22
    гэтым злева праз кожныя пяць слоў адзначаецца нумар слова ў частотным спісе (яго ранг). Далей ідзе слова ў пачатковай граматычнай форме (калі слова сустракалася ў розных граматычных формах, частоты гэтых форм суміруюцца ў агульную частату слова; так, напрыклад, частата слова ён складаецца з сукупнасці частот словаформ ён, яго, яму, ім, яна, яе, яны і г. д.). У першай калонцы справа ад слова памечана агульная частата слова ў вывучаных крыніцах. У другой калонцы адзначаецца колькасць фрагментаў тэкстаў (усяго іх 290), у якіх сустрэлася слова. Калі некалькі слоў сустрэліся аднолькавую колькасць разоў, раней у спіс ставяцца тыя словы, якія сустракаюцца ў большай колькасці фрагментаў, г. зн. адносна больш пашыраны ў тэкстах, а потым тыя, якія сустрэліся ў меншай колькасці фрагментаў. Калі словы маюць аднолькавую частату і пашыранасць, яны змяшчаюцца паводле алфавіту. Словы з частатой 14 і меней для эканоміі змяшчаюцца суцэльнымі спісамі, прычым размеркаванне ідзе па тых жа правілах: па частаце, па колькасці фрагментаў і ў алфавітным парадку. Частата і колькасць фрагментаў пры гэтым выносяцца ў загаловак адпаведных алфавітных спісаў.
    Тысяча найбольш частых слоў беларускай мовы змяшчаецца ў другой частцы працы ў алфавітным парадку.
    ЛІТАРАТУРА
    1
    Борнсоглебская Э. Н., Гурченкова В. П., Кулешов Н. В, Ку р б ы ко А. Е„ Ш н р о к о в О. С., Мацеральннк С. Г., Язвннская Я. А. Белорусскнй частотный словарь.— В сб.: Снстема языка н обученне речн (тезнсы докладов). Мннск, 1964, с. 82—85.