Лінгвостатистика

Спецкурс.

Автор курсу

Доц. Наталія Петрівна Дарчук.

* * *

Сфера дії статистичних законів надзвичайно широка: усі складні системи підпорядковуються, перш за все, законам статистичним. А такими системами є і живі організми, і їхня поведінка, й економіка, і результати діяльності великих колективів, і розвиток науки, і мова.

Важко знайти лінгвістичну роботу, в якій узагалі не було б елементарних підрахунків. Кількісні методи у лінгвістиці допомагають правильно організувати лінгвістичні спостереження, забезпечити надійність, точність, достовірність висновків у науці про мову. Ці методи ввійшли до мовознавчої практики, а лінгвостатистика як наука нараховує 30-річний досвід.

Лінгвостатистика розглядається і як техніка обробки лінгвістичних даних, і як метод дослідження мови та мовлення, і як концепція, система ідей та уявлень про об'єкт лінгвістичної науки. І якщо техніка квантитативної лінгвістики використовується зараз у багатьох дослідженнях, то методика реалізується тільки тоді, коли дослідник відчуває, що лише за допомогою кількісного підходу можна одержати нові дані або перевірити набуті знання про лінгвістичний об'єкт, коли дослідник переконаний в імовірнісній природі лінгвістичного об'єкта і ставить перед собою завдання - описати його у кількісних показниках.

Можливість використання кількісних методів у мовознавстві базується на особливостях будови мови та мовлення. Мова - це система, яка складається з дискретних одиниць, що мають кількісні характеристики. Ці характеристики притаманні одиницям усіх рівнів. Мова має ймовірнісний характер: це код з імовірнісними обмеженнями. У загальному розумінні код - це засіб подання інформації у формі, здатній для передавання інформації каналами зв'язку. Будь-який код - це певна множина фізично різних знаків, кожен з яких може співвідноситися з тим чи іншим об'єктом з множності об'єктів, на які розповсюджується дія даного коду.

Мовлення є реалізацією системи мови, її елементів. Можна вказати на декілька факторів, що дозволяють застосовувати кількісні методи при дослідженні мовних та мовленнєвих даних:

1) дискретність одиниць;

2) масовість мовних одиниць (а у мовленні практично нескінченний ланцюжок);

3) повторюваність їх у висловлюваннях;

4) можливість вибору певного елемента з ряду однорідних. На мовлення впливають закони мови (закономірності будови одиниць мови, використання їх у мовленні), закони сполучуваності одиниць у мовленні, закони жанру, теми висловлювання, смаки автора, його психофізіологічний стан та ін. Дія цих факторів так переплітається, що інколи неможливо визначити результати їхнього впливу. Але якщо сукупність цих факторів відносно постійна, то будова мовлення буде характеризуватися такими рисами, які можуть розкриватися кількісними методами.

Основним завданням статистичної лінгвістики є застосування кількісних методів для розкриття закономірностей функціонування одиниць мови у мовленні, а також установлення закономірностей будови тексту.

Мета спецкурсу полягає в ознайомленні студентів з основними поняттями та інструментами математичної статистики, з організацією статистичного експерименту; озброїти їх знаннями основних методів та прийомів статистичного аналізу мовного матеріалу; сформувати у них основи математичного мислення.

Зміст спецкурсу

1. Поняття про детермінативні та статистичні закони. Передумови і причини, що зумовлюють застосування статистичних методів у мовознавстві.

2. Передумови правильної організації статистичного дослідження. Організація механічної, випадкової та типової (зональної) вибірок. Визначення необхідного обсягу вибірки.

3. Обчислення основних статистичних характеристик вибірки: абсолютна та відносна частоти, варіанта, середнє квадратичне відхилення, міра коливання середньої частоти, похибка середньої арифметичної, коефіцієнт варіації та коефіцієнт стабільності. Визначення відносної неточності дослідження. Побудова інтервального ряду розподілення. Полігон частот.

4. Зіставлення статистичних характеристик різних вибірок: за смугою коливання середньої частоти, за критерієм Стьюдента. Перевірка на статистичну однорідність (критерій X2).

5. Методика об'єднання вибірок.

6. Встановлення залежностей між різними явищами у вибірці : побудова таблиці сполучених ознак для дослідження зв'язків між низькочастотними одиницями; обчислення істотності розходжень між низькочастотними явищами; коефіцієнт рангової кореляції; обчислення коефіцієнта кореляції.

7. Непараметричні критерії відмінності: метод експертних оцінок, обчислення коефіцієнта подібності, критерій знаків.

Література

Ван дер Варден Б.Л. Математическая статистика. - М., 1971.

Головин Б.Н. Язык и статистика. - М. 1971.

Перебийніс B.C., Муравицька М.П., Дарчук Н.П. Частотні словники та їх використання. - К.,1985.

Сепетлиев Д. Статистические методы в научных медицинских исследованиях. - М., 1968.

Статистичні параметри стилів. - К., 1967.

Hammerl Rolf, Sambor Jadwiga. Statystyka dla jezykoznawcow. -Warszawa, 1990.