progenes: (Default)
progenes ([personal profile] progenes) wrote2007-10-11 09:23 am
Entry tags:

Quantifying the evolutionary dynamics... of language

В останньому випуску Nature поряд з урочистими статями присвяченим свіжим нобелівським лауреатам, освітленням проблем біопалива, європейської науки та молекулярним першопричинам раку, раптом знайшлась стаття про еволюцію. Правда на цей раз про еволюцію мови. Щоб сказати точніше, про еволюцію дієслів в англійській мові. Ще Докінз порівнював біологічні еволюційні процеси в генетиці з лінгвістичними еволюційними процесами. Власне ні для кого не секрет, що мова еволюціонує, але мені видалось цікаво, що там також існують певні

Відомо, що людська мова базується на граматичних правилах. Культурна еволюція сприяє постійній зміні цих правил: одні стають більш вживаними, інші просто відмирають. Для обчислення динаміки мовної еволюції вчені Гарвардського університету, до речі спеціалісти еволюційної та системної біології, використовуючи свій природничо-статистичний підхід, проаналізували процес утворення в англійській мові правильних дієслів з неправильних на протязі останніх 1200 років. В подальшому для скорочення будем називати перетворення неправильних дієслів у правильні "регуляризацією" (від regularization).

Нагадаю, в сучасній англійські мові правильні дієслова утворюють форму минулого часу додаванням суфіксу '-ed' до кореня. Наприклад infinitive/simple past/past participle: talk/talked/talked. Неправильні дієслова відповідають або антикварним правилам (sing/sang/sung), або, в деяких випадках, взагалі жодному правилу (go/went). Нові дієслова, які входять в англійську мову, як правило одразу "регуляризуються" (google/googled/googled). Набагато рідше зустрічаються випадки, коли правильне дієслово стає неправильним. Тільки 3% сучасних дієслів є неправильними, причому серед них 10 найбільш вживаних (be, have, do, go, say, can, will, see, take, get). Лінгвісти розробили еволюційну гіпотезу частоти неправильних дієслів: рідкі неправильні дієслова мають тенденцію до зникання більш швидше, тому що вони повільніше вивчаються і швидше забуваються.



Для аналізу взяли 177 старо-англійських неправильних дієслів, з яких вже в середньо-англійські часи залишилось тільки 145 неправильними, а в сучасній англійській лише 98. Частоту вживання слова виражали в одиницях пероду напіврозпаду. (О, будь-ласка, перша лінгвістична перешкода! "Період напіврозпаду" якось коряво розуміється у порівнянні з "half-life"). Як би там не було, період напіврозпаду це ніщо інше як квадратний корінь з частоти вживання дієслова. Висновок виражається у прекрасних круглих числах: дієслово, яке вживається в 100 раз рідше, "регуляризується" в 10 разів швидше. Червоним у таблиці позначено слова, які починали своє існування неправильними, а з часом стали правильними. Видно, що це чітко корелює з вживанністю.

Теорія працює тільки тоді, коли її можна екстраполювати. Якщо розрахунки правильні, то вже до 2500 року в англійській мові залишиться тільки 83 неправильних дієслова. Ну і як ви думаєте? Який наступний кандидат на регуляризацію? It is likely to be wed/wed/wed. Частота вживання 'wed' тільки 4.2 використання на мільйон дієслів, що опускає його на останню щаблину списку сучасних неправильних дієслів. І дійсно, все частіше в деяких випадках це слово вживається як wed/wedded/wedded. Так що зараз у вас ще є останній шанс бути 'newly wed'. The married couples of the future can only hope for 'wedded' bliss.

[identity profile] giggster.livejournal.com 2007-10-11 07:30 am (UTC)(link)
я так розумію, це щось лічноє, да?

[identity profile] progenes.livejournal.com 2007-10-11 07:34 am (UTC)(link)
так. для мене неправильні дієслова це просто каторга якась. Тепер я перестану їх вживати і зроблю праивльними!

[identity profile] progenes.livejournal.com 2007-10-11 07:39 am (UTC)(link)
креацонізм, де я кріейтор!

а ти знаєш, що найбільш частотні слова – найбільш дрєвні, найкоротші, і першими десятьма з них є прєдлогі, а перший іменник десь на 20-му місці ?! Ех, нічого ти не знаєш. І ничим не цікавишся.

[identity profile] kotyhoroshko.livejournal.com 2007-10-11 08:09 am (UTC)(link)
дозвольте і мені приєднатись до вашого загону поборників неправильних слів!

[identity profile] progenes.livejournal.com 2007-10-11 08:20 am (UTC)(link)
ти добре thinked?

[identity profile] kotyhoroshko.livejournal.com 2007-10-11 08:43 am (UTC)(link)
я ці слова ненавиджу ше з ранньої молодості. тому готовий боротись з ними будь-де та будь-коли!

[identity profile] giggster.livejournal.com 2007-10-11 02:21 pm (UTC)(link)
да, я пам'ятаю, як ти fighted з ним.

[identity profile] iozhikov.livejournal.com 2007-10-11 08:59 am (UTC)(link)
Дуже цікаво. Вже бачив зранку цю новину на бібісі, але полінувався читати.

Я не зовсім зрозумів. Остання колонка по суті повторює першу? І в таблиці нема часу, коли слова регуляризувалися, так? Залежність тільки між частотою вживання (в групі) і процентом регуляризації цієї групи. А звідки час?

[identity profile] progenes.livejournal.com 2007-10-11 09:08 am (UTC)(link)
Остання колонка по суті повторює першу? "..період напіврозпаду це ніщо інше як квадратний корінь з частоти вживання дієслова"

[identity profile] iozhikov.livejournal.com 2007-10-11 09:55 am (UTC)(link)
угу

[identity profile] progenes.livejournal.com 2007-10-11 09:15 am (UTC)(link)
(вздихає) решті красівих графіків drawed в ориджінал пейпа

[identity profile] iozhikov.livejournal.com 2007-10-11 09:56 am (UTC)(link)
а, це журнал ще не вийшов?

[identity profile] iozhikov.livejournal.com 2007-10-11 09:56 am (UTC)(link)
чи не прийшов

[identity profile] progenes.livejournal.com 2007-10-11 09:59 am (UTC)(link)
(підказує) там в тексті лінк "Стаття про еволюцію". але у тебе нема підписки (ще раз підказує)

[identity profile] iozhikov.livejournal.com 2007-10-11 09:57 am (UTC)(link)
Цікаво, які параметри взяти в українській мові.

[identity profile] progenes.livejournal.com 2007-10-11 10:00 am (UTC)(link)
ну ось. є над чим поразмисліть? давай! ми вже чекаємо на відкриття еволюційних процесів в українській мові.

[identity profile] 1inuxoid.livejournal.com 2007-10-11 01:27 pm (UTC)(link)
кльово. до речі, це перший пост українською тут. спричинено чимось конкретним?

[identity profile] taras-braga.livejournal.com 2007-10-11 07:42 pm (UTC)(link)
Хм. А мене просто заставила наша авторитарна вчителька з англійської її вивчити, і ця проблема відпала сама собою.

Порівняння розвитку мови і еволюції генів свого часу зробив Станіслав Лем. Мені цу здалось дуже логічним. Він казав шось в Сумі Технологій, шо генотип, — це message надісланий ніким в нікуди :).

[identity profile] maryxmas.livejournal.com 2007-10-25 03:25 am (UTC)(link)
а можна, будь-ласка, точну назву статті і автора?

[identity profile] progenes.livejournal.com 2007-10-25 06:09 am (UTC)(link)
Erez Lieberman, Jean-Baptiste Michel, Joe Jackson, Tina Tang & Martin A. Nowak Quantifying the evolutionary dynamics of language Nature 449, 713-716 (11 October 2007)

[identity profile] maryxmas.livejournal.com 2007-10-25 06:22 am (UTC)(link)
красно дякую.