Какой язык имеет самый большой словарный запас. Языковые рекорды. Откуда тогда взялся миллион

В Оксфордском словаре в четыре раза больше слов, чем в БАСе - Большом академическом словаре русского языка. "Великий и могучий" полон английских заимствований. Школьники перестали понимать Пушкина. Что происходит с русским языком? Рождает ли он новые слова? Почему наши словари такие тонкие? На эти вопросы "РГ" отвечает один из авторов Большого академического словаря русского языка - знаменитого БАСа Людмила Кругликова.

Как считают словарный запас? Почему Оксфордский словарь такой толстый?

Людмила Кругликова: Лингвисты избегают такого рода сравнений между языками и словарями. У каждого своя специфика. Скажем, в Вебстеровский словарь в качестве самостоятельных статей включаются символы, например, химических элементов: B (бор), Ba (барий), Be (бериллий), Br (бром) и так далее, сокращенные наименования мер длины, веса, объема: km (километр), kg (килограмм), bbl (баррель)... Мало того, толковые словари английского языка начали включать символы обозначений размеров листов бумаги: А3, А4, А5, а также, например, символ @.

Поэтому вывод о бедности русского языка и богатстве английского на том основании, что Большой академический словарь русского языка (БАС), который начал выходить в 2004 году (опубликовано 22 тома из предполагаемых 33), будет содержать 150 000 слов, а Оксфордский (Тhe Oxford English Dictionary, сокращенно OED) - 600 000, не что иное, как обман. БАС отражает лексику только современного литературного языка, а Оксфордский словарь - слова всех разновидностей и всех вариантов (американского, канадского и т.д.) английского языка начиная с 1150 года, включая мертвые.

А сколько слов в русском языке, если считать по-английски?

Людмила Кругликова: Если мы добавим к 150 000 слов современного русского литературного языка, например, еще и диалектные слова, то получим уже 400 000 слов...

Как объяснить тот факт, что один из самых известных английских словарей Вебстеровский стал резко худеть, и время "похудения" пришлось на Вторую мировую войну и начало "холодной"?

Людмила Кругликова: Не стоит искать в лингвистических процессах какую-то политику. Вебстеровский словарь, появившийся в 1909 году, содержал 400 000 английских слов. В его втором издании (1934 год) содержится 600 000 слов, в третьем (1961 год) - 450 000 слов. На основании этого можно заявить, что с 1934 года началось катастрофическое вырождение английского языка. А причина таких резких скачков всего лишь в том, что у второго и третьего изданий были разные редакторы, а у них разные принципы подхода к отбору слов.

На сайте издательской фирмы Merriam-Webster сказано: "Считается, что словарь английского языка включает примерно миллион слов". Это честная цифра?

Людмила Кругликова: Большинство лингвистов восприняло такую оценку с долей юмора, а некоторые сказали, что они не были бы удивлены, если бы он оценивался в четверть миллиона.

Откуда тогда взялся миллион?

Людмила Кругликова: Начиная с 2006 года некто Дж. Дж. Паяк, специалист по маркетингу и аналитике, основатель компании Global Language Monitor неоднократно заявлял о том, что скоро будет зафиксировано миллионное слово английского языка. Таким словом стало, по версии Паяка, "Web 2.0", которое является техническим термином. Кстати, уже есть и Web 3.0, а в Сети идет речь о скором появлении Web 4.0, Web 5.0. Если включать все подобные образования, то скоро можно будет говорить о миллиардном слове английского языка.

Как англичане и американцы относятся к таким сенсациям?

Людмила Кругликова: Приведу высказывание Нунберга, лингвиста из Школы информации в Калифорнийском университете в Беркли: "Наше восхищение необъятностью английского языка возникает из своего рода лингвистического империализма - ощущения, что "наши словари больше, чем их словари". Но это на самом деле не делает нас сколь-либо богаче лингвистически".

Но и среди исследователей "великого и могучего" есть лингвистические пессимисты, которые считают, что корни русского языка "бесплодны": не рождают новых слов, а большинство неологизмов имеет иностранное происхождение...

Людмила Кругликова: Лингвист и философ Михаил Эпштейн утверждает, что в XIX веке было 150 слов с корнем "люб", а наши современники знают в три раза меньше. Между тем в "Словообразовательном словаре русского языка" Тихонова, насчитывающем около 145 000 слов современного русского литературного языка, имеется 310 слов с корнем "люб". А если считать начиная с первых памятников письменности, то получится 441 слово. В английском языке, по данным OED, только 108 лексем с аналогичным корнем (love) в начале слова.

Новые слова "про любовь" современные россияне производят?

Людмила Кругликова: В начале ХХ века появилось существительное "книголюб", а затем "природолюб", "однолюбка", "любовь-игра", "любовь-ненависть", "любовь-морковь", "безлюбье". При беглом просмотре я насчитала не менее 40 слов с корнем "люб", которые появились в XX - начале XXI века. В английском языке с корнем (love) только пять единиц вошло в язык в ХХ веке (с 1907 по 1989 год), а после этого времени ни одной.

Насколько активны сейчас наши соотечественники в политическом словотворчестве?

Людмила Кругликова: В этом отношении весьма интересно читать комментарии в Интернете. События на Украине вызвали к жизни такие лексемы, как майдауны, майданутые, онижедети, укры, укропы, псакинг, Фашингтон, Гейропа и другие. Приживутся они или нет, покажет время.

Наши депутаты периодически восстают против заимствований. Где их критический предел в языке? 70% - катастрофично?

Людмила Кругликова: По подсчетам лингвистов, во втором издании Вебстеровского словаря только 35% исконных английских слов, остальные 65% - заимствования. Но пока ничего катастрофического не случилось. Русский язык действительно испытывает большое влияние английского. Но обогащение его англицизмами наблюдается прежде всего в сфере необщенародной лексики, среди которой преобладают термины из области спорта, компьютерного дела, экономики, финансов. Плохо, если они начинают влиять на структуру языка. С русским этого не происходит. Иноязычные слова подстраиваются под систему, заимствованные корни обрастают русскими аффиксами, например: постить, смайлик, океюшки, лайкать и даже облайканный.

За 10 лет работы над БАСом сделано 22 тома - это две трети работы. Вас не упрекают за медлительность?

Людмила Кругликова: Над БАСом работают 5 штатных лингвистов, 3 совместителя и несколько сотрудников издательства. В год выходит в среднем по два тома. Над Оксфордским словарем работают 78 лингвистов, 46 внештатных сотрудников, а также 200 консультантов, штат программистов, маркетологов. Когда в нью-йоркском офисе Оксфордского словаря узнали о наших темпах работы мизерными силами, то план работы их сотрудников увеличили, а главного редактора отправили на пенсию.

Согласно устоявшемуся мнению, слово можно охарактеризовать как совокупность букв, находящуюся между двумя пробелами. Но если взять, к примеру, язык гренландских эскимосов, то в нем считается целое предложение. Есть проблемы и в менее экзотических языках. К примеру, чешский язык предполагает слитное написание частицы «не» с , в турецком языке данное отрицание находится в центре слова. Таким образом, по нашим правилам получается, что каждое слово с находящимся в нем отрицанием стоит считать отдельно.

Возникает вопрос: как быть со словами, имеющими различные окончания (к примеру, «красивый», « », «красивое»), а также омонимами - например, замок как строение и замок как устройство? Можно ли засчитать как отдельные слова – КВН, КГБ, ОВД и т.п.? В каждом языке существует десятки тысяч подобных подвохов.

Еще более каверзными являются вопросы, касающиеся того, что именно считать языком. Могут ли различные говоры и диалекты относиться к отдельным языкам или это основного? Например, в Африке и Европе часто случается так, что невозможно сразу определить, какой язык для отдельно взятого диалекта является основным. Да и можно ли однозначно утверждать, к какому из языков относятся некоторые слова? К примеру, «атаман» или «хата» – это украинские или все же русские слова? К какому языку можно отнести слова «сайт», «сервер», «провайдер» – русскому, английскому, немецкому или всем сразу?

Поэтому стоит ограничиться лишь общими подсчетами, не претендующими на научность. Что касается русского языка, то в нем, по мнению лингвистов, содержится около 500000 слов. Это число приблизительное и не включает в себя специальных научных терминов. Зато здесь имеются устаревшие, заимствованные из других языков, сложные слова, ласкательные, уменьшительные формы и другие. Если обратиться к авторитетному Большому академическому словарю, состоящему из семнадцати томов, то в нем окажется 131 257 слов. Однако следует учитывать, что годом его издания является 1970, а русский язык за последние 40 лет претерпел множество изменений и значительно обогатился такими понятиями, как, например, «перестройка», «интернет» и т.д.

Что касается английского языка, по данным мониторинга Global Language Monitor, в 2009 году число слов превысило в нем цифру в один миллион и продолжает увеличиваться. Причем миллионным словом стало «Web 2.0». По данным авторитетных словарей, английский язык также опережает русский. Например, в 3-ем издании Вебстеровского словаря содержится 450000 слов, в Оксфордском – примерно 500000.

Особый интерес представляют иероглифические языки, в которых отдельным символом обозначается не буква, а целое слово. В этом случае прямые сравнения вовсе невозможны. Однако если провести сравнение по словарям, такие языки, к всеобщему удивлению, сильно проигрывают. Например, в наиболее полном японском словаре содержится 50000 иероглифов. Но Министерство просвещения Японии утвердило для повседневного использования лишь 1850 иероглифов. Китайский язык содержит около 80 тысяч иероглифов. Но реально здесь также используется намного меньше. Утвержденный в 1981 году госстандарт «Основной набор иероглифов» включает 6763 иероглифа.

В количественные лидеры неожиданным образом попадает итальянский язык. В нем все составные числительные пишутся прописью слитно, в одно слово. Числовой ряд, как известно бесконечен, поэтому получается бесконечным и количество слов итальянского языка.

Спорить о том, какой же язык самый богатый и самый красивый, любят не только филологи. Разумеется, для каждого человека его родной язык будет самым лучшим, самым прекрасным и, конечно, самым уникальным.

Не существует правил, по которым мы могли бы определить, какой язык наиболее благозвучен и совершенен. Однако почти в каждом есть свои особенности, которые отличают его ото всех остальных и дают немало поводов для гордости народу, который на нем изъясняется. В этой статье я попытаюсь лишь немного показать, насколько же разнообразна языковая карта планеты. В дальнейшем к этой теме я буду возвращаться не раз, ведь каждый язык обладает какой-то удивительной чертой, благодаря которой его можно считать рекордсменом в той или иной области.

И начать рассказ можно как раз с самого простого - с количества слов в языке.

Что касается богатства словарного запаса, то здесь лидирующие позиции занимает греческий язык: в нем насчитывается 5 миллионов слов. В английском языке, например, содержится всего лишь около полумиллиона слов. При этом мы вряд ли станем называть английским «бедным». Так может сказать лишь тот, кто не знаком с классической литературой, созданной на английском, и понятия не имеет о том, насколько «ёмким» является этот язык. Многие, скорее всего, согласятся с тем, что лучший способ определения «богатства» языка - это его выразительные возможности. А здесь не так много языков, способных сравниться с русским и немецким. Разве не так?

Теперь обратимся к «бедным» языкам. А знали ли Вы, что язык таки, распространенный в некоторых частях Французской Гвинеи, содержит всего лишь 340 слов? Но даже с таким скромным словарным запасом люди умудряются неплохо общаться между собой.

В книге рекордов Гиннесса по ясным причинам отсутствует категория «самый красивый язык», но вместо неё есть множество других языковых рекордов, которые способы удивить любого. Например, самым длинным из существующих ныне алфавитов считается абазинский (в мире, кстати, используется 65 алфавитов). В нем всего 82 буквы. Камбоджийский алфавит лишь немногим уступает ему: он состоит из 74 букв. За ним следует кхмерский алфавит, содержащий 72 буквы. Самый короткий алфавит обнаруживается в языке ротокас с острова Бугенвиль (Папуа-Новая Гвинея). В нем лишь 11 букв. А в гавайском алфавите всего на одну больше - 12.

Самый ранний образец алфавитного письма был найден в Угарите (ныне Рас-Шарма, Сирия). Он датируется приблизительно 1450 годом до н.э. и представляет собой глиняную табличку с нанесенными на нее 32 клинообразными буквами.

Самой древней буквой считается «о». Она осталась неизменной в том же виде, в каком она была принята в финикийском алфавите (около 1300 г. до н.э.).

В английском и венгерском языке самой распространенной считается буква «Е» .

Буква «Q» используется реже всего в современных европейских языках (исключение составляет французский).

В эскимосском языке более 20 синонимов слова «снег», и еще множество слов, обозначающих оттенки белого цвета. Также в нем существуют 63 формы настоящего времени, а простые существительные имеют 252 флексии.

Жители Папуа Новой Гвинеи разговаривают примерно на 700 языках (это составляет около 10 процентов от всех языков мира). Ко всему прочему среди этих языков существует множество местных диалектов, которые используются для общения друг с другом соседних деревень.

Язык североамериканских индейцев чиппева содержит наибольшее количество глагольных форм (их около 6000). В другом языке аборигенов Северной Америки - хайда - используется 70 префиксов, что тоже является рекордом.

В табасаранском языке, распространенном на территории Дагестана, существует 48 падежей существительных (в венгерском, например, их всего 24, а в русском - 6).

В турецком языке всего один неправильный глагол - olmak («быть»), а в английском таких глаголов 283.

В русском, немецком и румынском языке есть три рода, во французском, датском и шведском - два, в финском и венгерском - один, а вот в языке австралийских аборигенов диирбалу - четыре: мужской, женский, средний и съедобный.

Наибольшее количество согласных звуков (80-85) содержится в убыхском языке (абхазо-адыгская группа кавказской семьи), наименьшее - 6 - в языке ротокас (да, да, в том самом, чей алфавит считается самым коротким).

Гласных звуков больше всего в языке седанг (Центральный Вьетнам) - 55, а меньше всего - в абхазском (их только 2).

Самым распространенным звуком является гласный «а» - не существует языка, в котором бы его не было. Существуют языки, где «а» имеет разные степени долготы (словацкий, венгерский и т.д.).

Самым редким признан чешский звук, представляющий собой слитно произносимые «р» и «ж» - [рж]. Даже ближайший родственник чешского языка, словацкий, не может похвастаться этим звуком. Интересно отметить и то, что в чешском языке «рж» является одним из основных звуков: без него невозможно произнести такие традиционные народные имена как «Йиржи», «Пржемысл» и т.д.

В южных бушменских языках существует ещё один редкий звук - своеобразный щелчок языка. Был изобретен даже специальный знак для изображения его на письме.

В японском языке отсутствует привычный для европейцев звук «л». И при этом японский по праву называют одним из самых мелодичных языков на планете.

Наибольшее количество значений имеет английское слово set (58 значений как существительное; 126 как глагол; 10 как прилагательное, образованное от причастия). И разве можно после этого отказать носителям английского языка в практичности?

Если обращаться к азиатским языкам, то они кажутся и вовсе «сотканными» из рекордов. Например, в китайском языке, где нет ни спряжений глаголов, ни времен, существует огромный словарный запас. И, конечно, как и полагается языку, история которого насчитывает не одно тысячелетие, китайский может гордиться удивительной письменностью. В 40-томном словаре китайского языка «Чжунвэнь дацзидянь» содержится всего 49.905 иероглифов. Фонема [i] в IV тоне имеет 84 значения, и среди них попадаются такие как «одежда», «икота» и «вшивый». В письменном языке существует 92 иероглифа для обозначения слога [i] в IV тоне. Самым сложным является иероглиф [се] - «болтливый», состоящий из 64 черт. Однако в наше время он фактически не используется. Из распространенных в данный момент самым сложным является иероглиф «нан». Он содержит 36 черточек и означает «заложенный нос». И если вдруг Вы решитесь отправиться в китайскую аптеку с жалобами на насморк, Вы имеете все шансы изобразить на бумажке этот самый иероглиф. И тогда Вас уж точно поймут!

Кстати, наречие мандарин китайского языка - самый используемый язык в мире, на нем общаются более 885 миллионов человек. Испанский занимает второе место (332 млн.), английский - третье (322 млн.), а язык бенгали - четвертое (189 млн.) Кстати, русский в этом списке находится на 7 месте (170 млн.) и является самым распространенным языком в Европе.

На африканском континенте насчитывается более 1, 000 разных языков. У языка берберов в Северной Африке нет письменной формы. А африкаанс, известный как бурский язык, считался до начала 20го века диалектом голландского. И ещё этот язык не имеет никаких родственных связей со своими африканскими соседями и принадлежит к западногерманской группе языков. Уникальный случай, не правда ли?

Некоторые лингвисты также полагают, что латинский язык вовсе не перестал быть разговорным, он всего лишь претерпел небольшие изменения. Самый близкий родственник латыни - кастильский язык. По некоторым данным с ним может соперничать окситанский и сардинский. Все эти языки настолько похожи на латынь (даже итальянский отличается от своего дальнего предка куда больше, чем они), что можно поверить в то, что язык древних римлян живет и по сей день. Латынь, кстати, признана «самым живым из мертвых языков». Её изучение обязательно во многих странах мира не только для филологов, но и для историков. Вынуждены разбираться в латинской терминологии также медики. И не только они. В тайны латинской грамматики проникают и просто заинтересованные лица.

В мире около 5-6 тысяч языков, и каждый месяц умирает около двух.... Языки исчезают и появляются. И каждый из них интересен. Рассказать о любопытных особенностях некоторых из них было бы полезно хотя бы для того, чтобы лучше понять, насколько ценен тот язык, на котором говорите именно Вы и который Вы любите.

Куркина АнаТеодора

Я считаю, что в нашем современном мире очень сложно обойтись без средств коммуникации. А ведь в далеком прошлом общение между нами, людьми, отличалось от общения между животными только наскальными рисунками. Я часто задумываюсь над тем, что самое большое приобретение цивилизации - это слово и речь в частности.

Поиск языка-рекордсмена по количеству слов

В малоразвитых народах Африки современные языки насчитывают до четырёхсот слов, нужно ли говорить о письменности? Стоит напомнить, что среднестатистический житель ведущих стран мира за всю свою жизнь изучает около 100 000 и активно использует примерно 15–50 тысяч.

Покопавшись немножечко в цифрах официальных источников, я нашла ответ, который довольно не очевиден, но оставим самое вкусное на потом.

Восточные языки

Да, я сразу подумала о дальних странах и множестве мудреных иероглифов в языках, например в:

  • японском филологи насчитывают до 120 000 отдельных слов;
  • китайском - этот азиатский язык насчитывает около 500 000, включая диалектные;
  • корейском - ну тут совсем мало, лишь 100 000.

Малейшая палочка или помарка в корне меняет суть целого предложения, которое может вместиться в символ. Поэтому для тех регионов каллиграфия ну очень важна.

Самым обширным из них, как мы видим, является китайский. Простые носители этого языка используют примерно 5 000 иероглифов.

Я не удовлетворилась таким результатом и пошла искать дальше.

Русский

Как настоящий патриот, я сразу подумала о своём изящном и красочном языке, цитируя великого классика: «Я русский бы выучил только за то, что им разговаривал Ленин». Но может ли родной певчий тягаться количеством слов, например, с тем же китайским? Увы, но словари с филологами говорят, что не может: дальше двухсот тысяч не насчитали.

Английский

« Интернациональный язык должен быть самым полным, чтобы все люди в мире однажды смогли понять друг друга!» - дошло до меня.


Он опережает предыдущего претендента на сей титул аж вдвое! Да-да, он насчитывает в себе более миллиона слов при том, что каждый день впитывает в себя приблизительно пятнадцать новых . Как приятно изучая его, каждый раз расширять свой диапазон знаний и осознавать, что ему еще есть чем меня приятно удивить! Но сердце подсказало, что это не предел и я продолжила копаться дальше.

Итальянский

В Неаполе у Королевского дворца на экскурсии гид как-то упомянул, что теоретически самый богатый в мире язык - итальянский. Это все из-за того, что все составные числительные прописью пишут слитно . А это значит, что слова попросту невозможно сосчитать , так как числовой ряд бесконечен.


Но можно ли разговаривать с помощью одних лишь чисел? Да, если присвоить каждому слову порядковый номер, например. Будет ли это удобно? Нет. Посему утоляем жажду познаний дальше.

Арабский

Уж этот язык является безоговорочным лидером, так как слов насчитывает целых шесть миллионов! Кто бы мог подумать, что именно он из ныне живых языков самый красочный и огромный. Вот уж есть где разгуляться внутреннему рассказчику! Язык бесплодных песчаных дюн и роскошных дубайских построек так и чарует своим восточным шармом с первых слогов.

Хороших слов в хорошем языке должно быть много!


В каком языке больше слов? В основном, интересует русский и английский языки, стандартная лексика (без устаревших слов и специальн

Здравствуйте, Юрий!
Для всех людей ответ разный. У нас русский, это родной язык. Мы его знаем лучше, чем например британцы. А английский мы знаем хуже чем они. нам кажется, что в русском языке больше слов.Я вот полазила по иинтернету.

"Приступая к изучению языка, важно знать, насколько он распространен. Возможны 2 критерия: (а) количество людей, для которых тот или иной язык является родным; (б) число людей, владеющих данным языком на уровне родного или близко к этому.
По критерию (а) в реальном мире уверенно лидирует китайский язык (около миллиарда носителей, включая отклонения от стандартного пекинского/"мандаринского" варианта, иногда рассматриваемые как отдельные языки). Следом идут английский и испанский (по 400 млн), хинди (320 млн), арабский (260 млн), бенгальский (210 млн), португальский (190 млн), русский (160 млн), японский (120 млн), немецкий (100 млн), французский (90 млн), пенджабский, яванский, вьетнамский и индонезийский (по 80 млн), корейский, тамильский, маратхи, телугу и урду (по 70 млн), фарси (персидский), турецкий и итальянский (по 60 млн). На 21 перечисленном языке говорит 4 млрд человек - 64% населения планеты.”
Но эта статиска людей, но не слов. Но я думаю, по этой статистике тоже много можно судить.

"Хотя Британский совет прогнозирует, что к 2015 году по-английски заговорит почти полмира, налицо признаки утраты английским языком его главенствующей роли. Перепись населения США 2000 года показала значительный рост числа американских граждан, которые дома говорят не на английском, а на других языках. 47 млн американцев старше 5 лет - 1/5 населения США за вычетом маленьких детей - дома не говорят по-английски. Произошел также резкий скачок числа американцев, которые считаются "лингвистически изолированными" из-за ограниченного владения английским: почти 12 млн человек живут в семьях, в которых ни один взрослый не владеет английским на достаточном уровне для того, чтобы свободно общаться с продавцами, врачами или полицией. "

"13 апреля 2006 года число слов в английском языке составило 988 тысяч 968 . С учетом скорости словообразования, который рассчитала американская лингвистическая компания Global Language Monitor (GLM), миллионный рубеж будет преодолен уже летом текущего года, отмечает британская газета The Independent.
Расчеты GLM состоят из двух частей. Первая - это учет всех слов, занесенных в общепринятые словари английского языка - Oxford English Dictionary, Merriam-Webster"s, Macquarie"s. Одно только третье издание Merriam-Webster"s включает свыше 450 тысяч слов. Вторая часть работы GLM - это подсчет новых образований в языке при помощи специального алгоритма (Predictive Quantities Indicator). Этим алгоритмом его создатели пользуются при анализе СМИ (бумажных и электронных), новейшей печатной продукции, включая научно-техническую литературу, и блогов, постоянно растущего корпуса частных записей, доступного для всеобщего обозрения в интернете. "

" До 20 процентов слов, учтенных GLM, происходят из "гибридных" вариантов английского языка, которые используются в Китае и Японии ("Chinglish" и "Japlish", соответственно). Среди них можно встретить такие находки, как "drinktea", что значит "закрыто", и "torunbusiness" ("открыто"). Кроме того, в словник GLM попали и "бушизмы" (неологизмы американского президента), например, "uninalienable" and "misunderestimate". "

"Древний или классический английский язык насчитывал около 60 тыс. слов. В частности, в произведениях Вильяма Шекспира встречается 25 тыс. слов. Две тысячи из них были привнесены в современный ему язык самим поэтом.
К этому можно добавить, что английский язык сегодня используется почти во всех странах мира, а число говорящих на нем составляет более полутора миллиардов человек."

Похожие публикации