Искусственный язык для естественного интеллекта

Языки на грани вымирания

Сегодня в мире насчитывается 3–5 тыс. языков. Более точную цифру указать нельзя, ведь зачастую различия между диалектами, наречиями и разными языками весьма условны. Самым распространенным считается пекинский диалект китайского языка – на нем разговаривают 874 млн. человек. За ним в порядке убывания следуют хинди (366 млн.), английский (341 млн.), испанский (258 млн.), бенгали (207 млн.), португальский (176 млн.), русский (167 млн.), японский (125 млн.), немецкий (100 млн.). Место украинского языка в этом списке – в конце второго десятка. Пока украинский, по мнению ученых, в полной безопасности, а множеству других, не столь распространенных языков, угрожает серьезная опасность.

По прогнозам исследователей, в ближайшие 100 лет могут исчезнуть 60–90% всех мировых языков. Чтобы язык жил и развивался, число его носителей должно быть не меньше 1 млн. Примерно для половины мировых языков этот показатель составляет порядка 2–5 тыс., а языками, которые находятся на грани вымирания, постоянно пользуется менее 100 человек.

Возродить или создать?

В начале ХХ века обнаружили рукопись Исаака Ньютона «О всеобщем языке», в которой тот разрабатывал язык с тонкой и сложной грамматикой.

Справедливости ради стоит заметить, что есть и обратный процесс – возрождение мертвых языков. К примеру, в 1777 году умер последний носитель языка корниш (кельтский язык, на котором говорили в Корнуэльсе). Однако язык удалось оживить, и сейчас им владеют почти 2 тыс. человек. Но, конечно же, самый яркий пример успешного возрождения – это иврит, священный язык иудаизма. Почти 2000 лет он использовался только для религиозных церемоний и наряду с латынью и древнегреческим считался мертвым. Однако его удалось восстановить, и сегодня на иврите общаются примерно 5 млн. человек.

Параллельно с возрождением древних языков не прекращаются попытки создать новый, не имеющий исторических корней. Еще в 1629 году философ Рене Декарт сказал, что нужен новый простой язык, азы которого можно было бы постичь после шести часов работы. В начале ХХ века обнаружили рукопись Исаака Ньютона «О всеобщем языке», в которой тот разрабатывал язык с тонкой и сложной грамматикой.

Подсчитано, что до начала XX века было предложено около 70 проектов искусственных языков, каждый из которых преследовал свои цели. К примеру, знаменитый эсперанто, по замыслу создателей, должен был стать единым языком международного общения. А эбоникс, разработанный лингвистами США лет 20 назад, предназначался для адаптации сленга афроамериканцев к общеупотребительному английскому языку. Впрочем, эти примеры скорее исключение из правил. В большинстве случаев создатели искусственных языков ставили другую задачу – изменить сознание человека.

Сколько слов нужно человеку?

В современном украинском языке около 256  тыс. слов, в немецком – 185 тыс., во французском – 100 тыс. Однако при всем богатстве языка в повседневном общении человек использует лишь малую их часть. Специалисты установили, что для разговорной речи нам вполне достаточно всего 2–3 тыс. слов. Но и это еще не предел.

В 2001 году был разработан язык токи пона, в котором всего 118 слов. Он основан на философии даосизма и призван освободить мышление от лишних слов, сделать человека мудрее и научить его проще относиться к жизни.

Конечно же, двусмысленности в токи пона неизбежны. Говоря на этом языке, человек уделяет внимание лишь главным характеристикам вещей, не вдаваясь в подробности. Токи пона – контекстный язык, то есть в каждом конкретном случае он определяет лишь то, что имеет критическое значение для понимания. Абстрактные семантические конструкции в нем заменены на простые и неделимые единицы смысла. Вместо того, чтобы сказать «учить», говорят «давать знание», вместо «здоровье» – «хорошее тело» и т. д. Этот язык достаточно популярен, на него переводят художественные произведения, на нем пишут стихи, составляют энциклопедии. Приверженцы токи пона утверждают, что, выучив его, открыли для себя глубинный смысл вещей, скрытый за запутанными конструкциями обычных языков.

По рзелульаттам илсследований одного английсокго унвиертисета, не иеемт занчнеия, вкокам пряокде рсапожолена бкувы в солве. Галвоне, чотбы преавя и пслоендяя бквуы блыи на мсете. Осатьлыне бкувы мгоут селдовтаь в плоонм бсепордяке, все рвано ткест чтаитсея без побрелм. Пичрионй эгото ялвятеся то, что мы не чиатем кдаужю бкуву по отдльенотси, а все солво цликеом.

Опыт тибетских монахов

Примерно такой же подход использовали монахи Тибета еще в VIII–IX веках. В то время там начал укореняться буддизм, но тибетский язык был не столь развитым, как санскрит, и переводить сакральные тексты оказалось проблематично. Тогда монахи придумали хитроумную систему: один язык они как бы «вписали» в структуры другого. Слово на санскрите делили на составные части, переводили каждую из них на тибетский и затем складывали слово вместе. Такое сложное слово было понятно жителям региона и исключительно точно передавало смысл оригинала. «Конечный продукт» такого преобразования прижился и, в отличие от многих других церковных языков, стал средством общения.

С точки зрения логики

Специалисты в сфере психолингвистики стремятся создать абсолютно логичный язык, в котором исключены все двусмысленности и неоднозначности. Наибольшего успеха в этом деле добился американец Джеймс Кук Браун, который в 1960 году разработал логлан. На протяжении последующих 10 лет этот язык был очень популярен. До сих пор им владеют около 1,5 тыс. человек, он используется в некоторых компьютерных программах автоматического перевода.

Предполагалось, что логлан поможет людям мыслить гораздо логичнее, правильнее и быстрее. Эта гипотеза частично подтвердилась. Изучив логлан, люди начинали употреблять богатые и странные метафоры, часто придумывать неологизмы, остро подмечать неоднозначности и неточности, свойственные речи. Однако принципиальных изменений в их сознании не обнаружено. Вероятно, это связано с тем, что у всех выучивших логлан он был не основным, а, как минимум, вторым после родного.

Еще одна возможная причина неудачи заключается в том, что для ускорения мышления недостаточно только оптимизировать язык, исключив из него все двусмысленности, как было сделано в логлане. Необходимо также сократить количество слов для выражения мыслей.

Со скоростью мысли

Чтобы ускорить процесс мышления, язык должен быть очень компактным, позволяющим уместить в нескольких словах то, на что обычно требуется 1–2 предложения. И такой язык есть – с 1978 года американский лингвист Джон Кихада разрабатывает ифкуил, особенность которого как раз и заключается в сверхкомпактности. Всего лишь одно слово на ифкуиле может передать мысль, для выражения которой понадобилось бы 15–20 слов английского языка. Ифкуил имеет азбуку, грамматику, словарь (около 4 тыс. слов), синтаксис, морфологию и фонетику. Однако, поскольку его описание опубликовано лишь в апреле 2004 года, людей, умеющих разговаривать на нем, еще нет (разумеется, кроме самого автора). Пока можно только гадать, какие результаты даст изучение ифкуила. Но если расчеты Джона Кихада верны, его детище способно повысить скорость мышления в несколько раз.

язык
Сегодня в мире насчитывается 3–5 тыс. языков. Более точную цифру указать нельзя, ведь зачастую различия между диалектами, наречиями и разными языками весьма условны.

От восприятия к пониманию

Измеряя электрические потенциалы человеческого мозга, ученые узнали, как он воспринимает грамматические и семантические категории языка. На первом этапе мозг делит языковой сигнал на составные части, например, при чтении разбивает слова на буквы, предложения – на слова и пр. Параллельно он анализирует, насколько часто встречается в языке то или иное слово, словосочетание или синтаксическая конструкция. Это очень важная характеристика, влияющая на многие процессы восприятия речи. Установлено, что мозг быстрее опознает слова, которые лучше известны человеку.

На следующем этапе фраза или предложение заносится в рабочую (кратковременную) память. Теперь мозг должен установить, как разные слова соотносятся друг с другом. Нагрузка на рабочую память существенно возрастает, если человеку приходится иметь дело со сложными предложениями или неверными грамматическими формами (например, несоответствием падежей или времен, нарушением логических связей).

И, наконец, на заключительном этапе мозг устанавливает смысл высказывания или текста. Слова являются знаками, а связь между формой и содержанием формируется произвольно, на основе жизненного опыта каждого человека. К примеру, слово «яблоко» включает в ассоциативный ряд множество характеристик: форма, цвет, запах, вкус, гладкость, упругость и т.д. Значит, мозг должен не только опознать само слово, но и проанализировать контекст, обратиться к долговременной памяти и найти значение, соответствующее данной ситуации. Весь этот сложный поэтапный процесс занимает лишь доли секунды, но, тем не менее, по убеждению создателей новых языков, требует оптимизации.

Языки эльфов и инопланетных рас

Джон Рональд Роуэл Толкин в трилогии «Властелин колец» сконструировал сразу несколько языков с алфавитами, словарями и правилами грамматики.

Не устояли перед искушением разработать собственный язык и многие писатели. Так, Джордж Оруэлл в романе-антиутопии «1984» придумал новояз, с помощью которого тоталитарное государство управляло сознанием своих граждан.

Профессиональный филолог Джон Рональд Роуэл Толкин в трилогии «Властелин колец» сконструировал для Средиземья сразу несколько языков с алфавитами, словарями и правилами грамматики. С его легкой руки появилось два языка эльфов, квэниа и синдарин, язык гномов и «темное наречие» орков. Почитатели Толкина не оставляют надежду изучить эти языки и достигают некоторых успехов.

Еще один выдуманный язык – клингон – подарило нам телевидение. Им пользуется одна из инопланетных рас американского телесериала «Звездный путь». Для создания клингона компании «Парамаунт» пришлось воспользоваться услугами профессионального лингвиста. Благодаря стараниям фанатов этого сериала существует Институт изучения клингона, его виртуальный словарь постоянно пополняется новыми словами, а в Австралии перевели на клингон несколько пьес Шекспира.

Прокрутить вверх