Лингвисты смогли измерить, насколько семантически близки Солнце и Луна

Фото: Nico Palx /flickr

В новой работе ученые из США, Великобритании и Японии предложили метод количественного измерения взаимосвязей внутри набора общих для множества языков понятий. Результаты их анализа позволили выявить универсальные для различных языков смысловые кластеры, сформированные близкими по значению концептами.

Исследования в области семантики — науки, изучающей значения слов, — могут дать косвенное представление о том, как концепции, выражаемые словами, организованы в человеческом мозге. Однако трудность в проведении анализа связаны с невозможностью однозначно «измерить» или параметризовать значение, которое несет то или иное слово. В новой статье, которая опубликована в журнале Proceedings of the National Academy of Sciences, международная группа ученых предложила универсальную методику для численной оценки семантических отношений внутри набора понятий, общего для множества языков.

В своей работе исследователи описали эмпирический способ оценки семантической близости двух понятий с использованием 81 языка, равномерно представляющих различные группы родства. В основе нового метода лежит свойство полисемии — многозначности — слов, описывающих набор из 22 концептов, которые подбирались из так называемого списка Сводеша. Он представляет собой словарь базовых понятий, используемых для оценки степени родства разных языков. Для своих расчетов ученые взяли концепции некоторых материальных предметов (например, КАМЕНЬ или ПЕСОК), небесных тел (СОЛНЦЕ, ЛУНА), естественных условий (ДЕНЬ, НОЧЬ) и географических особенностей (ГОРА, ОЗЕРО). При этом они избегали использования слов, называющих социальные и родственные отношения, части тела, а также абстрактные понятия.

Для численной оценки степени близости двух концептов в одном языке исследователи строили так называемые взвешенные графы понятий. Два понятия считались взаимосвязанными, если «добраться» от одного к другому можно было через какой-либо другой язык за два шага — прямой и обратный перевод. Количество таких связей определяло степень близости концептов.

Результаты анализа показали, что в целом некоторые понятия более склонны к полисемии, чем другие. Также оказалось, что использованные для расчетов концепты формируют три кластера, внутри которых понятия прочно связаны друг с другом. По значениям кластеры представляли «воду», «твердые природные материалы» и «небо и землю». При этом связи, образованные между представителями разных кластеров, оказались значительно слабее. Статистический анализ показал, что образование подобных семантических структур универсально для языков, принадлежащих к различным языковым группам, и слабо зависит от климата и окружающей среды (в отличие от фонетики — читайте и смотрите материалы «Чердака» об этом) или наличия литературной традиции.

В будущем авторы работы планируют расширить набор изучаемых понятий, а также выяснить, как обнаруженная ими универсальная структура связана со сдвигом значений.
Теги:

Читать еще на Чердаке: