Исследователи из Института математики и фундаментальной науки Сибирского
федерального Университета (СФУ) совместно с коллегами из Тувинского
государственного университета и научно-образовательного центра
"Тюркология" Республики Тыва изучили тувинские фольклорные
произведения с помощью алгебраического метода формального анализа понятий,
сообщила в пятницу пресс- служба СФУ.
Исследование показало, что таким образом можно автоматически определить
жанр произведения, а также авторство и пространственно-временной период его
написания.
Анализ формальных понятий - это один из алгебраических методов анализа
данных в котором каждый объект описывают через его основные признаки. В новой
работе исследовался национальный корпус тувинского языка, собранных из
оцифрованных художественных-литературных произведений, а за признаки были взяты
сюжеты, зачины, основные языковые клише и многие другие характеристики
произведений.
Дальше каждому произведению была сопоставлена таблица, фиксирующая наличие
тех или иных признаков, а для всего эпоса в целом была составлена так
называемая решетка формальный понятий - схема, показывающая глобальные
взаимосвязи между различными признаками. "Благодаря такой формализованной
модели все произведения эпоса можно автоматически классифицировать на семантическом,
то есть качественном уровне", - говорится в пресс-релизе.
"Человек познает мир через понятия, то есть определяет объекты,
выделяет для них существенные признаки и на их основе классифицирует и
систематизирует реалии окружающего его мира. Анализ формальных понятий
представляет собой познание сути вещей при помощи математики. Однако чтобы
получить достоверные и устойчивые знания, необходимо использовать большой объем
данных. И здесь математики сталкиваются с "проклятием размерности" -
чтобы проанализировать необходимый объем данных, не хватит человеческой
жизни", - приводятся в пресс-релизе слова руководителя исследования,
профессора кафедры Высшей и прикладной математики Валентина Быкова.
Оптимизация алгоритмов
Подобные задачи сложны с этой точки зрения даже для компьютеров - к
примеру, работа с моделью на ста признаках, по словам ученых, может потребовать
миллионы лет вычислений. Однако, российские исследователи смогли оптимизировать
свои алгоритмы и теперь искусственный интеллект может анализировать
произведения эпоса гораздо быстрей. Научная статья с последними результатами их
работы опубликована в "Журнале СФУ. Математика и физика".
Исследователи отмечают, что "возможность разложить по полочкам"
фольклорные тексты, поможет не только в изучении тувинского языка, но и станет
хорошим подспорьем в работе переводчиков и поможет изучению и сохранению
этнокультурного наследия Республики Тыва. Сейчас интерпретацией построенных
математических моделей занялись филологи и лингвисты научно-образовательного
центра "Тюркология".
Также аналогичные исследования российских ученых, посвященные тюркоязычным
текстам, заинтересовали математиков и лингвистов Национального университета
Узбекистана им. М. Улугбека.
|