Текст уведомления здесь

Нейросеть научили «переводить» жалобы населения в соцсетях на язык медицины

Новая программа будет искать жалобы на побочные эффекты фармакологических препаратов в социальных сетях.
Добавить в закладки
Комментарии

Российские ученые из КФУ и МФТИ совместно с американскими коллегами обучили нейронную сеть находить и анализировать мнения пользователей социальных сетей о тех или иных эффектах лекарств. Соответствующая статья опубликована в Journal of Biomedical Informatics.

Авторы новой работы использовали последовательное обучение рекуррентных нейросетей, чтобы они могли находить в англоязычных соцсетях упоминания о действии различных лекарственных препаратов и корректно сопоставлять такие высказывания с медицинской классификацией их возможных постэффектов. Например, написанные «народным» языком комментарии из постов с формулировками типа «не могу заснуть всю ночь» или «слегка кружится голова» оцениваются нейросетью как относящиеся к определенным группам, с которыми сопоставлены конкретные медицинские характеристики — «бессонница» и «головокружение» соответственно. (Поскольку работа была поддержана грантом Российского научного фонда, то в ближайшие годы группа планирует перенести технологию на русский язык.)

Несмотря на кажущуюся простоту задачи, она чрезвычайно сложна. Пользователи соцсетей, как правило, не используют стандартную и строгую терминологию, могут писать с орфографическими и синтаксическими ошибками, что часто затрудняет понимание их высказываний даже для других людей.

Чтобы научить программное обеспечение разбирать истинный смысл таких «народных» формулировок, ученые применили искусственные нейронные сети. Это система взаимодействующих между собой простых процессоров, которые называют искусственными нейронами. Сети из таких процессоров не программируются в привычном смысле этого слова, а «обучаются». Им дают входящие данные и обучающую выборку (результаты, которые они должны получить на выходе), а затем находят математические коэффициенты связей между нейронами, при которых входящая информация даст «верную» информацию на выходе. После «обучения» на достаточно большой тренировочной выборке нейросеть сможет выдать правильный результат на основании одних только входящих данных, притом таких, которые отсутствовали в обучающей выборке.

Задавая, с одной стороны, примеры обозначения своего самочувствия пользователями соцсетей после приема лекарств, а с другой стороны — медицинские определения, характеризующие такие состояния, авторы работы добились того, чтобы нейросеть самостоятельно смогла сопоставлять «народные» и «медицинские» определения тех или иных постэффектов от приема лекарств.

Подобный метод может оказаться перспективным не только при сборе данных о проблемах, связанных с приемом тех или иных лекарственных препаратов, но и при фронтальном анализе любых массивов данных из соцсетей, выраженных в виде высказываний на обычном «разговорном» языке, например, отношения к различным партиям и политическим лидерам. Это важно, поскольку объем информации в соцсетях сегодня уже таков, что сортировать ее вручную невозможно даже для большой группы исследователей.

Добавить в закладки
Комментарии
Вам понравилась публикация?
Расскажите, что вы думаете, и мы подберем подходящие материалы