Текст уведомления здесь

Нижегородские ученые помогли компьютеру найти эмоции в речи

Сотрудники факультета информатики, математики и компьютерных наук Нижегородского филиала ВШЭ разработали на основе сверточной нейронной сети глубокого обучения с архитектурой VGG-16 автоматическую систему, способную определять, какие эмоции слышатся в гол
Добавить в закладки
Комментарии

Распознавать речь вычислительные устройства умеют давно. Однако одна и та же фраза может иметь различный смысл в зависимости от того, с какой интонацией была сказана. При этом компьютеры пока практически не способны вычленять эмоции в голосе, так как с точки зрения программирования не вполне понятно, с какой стороны подходить к этому вопросу.

Нижегородские исследователи решили преобразовать эту задачу в более простую и хорошо разработанную — распознавание изображений. Они предъявляли нейронной сети не сами записи предложений, сказанных людьми, а их «изображения» — спектрограммы, очищенные от шумов и приведенные к одной длине. Эти спектрограммы отражали записи восьми эмоций — страха, отвращения, удивления, радости, печали, злости, спокойствия и нейтрального состояния.

Удивительно, но нейросеть лучше научилась распознавать по спектрограммам спокойные и нейтральные интонации. Их она верно определяет в 71 проценте случаев. Позитивные и негативные эмоции она часто путает, определяя счастье как печаль, а удивление — как отвращение. Вероятно, дело в том, что спектрограммы речи, ярко окрашенной такими эмоциями, не имеют ярко выраженных отличительных характеристик.

Результаты исследования были представлены в виде доклада на конференции Neuroinformatics 2017: Advances in Neural Computation, Machine Learning, and Cognitive Research.

Добавить в закладки
Комментарии
Вам понравилась публикация?
Расскажите, что вы думаете, и мы подберем подходящие материалы