Текст уведомления здесь

И еще раз учиться

Почему машинное обучение так популярно сейчас и что с ним будет дальше

Последние несколько лет кажется, что искусственный интеллект есть уже везде: алгоритмы умеют не только узнавать лица, но и считывать эмоции, беспилотные автобусы и автомобили тестируются на улицах, а если вы позвоните в крупную компанию, велика вероятность поговорить с машиной, а не с автоответчиком. Почему технологии искусственного интеллекта так активно развиваются именно сейчас и что будет дальше, «Чердаку» рассказал специалист по машинному обучению Николай Князев из компании Jet Infosystems.
Добавить в закладки
Комментарии

В подходе к разработке искусственного интеллекта выделяют два основных подхода. Один имитирует логику. «Один из критериев хорошего алгоритма машинного обучения — его интерпретируемость. Это означает, что человек может понять, на основе каких признаков и взаимосвязей алгоритм делает выводы. Например, если алгоритм подсказывает не давать кредит заемщику, то это продиктовано тем, что у него одновременно много детей и мало стажа на новой работе. Таким образом, можно сказать, что алгоритмы мыслят, как человек», — говорит Николай.

Николай Князев. Фото предоставлено организаторами олимпиад НТИ
Николай Князев. Фото предоставлено организаторами олимпиад НТИ

Другой подход представляет собой попытку сымитировать работу мозга, в котором за реакцию на стимулы отвечают связи между нейронами. «Особняком здесь стоят искусственные нейросети — их разрабатывали по аналогии со строением головного мозга, и многие функции являются приближением процесса мышления. Однако это вполне самостоятельный математический аппарат. Аналогия с человеческим мозгом служит хорошим подспорьем для понимания механизмов работы, но мы пока достоверно не знаем, ни как мыслит человеческий мозг, ни пределов применимости искусственных нейросетей. Вполне вероятно, что будут еще потрясающие открытия, основанные на схожести искусственных и биологических нейронных сетей», — продолжает рассказывать специалист по машинному обучению.

Первой нейронной сетью стал перцептрон американского психолога и нейрофизиолога Фрэнка Розенблатта. Идея была в том, что, когда мы получаем какой-то стимул, в мозге запускается цепь реакций: один нейрон активирует другие и так по цепочке. Когда мы учимся, наши действия получают обратную связь («правильно"/"неправильно»), что позволяет выработать определенный шаблон ответа. При этом в мозге связи между нейронами, отвечающими за этот шаблон, усиливаются, что позволяет выдавать на один и тот же стимул одну и ту же реакцию. В 1960 году ученый продемонстрировал компьютер, который был способен научиться распознавать зрительные образы, например простые геометрические фигуры и буквы. Для обучения компьютера ему предъявляли фигуры вместе с правильным ответом, чтобы, присваивая связям между «нейронами» определенные веса, он тренировался выдавать правильный ответ.

Правда, для более сложных задач перцептрон Розенблатта приспособить не удалось. В 1969 году легендарные Марвин Минский и Сеймур Пейперт написали книгу «Перцептроны», в которой весьма пессимистически оценивали возможности системы Розенблатта и ей подобных. Книга имела огромное влияние и чуть ли не в одиночку ответственна за начало одного из периодов «зимы искусственного интеллекта» (этим весьма спорным эпизодом в истории дисциплины даже социологи интересуются!). Многие исследователи потянулись вслед авторитетному мнению и решили, что раз идея самообучающихся компьютеров бесплодна, то следует сфокусироваться на создании компьютеров, имитирующих человеческую логику, а не сам процесс обучения. Сторонники «нейронок» много лет были очень обижены: некоторым, якобы чуть ли не со ссылкой на «Перцептроны», отказывали в финансировании исследований. Позже, в 1988 году, Минский и Пейперт выпустили расширенную и дополненную версию «Перцептронов», посвятив эпилог тому, как подействовала на исследования ИИ их оценка потенциала искусственных нейронных сетей, и отмечали, что их пессимизм был чересчур переоценен читателями. Минский, вспоминая об этом в 90-е, даже сравнивал эффект первого издания книги с «Некрономиконом» — вымышленной книгой из творчества Говарда Лавкрафта, которую начали «цитировать» другие писатели, а в результате многие теперь уверены, что она действительно существует. Вот и «Перцептроны», подозревал Минский, мало кто на самом деле читал.

Несмотря на «заморозки», где-то исследования в этой области все равно продолжались. В начале 1990-х Ян Лекун, французский информатик, работавший в «Лабораториях Белла», смог создать систему, которая могла читать цифры, написанные от руки.

Ян Лекун демонстрирует систему распознавания рукописного текста.

Эта система уже получила практическое применение: в конце 1990-х в Америке 10−20% банковских чеков, напечатанных или написанных от руки, читали машины с системой Лекуна. К 2010 году Microsoft, Google, и IBM стали использовать нейронные сети для распознавания речи. Однако по-настоящему популярными нейросети стали позже, когда в 2012 году коллеги Лекуна победили в соревновании по распознаванию образов Large Scale Visual Recognition Challenge, использовав подход на основе нейронной сети. Их система опознавала сотни объектов реального мира: от лис до акустических гитар.

Почему нейронные сети так долго не могли прижиться? Собеседник «Чердака» выделяет несколько причин: недостаток опыта применения математических моделей к задачам реального мира, малые объемы данных и медленные расчеты. В какой-то момент мы просто преодолели некоторый порог: процессоры стали достаточно мощны, а хранить и собирать данные стало достаточно дешево и просто, чтобы их стало по-настоящему много, плюс накопился опыт их использования.

«С появлением информации, которую можно анализировать, и возможности производить расчеты стала активно исследоваться возможность применения методов, разработанных еще десятилетия назад. Например, придуманные более полувека назад нейросети сейчас получили развитие в сверточных и рекуррентных нейросетях — специфических структурах, заточенных на анализ изображений и текста. Пока не появились задачи, никто не знал, что нам будут нужны именно сверточные нейросети, а сейчас это один из самых популярных инструментов в классификации изображений», — объясняет Николай.

Сегодня мы слышим про приложения на основе нейронных сетей чуть ли каждый день: автомобили без водителей, роботы, которые умеют разговаривать и торговаться, алгоритмы, которые обыгрывают человека практически во все мыслимые игры.

«Сложно назвать область, где анализ данных не мог бы существенно улучшить производительность. От определения лиц для вычисления преступников до автоматической классификации опухолей без медицинского вмешательства. Ключевым в анализе данных является определение свойств, по которым производится анализ, т.е. на основе каких данных делается вывод о неком свойстве объекта или принадлежности его к какому-то классу. Эти свойства определяет специалист области, в которой выполняется аналитика. Поэтому для успешного внедрения алгоритмов машинного обучения — совместная работа специалиста области и математика в области алгоритмов», — объяснил Николай Князев.

В результате роботы уже начинают теснить человека в таких профессиях, как рабочий, юрист и бухгалтер, водитель и журналист.

«Практически в любой деятельности, чем дальше тем больше, человека можно будет заменить искусственным интеллектом: от написания музыки и работы на пропускной системе до предсказания погоды и работы грузчиком на складе. Последние пять лет происходит взрывной рост технологий анализа данных. Появляются новые алгоритмы, основанные как на нейросетях, так и на решающих деревьях. С развитием проектов Hadoop и Spark мы получаем алгоритмы, которые обучаются на больших данных гораздо быстрее. А при наличии больших объемов данных оказывается возможным использовать „обучение без учителя“ или „с частичным привлечением учителя“, т. е искать закономерность в самих данных, не зная правильного ответа заранее. Это позволяет выходить на новый уровень анализа, который не требует предварительной долгой разметки данных, во что упираются многие задачи», — рассказал эксперт.

Николай Князев — эксперт Олимпиады НТИ для школьников, профиль «Большие данные и машинное обучение».

Добавить в закладки
Комментарии
Вам понравилась публикация?
Расскажите, что вы думаете, и мы подберем подходящие материалы

Надежды и чаяния

Чего хорошего мы ждем от нового года

Наступивший 2018 год, как любой другой, обещает быть богатым на события. В эти 365 дней нас ждут пуски космических аппаратов к Луне, Марсу, Меркурию, астероидам и первый снимок черной дыры; квантовые компьютеры наконец-то покажут, на что они способны; поезда станут быстрее, беспилотные автомобили — надежнее; вооруженные современными биотехнологиями медики научатся лечить несколько неизлечимых болезней, а киберспортсмены продолжат обыгрывать ИИ в Dota 2 и Starcraft. Оставайтесь с нами в новом году :^)
Добавить в закладки
Комментарии

«…а они как ломанулись!»

31 марта 2018 года — дедлайн «частной лунной гонки», она же Google Lunar X Prize: призы достанутся тем командам, которые смогут доставить на спутник Земли луноход. Доставить в сохранности: тот должен будет проехать по лунной поверхности не менее 500 метров и передать на Землю видео и изображения. Само соревнование было анонсировано в 2007 году, изначально в нем зарегистрировались 32 команды, сейчас в осталось пять — те, кто успел купить пассажирский билет на Луну для своего аппарата. Израильтян SpaceIL до Луны подбросят SpaceX, индийцев из Team Indus и японцев Hakuto будет запускать Индийская организация космических исследований. Американцы из Moon Express планируют отправить свой ровер с новозеландской ракетой Rocket Lab (те верят, что успеют обкатать свою технику к этому моменту), примерно в той же позиции и пятый участник, интернациональная команда Synergy Moon, которая обещает уложиться к концу марта, но в довольно размытых формулировках — их луноход будут запускать калифорнийские частники, пока что только однажды выводившие на низкую орбиту CubeSat’ы.

Отдельно от Google Lunar X Prize на Луну собирается немецкая частная компания PTScientists, они уже договорились с сотовым оператором Vodafone, который должен предоставить связь для отправки информации на Землю, а запускаться собираются на Falcon 9.

Наконец, SpaceX обещает отправить двух космических туристов на корабле Dragon 2 вокруг Луны и обратно в конце 2018 года. [ ... ]

Читать полностью

Скованные одной цепью

Чем еще хорош блокчейн, кроме криптовалют

Слово «блокчейн» сегодня не слышал только тот, кто совсем не пользуется интернетом. В основном оно ассоциируется с криптовалютами, однако эту технологию можно использовать не только для электронных денег. Что еще можно сделать на блокчейне и когда проекты на основе этой технологии станут реальностью, «Чердаку» рассказал Александр Колотов, ведущий специалист STEM-программ и преподаватель Школы по блокчейну Университета Иннополис.
Добавить в закладки
Комментарии

Эксперимент занял у меня около часа. За этот час я десять раз обошел площадь кругом, разбух от воды, спичечных коробков и газет, перезнакомился со всеми продавцами и продавщицами и пришел к ряду интересных выводов. Пятак возвращается, если им платить. <...> Исчезновение пятака из тарелочки с медью на прилавке заметить не удается: среди прочей меди пятак сейчас же теряется и никакого движения в тарелочке в момент перехода пятака в карман не происходит. Итак, мы имели дело с так называемым неразменным пятаком в процессе его функционирования...

А. и Б. Стругацкие, «Понедельник начинается в субботу» (1965)

Неизвестно, что думали братья Стругацкие об электронных деньгах, когда описывали неразменный пятак в своей повести, но его коварное поведение хорошо описывает главную проблему электронных денег — проблему двойного расходования. С обычным деньгами она решается просто: если вы отдаете продавцу мелочь в обмен на газировку, монет у вас больше нет и вы никак не можете потратить их еще раз.

До того как Сатоси Накамото придумал и описал биткойн, казалось, что напрямую обмениваться электронными деньгами так же, как обычными, невозможно. Ведь информацию в цифровой форме легко тиражировать. Вспомним, как расцвело музыкальное пиратство с появлением MP3. Если так же легко можно копировать деньги, в них нет никакого смысла. Поэтому для электронных платежей нужен банк: он гарантирует, что деньги спишутся у вас и поступят продавцу. [ ... ]

Читать полностью

Блокчейн — это вот так

Коротко и быстро о технологии, которая скоро будет использоваться везде

Блокчейн пришел на смену нанотехнологиям. Это слово повсюду: в заголовках, заявках на гранты, речах политиков, шутках в курилке. Плох тот стартап, что не опирается на технологию блокчейна. Даже если это доставка пиццы. Или — особенно, если это доставка пиццы? Давайте быстро, «на пальцах», разберемся в том, что же это такое.
Добавить в закладки
Комментарии

Слово «блокчейн» немного пугает, но на самом деле всё просто: оно состоит из слов «блок» и «цепь» (то бишь связанный список). Начнем со списка. Чтобы понять, что такое «связанный», вернемся на минуту мыслью в студенческие времена. Допустим, вы староста курса и играете роль местной кассы взаимопомощи. В памяти все проходящие по ней операции удержать невозможно, и поэтому в холле общежития вы повесили обычную грифельную доску, на которой написано что-то вроде:

Я одолжил Ольге 200 рублей. Я одолжил Егору 300 рублей. Я одолжил Егору 500 рублей. Егор вернул мне 100 рублей.

Сразу видно, что в итоге Ольга должна вам (кассе) 200 рублей, а Егор — целых 700. Некоторое время записи в безопасности, но потом любящий одалживаться Егор, впав в отчаяние, берет тряпку и стирает в последней записи «1», заменив ее на «8». Раз — и он избавился от долга, а вы потеряли 700 рублей. Как обезопасить кассу?

Сосед по общежитию, Иван, не пользуется кассой, у него и так все отлично. Зато он программист и при случае рассказывает вам про хеширование. Это процесс, при котором любой массив данных любой длины, от полного собрания сочинений Тургенева до записки «ужин на столе», можно легко преобразовать в строку фиксированной длины с уникальным набором символов. Причем изменение любого знака в оригинальных данных полностью изменит всю строку хэша. И вы, последовав его совету, берете общедоступную функцию хэширования (например, SHA256) и приписываете к каждой строке хэш-значение (выбрав любой удобный онлайн-генератор хэша, хоть вот этот, например). Получаете таблицу вида: [ ... ]

Читать полностью