Текст уведомления здесь

И еще раз учиться

Почему машинное обучение так популярно сейчас и что с ним будет дальше

Последние несколько лет кажется, что искусственный интеллект есть уже везде: алгоритмы умеют не только узнавать лица, но и считывать эмоции, беспилотные автобусы и автомобили тестируются на улицах, а если вы позвоните в крупную компанию, велика вероятность поговорить с машиной, а не с автоответчиком. Почему технологии искусственного интеллекта так активно развиваются именно сейчас и что будет дальше, «Чердаку» рассказал специалист по машинному обучению Николай Князев из компании Jet Infosystems.
Добавить в закладки
Комментарии

В подходе к разработке искусственного интеллекта выделяют два основных подхода. Один имитирует логику. «Один из критериев хорошего алгоритма машинного обучения — его интерпретируемость. Это означает, что человек может понять, на основе каких признаков и взаимосвязей алгоритм делает выводы. Например, если алгоритм подсказывает не давать кредит заемщику, то это продиктовано тем, что у него одновременно много детей и мало стажа на новой работе. Таким образом, можно сказать, что алгоритмы мыслят, как человек», — говорит Николай.

Николай Князев. Фото предоставлено организаторами олимпиад НТИ
Николай Князев. Фото предоставлено организаторами олимпиад НТИ

Другой подход представляет собой попытку сымитировать работу мозга, в котором за реакцию на стимулы отвечают связи между нейронами. «Особняком здесь стоят искусственные нейросети — их разрабатывали по аналогии со строением головного мозга, и многие функции являются приближением процесса мышления. Однако это вполне самостоятельный математический аппарат. Аналогия с человеческим мозгом служит хорошим подспорьем для понимания механизмов работы, но мы пока достоверно не знаем, ни как мыслит человеческий мозг, ни пределов применимости искусственных нейросетей. Вполне вероятно, что будут еще потрясающие открытия, основанные на схожести искусственных и биологических нейронных сетей», — продолжает рассказывать специалист по машинному обучению.

Первой нейронной сетью стал перцептрон американского психолога и нейрофизиолога Фрэнка Розенблатта. Идея была в том, что, когда мы получаем какой-то стимул, в мозге запускается цепь реакций: один нейрон активирует другие и так по цепочке. Когда мы учимся, наши действия получают обратную связь («правильно"/"неправильно»), что позволяет выработать определенный шаблон ответа. При этом в мозге связи между нейронами, отвечающими за этот шаблон, усиливаются, что позволяет выдавать на один и тот же стимул одну и ту же реакцию. В 1960 году ученый продемонстрировал компьютер, который был способен научиться распознавать зрительные образы, например простые геометрические фигуры и буквы. Для обучения компьютера ему предъявляли фигуры вместе с правильным ответом, чтобы, присваивая связям между «нейронами» определенные веса, он тренировался выдавать правильный ответ.

Правда, для более сложных задач перцептрон Розенблатта приспособить не удалось. В 1969 году легендарные Марвин Минский и Сеймур Пейперт написали книгу «Перцептроны», в которой весьма пессимистически оценивали возможности системы Розенблатта и ей подобных. Книга имела огромное влияние и чуть ли не в одиночку ответственна за начало одного из периодов «зимы искусственного интеллекта» (этим весьма спорным эпизодом в истории дисциплины даже социологи интересуются!). Многие исследователи потянулись вслед авторитетному мнению и решили, что раз идея самообучающихся компьютеров бесплодна, то следует сфокусироваться на создании компьютеров, имитирующих человеческую логику, а не сам процесс обучения. Сторонники «нейронок» много лет были очень обижены: некоторым, якобы чуть ли не со ссылкой на «Перцептроны», отказывали в финансировании исследований. Позже, в 1988 году, Минский и Пейперт выпустили расширенную и дополненную версию «Перцептронов», посвятив эпилог тому, как подействовала на исследования ИИ их оценка потенциала искусственных нейронных сетей, и отмечали, что их пессимизм был чересчур переоценен читателями. Минский, вспоминая об этом в 90-е, даже сравнивал эффект первого издания книги с «Некрономиконом» — вымышленной книгой из творчества Говарда Лавкрафта, которую начали «цитировать» другие писатели, а в результате многие теперь уверены, что она действительно существует. Вот и «Перцептроны», подозревал Минский, мало кто на самом деле читал.

Несмотря на «заморозки», где-то исследования в этой области все равно продолжались. В начале 1990-х Ян Лекун, французский информатик, работавший в «Лабораториях Белла», смог создать систему, которая могла читать цифры, написанные от руки.

Ян Лекун демонстрирует систему распознавания рукописного текста.

Эта система уже получила практическое применение: в конце 1990-х в Америке 10−20% банковских чеков, напечатанных или написанных от руки, читали машины с системой Лекуна. К 2010 году Microsoft, Google, и IBM стали использовать нейронные сети для распознавания речи. Однако по-настоящему популярными нейросети стали позже, когда в 2012 году коллеги Лекуна победили в соревновании по распознаванию образов Large Scale Visual Recognition Challenge, использовав подход на основе нейронной сети. Их система опознавала сотни объектов реального мира: от лис до акустических гитар.

Почему нейронные сети так долго не могли прижиться? Собеседник «Чердака» выделяет несколько причин: недостаток опыта применения математических моделей к задачам реального мира, малые объемы данных и медленные расчеты. В какой-то момент мы просто преодолели некоторый порог: процессоры стали достаточно мощны, а хранить и собирать данные стало достаточно дешево и просто, чтобы их стало по-настоящему много, плюс накопился опыт их использования.

«С появлением информации, которую можно анализировать, и возможности производить расчеты стала активно исследоваться возможность применения методов, разработанных еще десятилетия назад. Например, придуманные более полувека назад нейросети сейчас получили развитие в сверточных и рекуррентных нейросетях — специфических структурах, заточенных на анализ изображений и текста. Пока не появились задачи, никто не знал, что нам будут нужны именно сверточные нейросети, а сейчас это один из самых популярных инструментов в классификации изображений», — объясняет Николай.

Сегодня мы слышим про приложения на основе нейронных сетей чуть ли каждый день: автомобили без водителей, роботы, которые умеют разговаривать и торговаться, алгоритмы, которые обыгрывают человека практически во все мыслимые игры.

«Сложно назвать область, где анализ данных не мог бы существенно улучшить производительность. От определения лиц для вычисления преступников до автоматической классификации опухолей без медицинского вмешательства. Ключевым в анализе данных является определение свойств, по которым производится анализ, т.е. на основе каких данных делается вывод о неком свойстве объекта или принадлежности его к какому-то классу. Эти свойства определяет специалист области, в которой выполняется аналитика. Поэтому для успешного внедрения алгоритмов машинного обучения — совместная работа специалиста области и математика в области алгоритмов», — объяснил Николай Князев.

В результате роботы уже начинают теснить человека в таких профессиях, как рабочий, юрист и бухгалтер, водитель и журналист.

«Практически в любой деятельности, чем дальше тем больше, человека можно будет заменить искусственным интеллектом: от написания музыки и работы на пропускной системе до предсказания погоды и работы грузчиком на складе. Последние пять лет происходит взрывной рост технологий анализа данных. Появляются новые алгоритмы, основанные как на нейросетях, так и на решающих деревьях. С развитием проектов Hadoop и Spark мы получаем алгоритмы, которые обучаются на больших данных гораздо быстрее. А при наличии больших объемов данных оказывается возможным использовать „обучение без учителя“ или „с частичным привлечением учителя“, т. е искать закономерность в самих данных, не зная правильного ответа заранее. Это позволяет выходить на новый уровень анализа, который не требует предварительной долгой разметки данных, во что упираются многие задачи», — рассказал эксперт.

Николай Князев — эксперт Олимпиады НТИ для школьников, профиль «Большие данные и машинное обучение».

Добавить в закладки
Комментарии
Вам понравилась публикация?
Расскажите, что вы думаете, и мы подберем подходящие материалы

Полвека трансмутаций

Как томский исследовательский реактор продолжает работу через 50 лет после первого пуска

Одному из старейших и притом действующих исследовательских ядерных реакторов — томскому ИРТ-Т (Исследовательский реактор тепловой-Томский) — в этом году исполнилось 50 лет. Корреспондент «Чердака» побывала в реакторном зале и лабораториях Томского политехнического университета и выяснила, что и зачем «варят» сегодня в своем реакторе томские ученые.
Добавить в закладки
Комментарии

По огромному залу разносится эхо слов экскурсовода: «Реактор работает постоянно, без перерывов. Даже сейчас он функционирует. Но на самой малой мощности, поэтому мы с вами не видим в воде голубого свечения заряженных частиц. Вам бояться радиации не стоит». Мы стоим на так называемом «пятаке» — крышке, покрывающей бассейн, в котором находится активная зона реактора. Вода в бассейне сверхчистая — настолько, что не оставляет на поверхностях никаких следов, хотя ее не меняли с 1984 года, с момента последней крупной реконструкции физического зала. 50 кубометров воды обеспечивают охлаждение реактора, защиту от радиации и замедление нейтронов. Вокруг зала с бассейном расположились лаборатории. Еще пара минут на фотосъемку — и маршрут нашей экскурсии проляжет как раз через них.

Фото предоставлено пресс-службой ТПУ

Фото предоставлено пресс-службой ТПУ

Мощность реактора ТПУ — 6 МВт. Для сравнения: мощности больших АЭС исчисляются тысячами мегаватт. Но исследовательские тепловые реакторы, к которым относится томский, в отличие от промышленных, просты в исполнении и управлении. Их создавали для того, чтобы не только получать научные данные, но и готовить будущих атомщиков. Для своего компактного размера ИРТ-Т имеет большое количество экспериментальных каналов, что позволяет одновременно облучать множество мишеней. А бериллиевый замедлитель и ловушки в зоне центральных каналов обеспечивают более плотный, по сравнению с другими реакторами того же типа, поток нейтронов.

Томский ИРТ сооружался одним из первых в стране: строительство началось в 1959 году, а первая цепная реакция началась в июле 1967-го. Начальный уровень мощности — 1 МВт — был увеличен в шесть раз после первой модернизации в 1984 году. Еще одно обновление реактор пережил в 2006-м, когда в соответствии с требованиями времени привели систему управления и защиты. К 50-летию исследовательский реактор ТПУ вновь усовершенствован: модернизированы линии легирования кремния, производства радиофармпрепаратов, линия для испытания материалов под воздействием мощных потоков нейтронов и гамма-излучения. Срок службы ИРТ-Т официально продлен: он продолжит работать как минимум до 2035 года. [ ... ]

Читать полностью

Самый красивый металл

Висмут

Редакция «Чердака» продолжает знакомить вас с очень простой книгой Максима Биловицкого «Увлекательная химия металлов и их соединений» (издательство АСТ).
Добавить в закладки
Комментарии

Висмут — серебристый металл с розоватым оттенком, довольно редкий (мировая добыча металла не прывышает 6400 тонн в год). Нетоксичен, широко используется в медицине и фармацевтике. А еще имеет невысокую температуру плавления (около 271 °C) и образует удивительной геометрической формы кристаллы с радужным оксидом на поверхности. Впрочем, смотрите сами.

Добавить в закладки
Комментарии
Вам понравилась публикация?
Расскажите, что вы думаете, и мы подберем подходящие материалы

Скованные одной цепью

Чем еще хорош блокчейн, кроме криптовалют

Слово «блокчейн» сегодня не слышал только тот, кто совсем не пользуется интернетом. В основном оно ассоциируется с криптовалютами, однако эту технологию можно использовать не только для электронных денег. Что еще можно сделать на блокчейне и когда проекты на основе этой технологии станут реальностью, «Чердаку» рассказал Александр Колотов, ведущий специалист STEM-программ и преподаватель Школы по блокчейну Университета Иннополис.
Добавить в закладки
Комментарии

Эксперимент занял у меня около часа. За этот час я десять раз обошел площадь кругом, разбух от воды, спичечных коробков и газет, перезнакомился со всеми продавцами и продавщицами и пришел к ряду интересных выводов. Пятак возвращается, если им платить. <...> Исчезновение пятака из тарелочки с медью на прилавке заметить не удается: среди прочей меди пятак сейчас же теряется и никакого движения в тарелочке в момент перехода пятака в карман не происходит. Итак, мы имели дело с так называемым неразменным пятаком в процессе его функционирования...

А. и Б. Стругацкие, «Понедельник начинается в субботу» (1965)

Неизвестно, что думали братья Стругацкие об электронных деньгах, когда описывали неразменный пятак в своей повести, но его коварное поведение хорошо описывает главную проблему электронных денег — проблему двойного расходования. С обычным деньгами она решается просто: если вы отдаете продавцу мелочь в обмен на газировку, монет у вас больше нет и вы никак не можете потратить их еще раз.

До того как Сатоси Накамото придумал и описал биткойн, казалось, что напрямую обмениваться электронными деньгами так же, как обычными, невозможно. Ведь информацию в цифровой форме легко тиражировать. Вспомним, как расцвело музыкальное пиратство с появлением MP3. Если так же легко можно копировать деньги, в них нет никакого смысла. Поэтому для электронных платежей нужен банк: он гарантирует, что деньги спишутся у вас и поступят продавцу. [ ... ]

Читать полностью