Главное — участие

Компьютер обыграл человека почти во все мыслимые игры

Фото: Chad Miller/flickr

Несколько дней назад человечество лишилось очередного бастиона, защищающего нашу уникальность: компьютерная программа впервые в истории обыграла человека в го. До сих пор считалось, что это невозможно, потому что эта древняя игра требует интуиции. «Чердак» вспоминает, какие еще умные игры пали под натиском искусственного интеллекта.

Логические настольные игры — изобретение столь древнее, что, возможно, первые из них разыгрывались во времена, когда и столов-то еще не было. На самом деле они особенно и не нужны: главное действо шахмат, го или нард разыгрывается даже не на игровом поле, которое можно начертить палочкой на земле, а в головах игроков. Придумать стратегию, просчитать лучшую последовательность ходов — причем не только своих, но и противника, не делать глупых ошибок или хотя бы просто сохранять спокойствие — все это требует изрядных умственных затрат.

Игры считались настолько сложными, что даже после изобретения компьютеров с их колоссальной скоростью вычислений Homo sapiens все равно были уверены, что шахматы или го никогда не покорятся машинам: ведь им недоступен ни блеск ума, ни тайна интуиции. А первые ЭВМ, хотя и умели складывать большие числа, но, во-первых, делали это очень медленно, а во-вторых, больше не могли ничего, так что люди не признавали в гигантских (один компьютер легко мог занимать целую комнату) машинах соперников. И зря. Уже в 1956 году, спустя всего несколько лет после того, как появились компьютеры, более или менее похожие на современные, человек проиграл первую битву машине. Произошло это историческое сражение на шахматной доске.

Шахматы

Боец армии роботов носил красноречивое имя MANIAC I (Mathematical Analyzer, Numerical Integrator, and Computer, and Computer — Математический анализатор, числовой интегратор и компьютер), и его создали в 1952 году в знаменитой Лос-Аламосской национальной лаборатории, где до этого собрали первую в мире атомную бомбу. С виду MANIAC I напоминал здоровенный стеллаж с книгами, «жрал» 350 киловатт энергии (для сравнения: современный компьютер на полной загрузке едва «выбирает» 550 ватт, то есть в тысячу раз меньше), перемножал 40-значные числа за одну миллисекунду и поставил шах и мат человеку за 23 хода. Правда, MANIAC I играл с новичком и по упрощенным правилам, так что самоуверенные Homo sapiens решили, что компьютеру просто повезло. Тем более что в следующие 20 лет некоторым шахматистам удавалось иногда взять верх над искусственным разумом.

Ученые из Лос-Аламоса Пол Штейн и Ник Метрополис играют в шахматы с MANIAC I (он на заднем плане). Фото: Los Alamos National Laboratory


Но очень скоро людскому самомнению был нанесен еще один чувствительный удар: в 1981 году компьютерная программа Cray Blitz на закрытом шахматном чемпионате в Миссисипи обыграла всех человеческих соперников, в том числе мастера спорта. В последующие годы машины победили еще нескольких мастеров, а в турнирах стали регулярно набирать больше очков, чем люди. Окончательно надежды рухнули в 1997 году, когда сильнейший шахматист мира Гарри Каспаров проиграл созданной IBM программе Deep Blue. При этом годом ранее многократный чемпион мира в схватке с ней же победил, но, как оказалось, компьютеры не только очень быстро считают, но еще и учатся. Более того, в отличие от людей они могут в любой момент извлечь из памяти каждую из когда-либо виденных комбинаций. И даже если когда-нибудь родится новый шахматный гений, который вдруг обыграет машину, в следующей игре она все равно победит, используя против человека им же придуманную стратегию.

Камень-ножницы-бумага

Умение запоминать все стратегии сделало роботов чемпионами еще в одной игре, по популярности вполне сравнимой с шахматами: камень-ножницы-бумага. Если выбросить фигуры один раз, то считается, что победителя определяет случай, хотя недавно исследователи выяснили, что это не так и люди чаще выбрасывают камень или ножницы (примерно по 35%), чем бумагу (29,6%). Но если играть несколько раз подряд, то на первое место выходит стратегия. Ученые не тратят время даром: разумеется, они просчитали оптимальный алгоритм действий и придумали рекомендации, которые помогают обыграть соперника. Но только не в случае, если соперник — робот. Машина моментально выучивает тактику, при помощи которой человек пытается обмануть ее, и при достаточно большом количестве раундов всегда оказывается победителем. Убедиться в этом можно, например, здесь (только не расстраивайтесь слишком сильно).

Нарды

Камень-ножницы-бумага и шахматы разительно отличаются по уровню сложности, но у них есть кое-что общее: в обеих играх нет элемента случайности (если не считать странных ходов противника). Но в очень многих играх случайность — одна из базовых составляющих, и во многом именно ей они обязаны своей популярность. Если в шахматах выигрыш определяется исключительно мастерством игрока, то, например, в нардах даже сильному игроку может не повезти, если на кубиках несколько раз выпадет неудачная комбинация. По крайней мере, именно так веками утешали себя проигравшие.

Но 15 июля 1979 года стало ясно, что уверения в «невезении» — всего лишь слова. В этот день программа BKG 9.8 с разгромным счетом выиграла Мировой чемпионат по нардам в Монте-Карло. Кубики «работают» одинаково вне зависимости от того, кто их кидает, только человек при «неправильной» комбинации начинает паниковать, а машина просто пересчитывает стратегию.

Ханс Берлдинер тестирует свою программу для игры в нарды BKG 9.8 в 1979 году. Фото из архива Университета Карнеги-Мелон


Слово «просто» в предыдущем предложении стоит воспринимать как художественный прием: алгоритмы, которые используют программы для игры в нарды (да и в шахматы тоже), очень сложны. Например, они умеют определять, какая сейчас фаза игры — начало, середина или конец. Для человека понять, в какой стадии игры он находится, не составляет проблем: мы делаем это неосознанно и чаще всего даже не отдаем себе отчета в том, что такая проблема в принципе существует. Для машины «понять» что-то невозможно: чтобы отнести нечто к той или иной категории, ей нужны четкие критерии. И один из прорывов в создании игровых программ произошел именно здесь: машины наконец научились определять, как развивается игра, и это умение сразу вывело их на один уровень с сильнейшими нардистами. Кроме того, машины обучились нечеткой логике, которая позволила им принимать правильные решения в условиях, когда информации для этого явно недостаточно.

Следующей вехой стало создание роботов-игроков, «мозги» которых были устроены по принципу искусственных нейронных сетей: в отличие от традиционных компьютеров, которым нужна четко прописанная программа, нейронные сети сами обучаются чему-либо и действуют, руководствуясь приобретенными знаниями, а не по заданной человеком схеме.

Покер

«Ну хорошо, — скажет любитель азартных игр, — пускай компьютеры научились высчитывать оптимальную стратегию в шахматах и даже нардах, но есть игры, где им точно не преуспеть. Потому что в этих играх не только полно случайностей — в них надо еще обманывать и блефовать, а этого компьютеры точно не умеют». И действительно, карточные игры «высшего легиона» вроде покера или бриджа долгое время оставались недоступными для машинного разума. Но в самом начале 2015 года в одном из престижнейших научных журналов Science вышла статья, в которой была описана программа-«убийца» Техасского холдема (одна из самых популярных разновидностей покера). По уверениям авторов, победить эту программу нельзя, даже если сильнейший из покеристов будет непрерывно играть против машины всю свою жизнь.

У компьютеров нет азарта, который заставляет людей делать ошибки. Но кто знает, если программисты смогут добавить его машине, возможно, она станет играть еще лучше. Фото: Tiago Daniel/flickr


Покер — сложная игра, потому что игроки никогда не знают всей информации о раздаче. Более того, соперники могут блефовать, что дополнительно усложняет принятие решения. Для того чтобы создать программу, способную выигрывать несмотря на все эти сложности, ученые заставили ее сыграть 24 триллиона партий против самой себя. После каждой игры машина оценивала ходы и вычисляла, насколько лучше был бы итог, сделай она тот ход, а не иной. Затем программа оценивала уровень «сожалений» из-за неверных ходов, то есть определяла, сколько денег она потеряла из-за того, что ошиблась.

С каждым миллионом сыгранных партий, количество «сожалений» уменьшалось, пока не стало стремиться к нулю.


Бесконечно играя в карты, компьютер вычислил оптимальные стратегии для всех возможных раздач, и теперь победить его невозможно даже с учетом того, что некоторые партии с особо неудачными картами машина проиграет. Но на длинном «забеге» результат игры предопределен.

Го

В войне за звание единственного настоящего игрока на планете человек проигрывал бой за боем, но одна крепость считалась неприступной. Древняя китайская игра го, с виду незамысловатая, но на деле куда более сложная, чем те же шахматы, считалось недоступной компьютерам. Именно го приводили в пример, чтобы успокоить человечество после очередного проигрыша машине. С января 2016 года придется искать другое утешение: программа AlphaGo, созданная в одном из подразделений Google DeepMind, пять раз из пяти «сделала» лучшего игрока Европы Фана Хуэя. Для того чтобы официально называться непобедимой, AlphaGo предстоит выиграть мировой турнир по игре в го, но, судя по всему, шансов у ее соперников немного.

В го возможны 10^{170} возможных комбинаций: чтобы набрать столько атомов, придется запастись не одним миллионом Вселенных. Поэтому создатели AlphaGo изначально отказались от идеи «взламывать» игру перебором. В основе программы лежат искусственные нейронные сети, которые задействуют принцип глубинного обучения: благодаря ему программа может анализировать абстракции и составлять сложное многоуровневое представление о ситуации, например понимать, в какой фазе игра (вспомним нарды) и какая стратегия с большей вероятностью приведет к успеху. По словам Фана Хуэя, AlphaGo играет как человек — немного странный, но очень сильный и, безусловно, настоящий.

Не игрушки

С каждым годом на планете остается все меньше игр, которые не были бы «освоены» компьютерами: крестики-нолики, скрэббл, реверси, всевозможные аркады, шашки, даже «Своя игра» — все они уже покорились машинам. Конечно, очень обидно терять звание единственного разумного существа на планете, но в случае с играми куда интереснее другой аспект. С каждой завоеванной игрой компьютерный мозг становится все более «человеческим», но при этом куда более мощным, чем мозг Homo sapiens. Так что настоящим людям пора бы задуматься, как использовать нарождающихся гениев во благо. Пока не поздно.
Ирина Якутенко
Теги:

Читать еще на Чердаке: