
DeepMind, дочерняя компания Google, создала футбольный симулятор для тестирования алгоритмов машинного обучения. Видеоигра под названием Google Research Football Environment позволяет исследователям тестировать алгоритмы в основанном на физике и простом в использовании мире.
Футбольный симулятор был выбран не случайно в качестве обучающей платформы для ИИ. Согласно статье на веб-сайте Массачусетского технологического института, одной из задач для исследователей ИИ является поиск новых проблем для алгоритмов машинного обучения, которые они могут решать и, таким образом, учиться. Простые видеоигры вроде Pong или Breakout иногда слишком примитивны и предсказуемы для этих алгоритмов. Другие игры, такие как Starcraft, слишком сложны. Starcraft, стратегическая игра в реальном времени, действие которой происходит в большой онлайн-вселенной, настолько обширна и сложна, что требует огромных вычислительных ресурсов для сбора соответствующих данных и обучения.
Тогда на помощь приходят футбольные симуляторы. У них есть определенные уровни предсказуемости, основанные на физике игры. Но также есть много непредсказуемых моментов, возникающих из-за тактики игроков и позволяющих машине научиться чему-то новому.
В качестве базы исследователи DeepMind использовали игру под названием Gameplay Football, которая позволяет проводить полные матчи с фолами, угловыми, пенальти, офсайдами и так далее.
«Игра представляет собой футбольный симулятор, основанный на физике, где агенту нужно управлять своими игроками и научиться преодолевать оборону соперника, чтобы забивать голы», — говорят сотрудники Google.
Сегодня нейронные сети DeepMind могут «играть» во многие игры, например, в видеоигры Atari, такие как Pong, Breakout и Space Invaders, а также в более сложные, включая уже упомянутый Starcraft. В начале 2019 года искусственный интеллект AlphaStar от DeepMind смог победить людей в Starcraft.
DeepMind также добилась значительных успехов в традиционных играх. В 2016 году программа DeepMind AlphaGo победила одного из сильнейших в мире профессиональных игроков в го. Игра закончилась победой AlphaGo с разницей в пол-очка.