Искусственный интеллект играет «Montezuma’s Revenge» без человека

Искусственный интеллект играет «Montezuma's Revenge» без человека

Вновь созданное поколение алгоритмов искусственного интеллекта демонстрирует освоение видеоигр компании «Atari» в 10 раз быстрее, чем на это способен современный искусственный интеллект, с прорывным подходом к решению проблем. Разработка искусственного интеллекта, способного решать проблемы планирования, является важным направлением исследовательских задач в продвижении в этой области. Исследования 2015 года показали: «Google DeepMind AI» освоил видеоигры «Atari», такие как «Video Pinball», практически на человеческом уровне. Однако отыскать путь к первому ключу видеоигры «Montezuma’s Revenge» так и не смог по причине сложности игры.

Исключение ошибок и определение подзадач

Новым методом, разработанным специалистами университета RMIT (Мельбурн), компьютеры, настроенные на игру «Montezuma’s Revenge» автономно, исключали ошибки и определяли подзадачи в 10 раз быстрее по сравнению с «Google DeepMind». Новая методика, разработанная специалистами, сочетает стратегию обучения «кнут и пряник» с внутренним подходом мотивации. Так искусственные интеллект вознаграждается за проявление любопытства и анализ окружающей среды.

Реально интеллектуальная система должна уметь учиться самостоятельно, быть способной выполнять задачи в неоднозначных условиях. Так считают разработчики новых алгоритмов. Учёные показали: правильные алгоритмы многократно улучшают результаты. Используется более разумный подход к мощному компьютеру взамен простого грубого форсирования событий.

Результаты демонстрируют более продвинутый уровень автономии искусственного интеллекта и указывают ключевое направление для продолжения достижений существенного прогресса в этой области.

Методика вознаграждения системы за самостоятельное исследование полезных подцелей, например, «подъёма по лестнице» или «прыжков через яму», становится неочевидной для компьютера в контексте выполнения более крупной миссии. Другие современные системы требуют участия человека для идентификации обозначенных подцелей, или же случайных решений для дальнейших действий.

Релевантные задачи и человеческое поведение


Новые алгоритмы не только идентифицируют релевантные задачи автономно в десятки раз быстрее «Google DeepMind» (в условиях игры «Montezuma’s Revenge»). Новый искусственный интеллект демонстрирует относительно человеческое поведение. Например, прежде чем перейти ко второму экрану игры, необходимо определить подзадачи, такие как подъём по лестнице, перепрыгивание через объект и подбор ключа.

Для старых алгоритмов эти события происходят случайным образом с большими тратами времени. Новые алгоритмы, как показало тестирование, выполняют все действия естественным образом, демонстрируя определенные намерения. Это делает первого полностью автономного искусственного интеллекта ориентированным на достижение целей, по-настоящему конкурентоспособным в играх по отношению к человеку.