Китайський квантовий супутник передав дані на рекордну відстань
24 Червня , 2017
Штучний інтелект врятує зернові культури від хвороб і шкідників
25 Червня , 2017

Штучний інтелект від Microsoft встановив рекорд у грі Pac-Man

Game over.

Система штучного інтелекту, розроблена командою Maluuba (була придбана корпорацією Microsoft в січні), встановила рекорд у грі Ms. Pac-Man на Atari 2600. ШІ зміг набрати максимально можливу кількість балів – 999990. Для порівняння, найкращий результат людини в цій грі становить 266330 балів.

Щоб досягти такого вражаючого результату, команда Maluuba використовувала методику навчання штучного інтелекту Hybrid Reward Architecture – це комбінація закріпленого навчання і методу «розділяй і володарюй».

При цьому загальна мета гри розбивалась на окремі завдання, що виконуються агентами. Всього використовувалось понад 150 агентів. Окремим агентам призначались прості поетапні завдання, наприклад, пошук конкретної кульки або ухилення від примар.

Отримані від «пересічних» агентів дані передавались «головному» агенту (Microsoft порівнює його зі старшим менеджером в компанії). Він збирав відомості від усіх агентів і інформував, куди ігровому персонажу рухатись далі, щоб уникнути небезпек і набирати очки.

Відзначається, що найкращі результати досягались, коли окремі агенти «діяли дуже егоїстично», а головний агент зосередився на тому, що найкраще для всієї команди. При цьому він враховував не тільки кількість агентів, які бажають рухатись в певному напрямку, але і важливість цього напрямку.

Наприклад, менша кількість агентів, які бажають уникнути примари, була більш пріоритетною у порівнянні з великою кількістю агентів, які бажають рухатись в бік кульки.

Команда Maluuba запевняє, що система навчання ШІ Hybrid Reward Architecture має численні сфери практичного застосування, такі як допомога в прогнозуванні продажів компаній або обробка розмови.

Залишити відповідь

Увійти за допомогою: 
Inline
Inline