Науковий керівник доктор фізико-математичних наук Єршов Сергій Володимирович
Мета роботи. Інтерес до мультиагентного навчання з підкріпленням (reinforcement learning) викликаний розвитком штучних нейронних мереж, а також успіхами їх застосування в глибокому одноагентному навчанні з підкріпленням. Універсальність та ефективність глибинного навчання з підкріпленням зумовило його розширення до глибинного мультиагентного навчання для застосування в мультиагентних системах. Методи глибинного мультиагентного навчання з підкріпленням демонструють ефективність виконання інтелектуальних задач, порівнянну з рівнем людини. За рахунок вищої стійкості функціонування мультиагентних систем порівняно з одиничним агентом підвищується ймовірність виконання цільової задачі.
Методи машинного навчання з підкріпленням знайшли своє застосування в кіберфізичних системах, що використовуються в розумних фабриках, транспортуванні, електричних та телекомунікаційних тощо. Мобільні кіберфізичні системи, такі як група дронів або мобільних роботів, можуть розглядатися як різновид мультиагентних систем.
Метою роботи є розробка методу, який дозволяє навченій мультиагентній системі адаптуватися до нових небезпечних факторів, що виникають у недосліджених середовищах. Передбачається зменшення ризиків небезпечної поведінки інтелектуальних агентів шляхом розробки відповідного методу на основі дослідження простору станів, що спрямовується ризиком.
Задачі полягають у навчанні мультиагентних моделей мобільних кіберфізичних систем у симуляційних середовищах. Розглядаються створення моделей таких систем та відповідних середовищ як в рамках однієї теорії та комбінацій різних теорій. Очікується, що розроблений метод розширить застосовність глибинного мультиагентного навчання з підкріпленням до реальних мобільних систем. Зокрема, очікується, що використання запропонованого методу дозволить знизити ймовірність виникнення небезпечних станів у задачі кооперативної навігації дронів при тій же кількості кроків навчання.