Представим, что мы зашли в игровое заведение, где в ряд стоит десяток одноруких бандитов, где других игроков нет и никто не мешает. Ещё, что у нас достаточно денег для игры. Можно ли тут выиграть, применяя известные алгоритмы оптимизации? В том числе и глубокое обучение с подкреплением.
Да, если не менее одного из задействованных автоматов запрограммированы плохо, недостаточно случайно. Даже в случае, если мы не знаем, какой или какие. На то и оптимизация.
Если же это не так, то всё равно да, поскольку вряд ли в игровые автоматы встроены атомные генераторы случайных чисел, но с рядом существенных оговорок:
- Нам может понадобиться очень много времени. С практической точки зрения — неприемлемо много.
-
Нам может понадобиться очень много денег в качестве оборотного капитала. Практически — неприемлемо много.
-
Выигрыш может быть очень маленьким по отношению к задействованным вложениям. Неприемлемо маленьким.
Ну и, разумеется, задача многорукого бандита применима не только в игровом заведении, а в широком круге многопараметрических задач оптимизации.
Оригинал: VK.com