Approximate dynamic programming by minimizing distributionally robust bounds

La programacin̤ dinm̀ica aproximada (ADP) es un enfoque popular para resolver problemas extensos de decisin̤ markovianos. En este documento se describe un nuevo tipo de mťodos de tal enfoque programacin̤ dinm̀ica aproximada distribuidamente robusta que aborda el curso de la dimensionalidad al minim...

Повний опис

Збережено в:
Бібліографічні деталі
Інші автори: Petrik Marek, International Conference on Machine Learning (ICML)
Формат: Книга
Мова:Англійська
Предмети:
Онлайн доступ:Approximate dynamic programming by minimizing distributionally robust bounds
Теги: Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!