Approximate dynamic programming by minimizing distributionally robust bounds

La programacin̤ dinm̀ica aproximada (ADP) es un enfoque popular para resolver problemas extensos de decisin̤ markovianos. En este documento se describe un nuevo tipo de mťodos de tal enfoque programacin̤ dinm̀ica aproximada distribuidamente robusta que aborda el curso de la dimensionalidad al minim...

全面介紹

Saved in:
書目詳細資料
其他作者: Petrik Marek, International Conference on Machine Learning (ICML)
格式: 圖書
語言:英语
主題:
在線閱讀:Approximate dynamic programming by minimizing distributionally robust bounds
標簽: 添加標簽
沒有標簽, 成為第一個標記此記錄!
實物特徵
總結:La programacin̤ dinm̀ica aproximada (ADP) es un enfoque popular para resolver problemas extensos de decisin̤ markovianos. En este documento se describe un nuevo tipo de mťodos de tal enfoque programacin̤ dinm̀ica aproximada distribuidamente robusta que aborda el curso de la dimensionalidad al minimizar un lm̕ite pesimista. Esta alternativa convierte a la ADP en un problema de optimizacin̤, por lo cual se derivan nuevas formulaciones de programacin̤ matemt̀ica y se analizan sus propiedades.