Approximate dynamic programming by minimizing distributionally robust bounds

La programacin̤ dinm̀ica aproximada (ADP) es un enfoque popular para resolver problemas extensos de decisin̤ markovianos. En este documento se describe un nuevo tipo de mťodos de tal enfoque programacin̤ dinm̀ica aproximada distribuidamente robusta que aborda el curso de la dimensionalidad al minim...

Deskribapen osoa

Gorde:
Xehetasun bibliografikoak
Beste egile batzuk: Petrik Marek, International Conference on Machine Learning (ICML)
Formatua: Liburua
Hizkuntza:ingelesa
Gaiak:
Sarrera elektronikoa:Approximate dynamic programming by minimizing distributionally robust bounds
Etiketak: Etiketa erantsi
Etiketarik gabe, Izan zaitez lehena erregistro honi etiketa jartzen!