Approximate dynamic programming by minimizing distributionally robust bounds

La programacin̤ dinm̀ica aproximada (ADP) es un enfoque popular para resolver problemas extensos de decisin̤ markovianos. En este documento se describe un nuevo tipo de mťodos de tal enfoque programacin̤ dinm̀ica aproximada distribuidamente robusta que aborda el curso de la dimensionalidad al minim...

Cur síos iomlán

Sábháilte in:
Sonraí bibleagrafaíochta
Rannpháirtithe: Petrik Marek, International Conference on Machine Learning (ICML)
Formáid: LEABHAR
Teanga:Béarla
Ábhair:
Rochtain ar líne:Approximate dynamic programming by minimizing distributionally robust bounds
Clibeanna: Cuir clib leis
Níl clibeanna ann, Bí ar an gcéad duine le clib a chur leis an taifead seo!
Cur síos
Achoimre:La programacin̤ dinm̀ica aproximada (ADP) es un enfoque popular para resolver problemas extensos de decisin̤ markovianos. En este documento se describe un nuevo tipo de mťodos de tal enfoque programacin̤ dinm̀ica aproximada distribuidamente robusta que aborda el curso de la dimensionalidad al minimizar un lm̕ite pesimista. Esta alternativa convierte a la ADP en un problema de optimizacin̤, por lo cual se derivan nuevas formulaciones de programacin̤ matemt̀ica y se analizan sus propiedades.