小伙伴们,你们好,今天小市来聊聊一篇关于部分可观察马尔可夫决策过程,关于部分可观察马尔可夫决策过程简述的文章,网友们对这件事情都比较关注,那么现在就为大家来简单介绍下,希望对各位小伙伴们有所帮助。
1、部分可观察马尔可夫决策过程(PartiallyObservableMarkovDecisionProcess,缩写:POMDP),是一种通用化的马尔可夫决策过程。POMDP模拟智能体决策程序是假设系统动态由MDP决定,但是智能体无法直接观察状态。相反的,它必须要根据模型的全域与部分区域观察结果来推断状态的分布。
2、因为POMDP架构的通用程度足以模拟不同的真实世界的连续过程,应用于机器人导航问题、机械维护和不定性规划。架构最早由研究机构所建立,随后人工智能与自动规划社群继续发展。
文章到此就分享结束,希望对大家有所帮助。