Interactive visualization for testing Markov Decision Processes

doi:10.1016/J.JVLC.2016.10.007

Journal ArticleDOI

Interactive visualization for testing Markov Decision Processes

Sean McGregor, +5 more

- 01 Apr 2017 -

Journal of Visual Languages and Computin...

- Vol. 39, pp 93-106

Chats0

TLDR

The first visualization targeting MDP testing, MDPvis, is presented and it is shown the visualization's generality by connecting it to two reinforcement learning frameworks that implement many different MDPs of interest in the research community.

Abstract:

Markov Decision Processes (MDPs) are a formulation for optimization problems in sequential decision making Solving MDPs often requires implementing a simulator for optimization algorithms to invoke when updating decision making rules known as policies The combination of simulator and optimizer are subject to failures of specification, implementation, integration, and optimization that may produce invalid policies We present these failures as queries for a visual analytic system (MDPVIS) MDPVIS addresses three visualization research gaps First, the data acquisition gap is addressed through a general simulator-visualization interface Second, the data analysis gap is addressed through a generalized MDP information visualization Finally, the cognition gap is addressed by exposing model components to the user MDPVIS generalizes a visualization for wildfire management We use that problem to illustrate MDPVIS and show the visualization's generality by connecting it to two reinforcement learning frameworks that implement many different MDPs of interest in the research community HighlightsMarkov decision processes (MDPs) formalize sequential decision optimization problemsComplex simulators often implement MDPs and are subject to a variety of bugsInteractive visualizations support testing MDPs and optimization algorithmsThe first visualization targeting MDP testing, MDPvis, is presented

Interactive visualization for testing Markov Decision Processes

Citations

Gamut: A Design Probe to Understand How Data Scientists Understand Machine Learning Models

(Journal of Visual Languages and Computing,19:637-651)Spatial Inference and Similarity Retrieval of an Image Database System Based on Object's Spanning Representation

A Survey on Interactive Reinforcement Learning: Design Principles and Open Challenges

Personalizable and Interactive Sequence Recommender System

Infrastructure maintenance and replacement optimization under multiple uncertainties and managerial flexibility

References

Dynamic Programming

Markov Decision Processes: Discrete Stochastic Dynamic Programming

Dynamic Programming and Optimal Control

Policy Gradient Methods for Reinforcement Learning with Function Approximation

What is dynamic programming

Related Papers (5)

On the complexity of solving Markov decision problems

Planning with Markov Decision Processes: An AI Perspective

Simulation-Based Algorithms for Markov Decision Processes

Abstraction and approximate decision-theoretic planning

Power to the People: The Role of Humans in Interactive Machine Learning