Procesos de Decisión de Markov

Uploaded by

Julio Garcia

100% found this document useful (1 vote)

561 views2 pages

Original Title

Procesos de decisión de Markov

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Attribution Non-Commercial (BY-NC)

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

100% found this document useful (1 vote)

561 views2 pages

Procesos de Decisión de Markov

Uploaded by

Julio Garcia

Copyright:

Attribution Non-Commercial (BY-NC)

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 2

Search inside document

Procesos de decisin de Markov

Problemas de decisin secuenciales

Son los problemas que involucran decisiones cuyo resultado se conoce hasta el final, se considera que se tiene una serie de estados y decisiones asociadas en el tiempo. En estos problemas se tiene incertidumbre asociada con los resultados y posiblemente en los estados. La incertidumbre de una decisin se modela como una probabilidad de llegar al estado j dado que se encuentra en el estado i y realiza la accin a. Modelo de sensores: Normalmente el agente puede censar el ambiente para observar en qu estado se encuentra. Existen dos casos principales: 1. Observa directamente el estado donde se encuentra: proceso de decisin de Markov 2. Se tiene incertidumbre sobre el estado en el que se encuentra: proceso de decisin de Markov parcialmente observable Poltica ptima: dado el modelo de transicin y el modelo de sensores se encuentra una poltica ptima para maximizar la utilidad, esta poltica debe de indicar la accin que se debe ejecutar dado el estado. Las probabilidades de transicin solo dependen del estado actual por lo que son procesos markovianos. Procesos de decisin de Markov

Controlador basado en MDP

Modelo

Solucin MDP

Poltica Controlador

Estado Sistema

Accin

Eventos

El modelo clsico para resolver un MDP se conoce como iteracin de valor y consiste en calcular el la utilidad de cada estado y usar estas para seleccionar la optima. Otros mtodos que existen son iteracin de poltica y programacin lineal Un MDP se define por: Un conjunto finito de estados (S) Un conjunto finito de posibles acciones (A) Un modelo de transicin que especifica la probabilidad de pasar a un estado dado el estado presente P(s | s, a) Una funcin de recompensas, que especifica el valor, de ejecutar cierta accin en el estado s, r(s, a)

La utilidad del estado depende de la secuencia de acciones tomadas a partir de dicho estado i de acuerdo a la poltica p. Si l utilidad es separable se puede estimar como la utilidad de los siguientes estados y la forma ms sencilla es que sea de forma aditiva. Programacin dinmica: dada la condicin de separabilidad, la utilidad de un estado se puede obtener en forma iterativa maximizando la utilidad del siguiente estado: U (i) = R (i) + maxa j P(sj | si, a)U(j) Los problemas con nmero finito de pasos se conocen como MDP de horizonte finito, y los que pueden tener nmero infinito de pasos son MDP de horizonte infinito. Los mtodos para resolver un MDP son: 1. Iteracin de valor (Bellman, 57) 2. Iteracin de poltica (Howards, 60) 3. Programacin lineal (Puterman, 94)

Procesos de decisin de Markov parcialmente observables

Los elementos con los que cuenta un MDP parcialmente observable son los mismos con los que se cuenta en en MDP pero se le aaden 2 cosas nuevas: Una funcin de observacin que especifica la probabilidad de observaciones dado el estado P (O | S) Una distribucin inicial para los estados P (S)

Para resolver un POMDP (procesos de decisin de Markov parcialmente observables) se requiere considerar toda la historia de observaciones y acciones, esto equivale a considerar la distribucin de probabilidad sobre los estados y en base a estas determinar las opciones ptimas.

Investigación de Operaciones II
Document67 pages
Investigación de Operaciones II
Iran Esponda
100% (1)
Programación dinámica determinística y probabilística
Document9 pages
Programación dinámica determinística y probabilística
Denilson Campos
No ratings yet
Repaso de Contabilidad Gubernamental
Document3 pages
Repaso de Contabilidad Gubernamental
Edith Rojas
No ratings yet
Proceso de Decision Makorviano
Document6 pages
Proceso de Decision Makorviano
HAROLD HERRERA RUEDAS
No ratings yet
Programacin Dinmica
Document46 pages
Programacin Dinmica
jlvt
No ratings yet
Aprendizaje Por Refuerzo
Document3 pages
Aprendizaje Por Refuerzo
Dario Xavier Gomez
No ratings yet
Programacion Dinamica IO2
Document10 pages
Programacion Dinamica IO2
Angel Castrejon
No ratings yet
Modelos Gráficos Probabilistas
Document81 pages
Modelos Gráficos Probabilistas
CHRISTIAM ANTONY FLORES ZAMBRANO
No ratings yet
Unidad 1 Programacion Dinamica
Document26 pages
Unidad 1 Programacion Dinamica
Diana
No ratings yet
Programacion Dinamica
Document47 pages
Programacion Dinamica
Roberto Jahnsen Guerrero
No ratings yet
Análisis de Markov
Document4 pages
Análisis de Markov
gustavo ct
No ratings yet
Prog Dinámica
Document11 pages
Prog Dinámica
Carlos Cessa
No ratings yet
Programacion Dinamica Parte 1
Document20 pages
Programacion Dinamica Parte 1
Francisco Rios
No ratings yet
Programación Dinámica. Final
Document21 pages
Programación Dinámica. Final
Elmer Gabriel Chan Pech
No ratings yet
Unidad 1.programación Dinámica
Document25 pages
Unidad 1.programación Dinámica
Guillermo Garcia
100% (2)
Técnicas de Optimización Semana 10. Programación Dinámica (PD
Document9 pages
Técnicas de Optimización Semana 10. Programación Dinámica (PD
thi'k
No ratings yet
Programacion Dinamica
Document11 pages
Programacion Dinamica
Ana Karina Suaste Espadas
100% (1)
Programación Dinámica
Document7 pages
Programación Dinámica
Jose Acevedo
No ratings yet
UNIDAD 1 CADENA DE SUMINISTROS - Parte8
Document5 pages
UNIDAD 1 CADENA DE SUMINISTROS - Parte8
Antonella Lombardi
No ratings yet
Jean Carlos Herrera López
Document4 pages
Jean Carlos Herrera López
Jean Carlos Herrera Lopez
No ratings yet
Programación Dinámica
Document5 pages
Programación Dinámica
luchito_262
100% (1)
Programación Dinámica y Programación No Lineal
Document2 pages
Programación Dinámica y Programación No Lineal
Alfredy Valle
No ratings yet
Analisis de Markov
Document47 pages
Analisis de Markov
Christian León
No ratings yet
Programaciondinamicafinal 141019190955 Conversion Gate01
Document18 pages
Programaciondinamicafinal 141019190955 Conversion Gate01
Richard Lopez
No ratings yet
S05 Guia Practica Programacion Dinamica. Deterministica. Probabilistica
Document21 pages
S05 Guia Practica Programacion Dinamica. Deterministica. Probabilistica
INGSUP
No ratings yet
Programación Dinamica Deterministica
Document8 pages
Programación Dinamica Deterministica
ana morales
No ratings yet
Marcoteoricoaprendizaje Qlearning
Document10 pages
Marcoteoricoaprendizaje Qlearning
Alejandro Estrada Padilla
No ratings yet
Procesos Markovianos
Document8 pages
Procesos Markovianos
Armando Trampa
No ratings yet
Resumen Del Capítulo 10
Document8 pages
Resumen Del Capítulo 10
Arturo Tierra Jr.
No ratings yet
Programación Dinámica Determinista
Document14 pages
Programación Dinámica Determinista
Norm Porfirio
No ratings yet
Informe de Programacion Dinamica - Grupo No 2
Document11 pages
Informe de Programacion Dinamica - Grupo No 2
Damaris Bardales
No ratings yet
T4 Programación Directa
Document14 pages
T4 Programación Directa
Pepe
No ratings yet
ProgDin_etapasEj
Document14 pages
ProgDin_etapasEj
Pepe
No ratings yet
Reporte de Lectura 2
Document7 pages
Reporte de Lectura 2
DANA JATZIRI ARRIAGA ALCALA
No ratings yet
Características de Los Problemas de Programación Dinámica
Document5 pages
Características de Los Problemas de Programación Dinámica
jssloera
No ratings yet
Programacion Dinamica
Document21 pages
Programacion Dinamica
cometascribd
No ratings yet
Programación Dinámica Determinista
Document4 pages
Programación Dinámica Determinista
Jean Paul Perea
No ratings yet
La Programacion Dinamica Aplicada A Problemas de Redes
Document7 pages
La Programacion Dinamica Aplicada A Problemas de Redes
alejandra quezada
No ratings yet
Programacion Dinamica
Document21 pages
Programacion Dinamica
KimberLy Priego
No ratings yet
Articulo Del Tema 4.2 Probabilidad de Transiciones Estacionarias de N Pasos
Document3 pages
Articulo Del Tema 4.2 Probabilidad de Transiciones Estacionarias de N Pasos
Mayte Peralta Buendía
No ratings yet
Clase 3. Programación Dinámica
Document28 pages
Clase 3. Programación Dinámica
Ever de Jesus
No ratings yet
MDP y RL: procesos de decisión de Markov y aprendizaje por refuerzo
Document54 pages
MDP y RL: procesos de decisión de Markov y aprendizaje por refuerzo
vhmatura
No ratings yet
Investigación de Operaciones
Document106 pages
Investigación de Operaciones
Fernando Elizalde Ramirez
29% (14)
Tecnicas para La Toma de Decisiones.
Document16 pages
Tecnicas para La Toma de Decisiones.
Pedro Rodriguez
No ratings yet
Análisis de Markov
Document51 pages
Análisis de Markov
Perla_Celeste__7548
86% (7)
Clase09 Mdps 05
Document47 pages
Clase09 Mdps 05
SERGIO LUIS ZAMBRANO PINEDA
No ratings yet
Problemas Resueltos PPD
Document106 pages
Problemas Resueltos PPD
Xavi Gonzales
67% (3)
Programacion Dinamica Deterministica
Document7 pages
Programacion Dinamica Deterministica
JARUMY MIRELLA VERA QUINTANA
0% (1)
Modelo de Programación Lineal - Empresa
Document31 pages
Modelo de Programación Lineal - Empresa
Sofia Vega Soto
No ratings yet
Ejercicios de Procesos Estocásticos
From Everand
Ejercicios de Procesos Estocásticos
Simone Malacrida
No ratings yet
Ejercicios de Funciones de Variables Múltiples
From Everand
Ejercicios de Funciones de Variables Múltiples
Simone Malacrida
No ratings yet
Enfoque práctico de control moderno: Con aplicaciones en Matlab
From Everand
Enfoque práctico de control moderno: Con aplicaciones en Matlab
Enrique Arnáez Braschi
Rating: 5 out of 5 stars
5/5 (1)
Introducción al análisis numérico
From Everand
Introducción al análisis numérico
Simone Malacrida
No ratings yet
Ejercicios de Límites
From Everand
Ejercicios de Límites
Simone Malacrida
No ratings yet
Ejercicios de Inferencia Estadística
From Everand
Ejercicios de Inferencia Estadística
Simone Malacrida
No ratings yet
Introducción al Análisis Matemático Avanzado
From Everand
Introducción al Análisis Matemático Avanzado
Simone Malacrida
No ratings yet
Introducción a las Ecuaciones Diferenciales
From Everand
Introducción a las Ecuaciones Diferenciales
Simone Malacrida
No ratings yet
Ejercicios de Ecuaciones Diferenciales Ordinarias
From Everand
Ejercicios de Ecuaciones Diferenciales Ordinarias
Simone Malacrida
Rating: 4 out of 5 stars
4/5 (1)
El Libro de Matemática: Volumen 2
From Everand
El Libro de Matemática: Volumen 2
Simone Malacrida
No ratings yet
Programación matemática para la economía y la empresa
From Everand
Programación matemática para la economía y la empresa
M.ª Begoña Font Belaire
No ratings yet
Ejercicios de Ecuaciones en Derivadas Parciales
From Everand
Ejercicios de Ecuaciones en Derivadas Parciales
Simone Malacrida
No ratings yet
Procesamiento de Imagenes
Document7 pages
Procesamiento de Imagenes
Julio Garcia
No ratings yet
Probabilidad
Document20 pages
Probabilidad
Julio Garcia
No ratings yet
Introduccion A La Investigacion de Operaciones
Document3 pages
Introduccion A La Investigacion de Operaciones
Julio Garcia
No ratings yet
Formulario Calculo Diferencial e Integral
Document2 pages
Formulario Calculo Diferencial e Integral
Julio Garcia
No ratings yet
Como Vender A Gobierno
Document2 pages
Como Vender A Gobierno
Julio Garcia
No ratings yet
Autómata Finito No Deterministico
Document17 pages
Autómata Finito No Deterministico
Julio Garcia
No ratings yet
Cómo Tratar Exitosamente Los Problemas Legales de Tu Empresa
Document4 pages
Cómo Tratar Exitosamente Los Problemas Legales de Tu Empresa
Julio Garcia
No ratings yet
Css
Document4 pages
Css
Julio Garcia
No ratings yet
Presidentes de Mexico
Document96 pages
Presidentes de Mexico
Julio Garcia
No ratings yet
Java
Document38 pages
Java
Julio Garcia
No ratings yet
Clases Centrales de Java
Document8 pages
Clases Centrales de Java
Julio Garcia
No ratings yet
Convenio 138 de La OIT Sobre La Edad Mínima
Document9 pages
Convenio 138 de La OIT Sobre La Edad Mínima
JoeBlack
No ratings yet
Implementación de 13 hectáreas de pimienta con tutores vivos
Document25 pages
Implementación de 13 hectáreas de pimienta con tutores vivos
ANDREA DIAZ
No ratings yet
Cuestionario TALLER DE LA ADMINISTRACION GERENCIAL
Document6 pages
Cuestionario TALLER DE LA ADMINISTRACION GERENCIAL
Garcia Arias Jonathan David
No ratings yet
Análisis acústico y térmico del Auditorio Hancher de la Universidad de Iowa
Document18 pages
Análisis acústico y térmico del Auditorio Hancher de la Universidad de Iowa
Johana Rivero
No ratings yet
Elaboración de Proyectos A Cielo Abierto en Pequeña Minería
Document136 pages
Elaboración de Proyectos A Cielo Abierto en Pequeña Minería
EDUARDO MANUEL NORIEGA VIDAL
100% (1)
Fisica Electronica Ejercicio
Document5 pages
Fisica Electronica Ejercicio
Jeferson Eduardo MONSALVE ZAMBRANO
No ratings yet
Bono para Docentes Jubilados (Bono Docente)
Document3 pages
Bono para Docentes Jubilados (Bono Docente)
Margarita Maturana Vera
No ratings yet
Calculo Dosificacion PDF
Document33 pages
Calculo Dosificacion PDF
carlos delgado
No ratings yet
20 Pruzzo - .La Práctica de Los Profesores. Mediadores Didácticos para La Innovación
Document3 pages
20 Pruzzo - .La Práctica de Los Profesores. Mediadores Didácticos para La Innovación
mgperg7601
No ratings yet
Spirax Sarco - Guia Definitiva Vapor
Document7 pages
Spirax Sarco - Guia Definitiva Vapor
axeluni_1205
100% (1)
Tarea 3 de Psicologia Educativa
Document4 pages
Tarea 3 de Psicologia Educativa
claritza
No ratings yet
Download
Document3 pages
Download
ma jsis
No ratings yet
604720t0028e (Capitulo 3) R1-Eett Pci Detalle Tecnico Exigido para Pci e Hidrante
Document30 pages
604720t0028e (Capitulo 3) R1-Eett Pci Detalle Tecnico Exigido para Pci e Hidrante
Fabian Ramirez Insfran
No ratings yet
Functional Programming With Elixir Es
Document29 pages
Functional Programming With Elixir Es
elkinlon0930
No ratings yet
Tarea Pedagogia Semana 4
Document2 pages
Tarea Pedagogia Semana 4
claudia rosales
No ratings yet
3° Lenguaje PPT 1uso de Mayúscula
Document8 pages
3° Lenguaje PPT 1uso de Mayúscula
Vicky Ortiz Castañeda
No ratings yet
Patrullero orgulloso
Document19 pages
Patrullero orgulloso
Ulises Moran
No ratings yet
Legado cultural del Perú en Ciencias Sociales
Document2 pages
Legado cultural del Perú en Ciencias Sociales
Amanda Silva Montoya
No ratings yet
Formulario de Inscripcion Vestex Parte 1
Document2 pages
Formulario de Inscripcion Vestex Parte 1
Joel
No ratings yet
Contrato de servicios de decoración y arrendamiento para evento social
Document5 pages
Contrato de servicios de decoración y arrendamiento para evento social
Morales Cordoba Roberthito De La Mora
No ratings yet
Modelos para La Toma de Decisiones
Document24 pages
Modelos para La Toma de Decisiones
Freddy Huayta Meza
No ratings yet
Con Sabor A Colombia
Document4 pages
Con Sabor A Colombia
joselvsereno
No ratings yet
Técnicas Analíticas Instrumentales I
Document6 pages
Técnicas Analíticas Instrumentales I
Joel
No ratings yet
Ficha Técnica KIKKO 2021
Document2 pages
Ficha Técnica KIKKO 2021
jlogistica
No ratings yet
Sueños y amigos: cuento sobre la amistad
Document4 pages
Sueños y amigos: cuento sobre la amistad
deicy carvajal
No ratings yet
Huesos de la cara: Maxilar superior
Document18 pages
Huesos de la cara: Maxilar superior
Karen
No ratings yet
Universidad Nacional de Cajamarca
Document99 pages
Universidad Nacional de Cajamarca
Andrés Medina
No ratings yet
Eje Loco
Document1 page
Eje Loco
Angelo Torres Terreros
No ratings yet
Ejercicios de Estadística
Document34 pages
Ejercicios de Estadística
Fernanda Garmendez
No ratings yet