Professional Documents
Culture Documents
Reward
TPM action 0 1
state 2 1 0.6 0.3
2 0.05 0.2
3 0.05 0.1
TPM action 0 1
state 3 1 0.25 0.2
Read comment) 2 0.05 0.05
3 0.6 0.3
2 3
0.05 0.8
0.3 0.25
0.4 0.05
2 3
0.05 0.05
0.15 0.6
0.05 0.8
2 3
0.3 0.25
0.8 0.1
0.05 0.05
TPM action 0
state 1 1 0.05
2 0.25
3 0.3
1 2 3
0.1 0.05 0.8
0.2 0.3 0.25
0.25 0.4 0.05
1 2 3
0.3 0.05 0.05
1 2 3
0.2 0.3 0.25
0.05 0.8 0.1
0.3 0.05 0.05
TPM action 0 1
state 1 1 0.05 0.1
2 0.25 0.2
Gamma is not time value of money 3 0.3 0.25
e^(-gamma*time) is time value of money
2 3 TPM action 0 1 2 3
0.05 0.8 state 1 1 2 2 5 2
0.3 0.25 2 1 1 5 8
0.4 0.05 3 2 1 4 10
2 3 TPM action 0 1 2 3
0.05 0.05 state 2 1 2 2 5 1
0.15 0.6 2 3 1 8 6
0.05 0.8 3 1 2 1 15
2 3 TPM action 0 1 2 3
0.3 0.25 state 3 1 1 5 2 2
0.8 0.1 2 1 3 3 5
0.05 0.05 3 1 6 3 9
0.8
For MDP For SMDP
t e^(-gamma*time)
0 1 0.6
0.9 1 0.904837418
0.81 2 0.8187307531
0.729 3 0.7408182207 0.4
0.6561 4 0.670320046
0.59049 5 0.6065306597
0.2
0.531441 6 0.5488116361
1
0.430467 8 0.4493289641
0
0.38742 9 0.4065696597
1234567891111111111222222222233333333334444444444555555555566666666667
0.348678 10 0.3678794412 0123456789012345678901234567890123456789012345678901234567890
0.313811 11 0.3328710837
0.28243 12 0.3011942119
0.254187 13 0.272531793
0.228768 14 0.2465969639
0.205891 15 0.2231301601
16 0.201896518
17 0.1826835241
18 0.1652988882
19 0.1495686192
20 0.1353352832
21 0.1224564283
22 0.1108031584
23 0.1002588437
24 0.0907179533
25 0.0820849986
26 0.0742735782
27 0.0672055127
28 0.0608100626
29 0.0550232201
30 0.0497870684
31 0.0450492024
32 0.040762204
33 0.0368831674
34 0.03337327
35 0.0301973834
36 0.0273237224
37 0.0247235265
38 0.0223707719
39 0.0202419114
40 0.0183156389
41 0.0165726754
42 0.0149955768
43 0.013568559
44 0.0122773399
45 0.0111089965
46 0.0100518357
47 0.0090952771
48 0.008229747
49 0.0074465831
50 0.006737947
51 0.0060967466
52 0.0055165644
53 0.0049915939
54 0.0045165809
55 0.0040867714
56 0.0036978637
57 0.0033459655
58 0.0030275547
59 0.0027394448
60 0.0024787522
61 0.0022428677
62 0.0020294306
63 0.0018363048
64 0.0016615573
65 0.0015034392
66 0.001360368
67 0.0012309119
68 0.0011137751
69 0.0010077854
70 0.000911882
71 0.0008251049
72 0.0007465858
73 0.0006755388
74 0.0006112528
75 0.0005530844
76 0.0005004514
77 0.0004528272
78 0.000409735
79 0.0003707435
80 0.0003354626
Column W
444444455555555556666666666777777777788
345678901234567890123456789012345678901