Professional Documents
Culture Documents
Agente : cada tanque es un agente que puede tener un conjunto único de estados y
observaciones, realizar acciones únicas dentro del entorno y recibir recompensas únicas
por los eventos dentro del entorno. Las acciones de un agente las decide el cerebro al que
está vinculado.
Academia : el objeto de la Academia dentro de una escena también contiene como hijos a
todos los cerebros dentro del entorno. Cada entorno contiene una sola Academia que
define el alcance del entorno, en términos de:
o Frameskip: cuántos pasos del motor se deben saltar entre cada agente que toma
una nueva decisión.
o Longitud del episodio global: cuánto durará el episodio. Cuando se alcanza, todos
los agentes están configurados para terminar.
Los estados y las observaciones de todos los agentes con los cerebros configurados como Externos
son recopilados por el Comunicador externo y comunicados a nuestra API de Python para su
procesamiento utilizando su biblioteca de ML elegida. Al configurar múltiples agentes en un solo
cerebro, las acciones se pueden decidir por lotes, lo que abre la posibilidad de obtener las ventajas
del cálculo en paralelo, cuando se admite .