Exemplos de VQStateDiscretizationAdapter.adaptClusters em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: dopamine.adapters

Classe / Tipo: VQStateDiscretizationAdapter

Método / Função: adaptClusters

Exemplos em hotexamples.com: 2

VQStateDiscretizationAdapter.adaptClusters em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de dopamine.adapters.VQStateDiscretizationAdapter.adaptClusters em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

adaptClusters(2)

applyState(1)

sampleClusters(1)

Métodos Frequentes

adaptClusters (2)

applyState (1)

sampleClusters (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: cart_vq_q.py Projeto: rueckstiess/dopamine

experiment.addAdapter(discretizer) # add e-greedy exploration explorer = EpsilonGreedyExplorer(0.3, episodeCount=1000) experiment.addAdapter(explorer) # force experiment setup now experiment.setup() for i in range(len(discretizer.stateVectors)): plt.text(discretizer.stateVectors[i,0], discretizer.stateVectors[i,1], "%i"%i, bbox=dict(facecolor='green', alpha=0.5)) plt.xlim(-2.5, 2.5) plt.ylim(-10, 10) plt.show() agent.forget() explorer.epsilon = 0.3 # renderer = CartPoleRenderer() # environment.renderer = renderer # renderer.start() # run experiment for i in range(1000): experiment.runEpisode(reset=True) discretizer.adaptClusters() agent.learn() print "sum rewards:", sum(agent.episode.rewards) print "exploration:", explorer.epsilon

Exemplo n.º 2

0

Exibir arquivo

Arquivo: visualize_vq.py Projeto: rueckstiess/dopamine

from numpy import * from dopamine.adapters import VQStateDiscretizationAdapter from matplotlib import pyplot as plt plt.ion() vq = VQStateDiscretizationAdapter(50) states = random.normal([0, 3], [3, 1], (500, 2)) states = r_[states, random.normal([-1, -2], [0.5, 2], (200, 2))] plt.plot(states[:,0], states[:,1], '.') for s in states: vq.applyState(s) vq.sampleClusters() vq.adaptClusters() for i in range(len(vq.stateVectors)): plt.text(vq.stateVectors[i,0], vq.stateVectors[i,1], "%i"%i, bbox=dict(facecolor='green', alpha=0.5)) plt.ylim(-10, 10) plt.xlim(-10, 10) plt.show()