Python Env.take_action Beispiele

Programmiersprache: Python

Namespace / Paketname: environment

Klasse / Typ: Env

Methode / Funktion: take_action

Beispiele auf hotexamples.com: 2

Python Env.take_action - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die environment.Env.take_action, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

Env(30)

step(30)

reset(30)

get_initial_state(7)

render(6)

print_value_all(4)

close(3)

end(3)

plot(3)

save_all_newlines_to_file(2)

take_action(2)

calc_dist(2)

get_turn(2)

get_state(2)

mover(1)

move(1)

DoMove(1)

mostrar_mapa(1)

make(1)

preprocess_img(1)

mainloop(1)

load_sw_set(1)

load_all_doc(1)

is_gameover(1)

plot_goal(1)

print_value_q_all(1)

print_env(1)

print_status(1)

intrinsic_reward(1)

print_values(1)

randomescolha(1)

render_grid(1)

restart_game(1)

rtn_put_available_position(1)

set(1)

set_data_set(1)

setup_logging(1)

tick(1)

toJson(1)

toggle_table(1)

train(1)

inverse(1)

incentive(1)

init_idf(1)

calc_shaped_reward(1)

common_reset(1)

classify(1)

check_win(1)

check_start(1)

check_end(1)

Beispiel #1

Datei anzeigen

Datei: run.py Projekt: IsaacWallis/udacity_machine_learning

from scipy import ndimage, misc
import image_segment
from environment import Env
from agent import R_Learner
import numpy as np

if __name__ == "__main__":
    img = ndimage.imread('butterfly.jpg')
    img = misc.imresize(img, size=0.0625)

    search_env = img
    patch_src = img
    K = 50
    labels = image_segment.segment(img, K)
    label = 15
    patch_indices = np.where(labels == label)
    patch_pixels = img[patch_indices]

    indices_at_origin = (patch_indices[0] - np.min(patch_indices[0]),
                         patch_indices[1] - np.min(patch_indices[1]))
    env = Env(img)
    agent = R_Learner(patch_pixels, indices_at_origin, env)

    while True:
        state = env.get_state()
        action = agent.get_action(state)
        reward, next_state = env.take_action(action)
        agent.learn(state, action, reward, next_state)

Beispiel #2

Datei anzeigen

    assert len(np.concatenate(reg_periods)) is len(
        np.unique(np.concatenate(reg_periods)))

    # Annualized volatility on risky asset in different regimes:
    for k, v in regimes.items():
        ann_vol = np.squeeze(v["sigma"][1] * np.sqrt(252))
        print(
            "Annualized volatility of log-returns on risky asset "
            "in regime", k, "=", "{0:.5f}".format(ann_vol))

    # terminal wealth statistics for all risky allocation:
    lw = []
    for i in range(train_episodes + round(init_d_size / horizon)):
        env.reset()
        while not env.done:
            _, _, _, _ = env.take_action(action=1.0)
        lw.append(np.sum(env.p))

    print("\nIf fully invested into the risky asset (over ",
          train_episodes + round(init_d_size / horizon), "runs):")
    print("-- Mean terminal wealth =", "{0:.2f}".format(np.mean(lw)))
    print("-- Maximum terminal wealth =", "{0:.2f}".format(np.max(lw)))
    print("-- Minimum terminal wealth =", "{0:.2f}".format(np.min(lw)))
    print("-- Utility of mean terminal wealth =",
          "{0:.5f}".format(crra_utility(np.mean(lw), env.theta)))
    print("-- Mean utility of terminal wealth =",
          "{0:.5f}".format(np.mean(crra_utility(lw, env.theta))))
    print("-- For comparison: initial utility =",
          "{0:.5f}".format(crra_utility(env.w, env.theta)))
    del lw