Python World.default_Reward Exemples

Langage de programmation: Python

Espace de nommage/Pack: World

Class/Type: World

Méthode/Fonction: default_Reward

Exemples au hotexamples.com: 2

Python World.default_Reward - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de World.World.default_Reward extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

find_element(30)

World(30)

replace_variables(15)

__init__(6)

stepForward(3)

get_alert_when_exist(3)

addThing(2)

add_agent(2)

add_market(2)

add_rim(2)

convert_ref_frame(2)

append(2)

direct(2)

curses_display_table(2)

current_state(2)

change_game_state(2)

addObject(2)

add_team(2)

_generateResources(2)

add(2)

restart(1)

create_world(1)

displayMenu(1)

display(1)

setCube(1)

detection_and_reconstruct(1)

destroy(1)

delete_object(1)

default_Reward(1)

set_level(1)

set_up_level(1)

create_wall(1)

eList(1)

create_station_at(1)

stepBackward(1)

create_random(1)

create_enemy(1)

create_coord_list(1)

createImage(1)

createFields(1)

create(1)

crates(1)

copyDynamicState(1)

display_intro(1)

save_current_page_screenshot(1)

scale(1)

level_index(1)

players(1)

returnStats(1)

performCycle(1)

Méthodes fréquemment utilisées

find_element (30)

World (30)

replace_variables (15)

__init__ (6)

stepForward (3)

get_alert_when_exist (3)

addThing (2)

add_agent (2)

add_market (2)

add_rim (2)

Méthodes fréquemment utilisées

convert_ref_frame (2)

append (2)

direct (2)

curses_display_table (2)

current_state (2)

change_game_state (2)

addObject (2)

add_team (2)

_generateResources (2)

add (2)

restart (1)

create_world (1)

displayMenu (1)

display (1)

setCube (1)

detection_and_reconstruct (1)

destroy (1)

delete_object (1)

default_Reward (1)

set_level (1)

Méthodes fréquemment utilisées

restart (1)

create_world (1)

displayMenu (1)

display (1)

setCube (1)

detection_and_reconstruct (1)

destroy (1)

delete_object (1)

default_Reward (1)

set_level (1)

set_up_level (1)

create_wall (1)

eList (1)

create_station_at (1)

stepBackward (1)

create_random (1)

create_enemy (1)

create_coord_list (1)

createImage (1)

createFields (1)

create (1)

crates (1)

copyDynamicState (1)

display_intro (1)

save_current_page_screenshot (1)

scale (1)

level_index (1)

players (1)

returnStats (1)

performCycle (1)

Méthodes fréquemment utilisées

set_up_level (1)

create_wall (1)

eList (1)

create_station_at (1)

stepBackward (1)

create_random (1)

create_enemy (1)

create_coord_list (1)

createImage (1)

createFields (1)

create (1)

crates (1)

copyDynamicState (1)

display_intro (1)

save_current_page_screenshot (1)

scale (1)

level_index (1)

players (1)

returnStats (1)

performCycle (1)

roundNr (1)

open_browser (1)

numAgents (1)

my_ants (1)

moveDecisions (1)

mobSpawns (1)

maxRounds (1)

gravity (1)

refresh (1)

getworldState (1)

sanctionTokens (1)

contribTokens (1)

get_tool_id (1)

get_surface (1)

get_flights (1)

get_distance_to_others (1)

get_current_page_source (1)

get_alert (1)

find_page (1)

Create (1)

Exemple #1

0

Afficher le fichier

Fichier : run.py Projet : srikirank/Machine-Learning

def valueIteration(defaultReward): discountedValue = 0.9 from World import World instance = World() instance.default_Reward = defaultReward # print instance.isWalls(3,2) # old actions ={'right':[0.8,0.2],'left':[1.0],'up':[0.8,0.2],'down':[1.0]} actions = { "right": {"right": 0.8, "down": 0.2}, "left": {"left": 1.0}, "up": {"up": 0.8, "left": 0.2}, "down": {"down": 1.0}, } # initialize the value valueGrid = [[0 for x in range(instance.world_Column)] for x in range(instance.world_Row)] previousValueGrid = [[0 for x in range(instance.world_Column)] for x in range(instance.world_Row)] iterations = 0 stop = False while not stop: iterations += 1 previousValueGrid = copyMatrix(valueGrid, instance.world_Row, instance.world_Column) for row in range(instance.world_Row): for col in range(instance.world_Column): # for all states # for all actions valueActions = [0, 0, 0, 0] count = 0 if not instance.isWalls(row, col): for key, pairs in actions.iteritems(): total = 0.0 for action, value in pairs.iteritems(): if instance.isWithinWorld(action, row, col): newCoordinates = instance.newPosition(action, row, col) total += value * valueGrid[newCoordinates[0]][newCoordinates[1]] valueActions[count] = instance.getRewards(row, col) + (discountedValue * total) count += 1 valueGrid[row][col] = max(valueActions) # print valueGrid stop = convergence(valueGrid, previousValueGrid, instance.world_Row, instance.world_Column) print valueGrid print "The number of iterations is " + str(iterations)

Exemple #2

0

Afficher le fichier

Fichier : run.py Projet : srikirank/Machine-Learning

def valueIteration(defaultReward): discountedValue = 0.9 from World import World instance = World() instance.default_Reward = defaultReward #print instance.isWalls(3,2) # old actions ={'right':[0.8,0.2],'left':[1.0],'up':[0.8,0.2],'down':[1.0]} actions = {'right':{'right':0.8,'down':0.2},'left':{'left':1.0},'up':{'up':0.8,'left':0.2},'down':{'down':1.0}} #initialize the value valueGrid =[[0 for x in range(instance.world_Column)] for x in range(instance.world_Row)] previousValueGrid =[[0 for x in range(instance.world_Column)] for x in range(instance.world_Row)] iterations = 0 stop = False while not stop : iterations +=1 previousValueGrid = copyMatrix(valueGrid,instance.world_Row,instance.world_Column) for row in range(instance.world_Row): for col in range(instance.world_Column): #for all states #for all actions valueActions=[0,0,0,0] count = 0 if not instance.isWalls(row,col): for key,pairs in actions.iteritems(): total =0.0 for action,value in pairs.iteritems(): if instance.isWithinWorld(action,row,col): newCoordinates = instance.newPosition(action,row,col) total += (value*valueGrid[newCoordinates[0]][newCoordinates[1]]) valueActions[count] = instance.getRewards(row,col) + (discountedValue * total) count +=1 valueGrid[row][col] = max(valueActions) #print valueGrid stop = convergence(valueGrid,previousValueGrid,instance.world_Row,instance.world_Column) print valueGrid print "The number of iterations is "+str(iterations)