Python HMM.generate_emission Exemples

Langage de programmation: Python

Espace de nommage/Pack: hmm

Class/Type: HMM

Méthode/Fonction: generate_emission

Exemples au hotexamples.com: 2

Python HMM.generate_emission - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de hmm.HMM.generate_emission extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

HMM(30)

from_file(9)

forward(7)

backward(6)

decode(5)

get_transducer(5)

get_log_lines(5)

get_encoding_length(4)

crossover(4)

fit(4)

get_random_hmm(4)

evaluate(3)

baum_welch(3)

classify(3)

Viterbi(3)

cond_prob(2)

generate_emission(2)

generate_data(2)

learn_from_observations(2)

from_fixed_params(2)

learning(2)

randomStudent(2)

setAij(2)

setBik(2)

B(2)

setPii(2)

A(2)

set_hidden_model(2)

candidates(2)

__init__(2)

classify_instance(2)

baum_welch_multiple(2)

ask(2)

compute(1)

get_random_hmm_totally_random(1)

advance_emission(1)

alpha_scaled(1)

get_default_hmm(1)

get_all_paths(1)

get_connected_components(1)

get_state_sequence(1)

get_all_emissions(1)

get_N(1)

generate_train_data(1)

generate_test_data(1)

get_sequence(1)

add_observation(1)

get_state_sequence_prob(1)

get_theta(1)

generate_gff_file(1)

Méthodes fréquemment utilisées

HMM (30)

from_file (9)

forward (7)

backward (6)

decode (5)

get_transducer (5)

get_log_lines (5)

get_encoding_length (4)

crossover (4)

fit (4)

Méthodes fréquemment utilisées

get_random_hmm (4)

evaluate (3)

baum_welch (3)

classify (3)

Viterbi (3)

cond_prob (2)

generate_emission (2)

generate_data (2)

learn_from_observations (2)

from_fixed_params (2)

learning (2)

randomStudent (2)

setAij (2)

setBik (2)

B (2)

setPii (2)

A (2)

set_hidden_model (2)

candidates (2)

__init__ (2)

Méthodes fréquemment utilisées

learning (2)

randomStudent (2)

setAij (2)

setBik (2)

B (2)

setPii (2)

A (2)

set_hidden_model (2)

candidates (2)

__init__ (2)

classify_instance (2)

baum_welch_multiple (2)

ask (2)

compute (1)

get_random_hmm_totally_random (1)

advance_emission (1)

alpha_scaled (1)

get_default_hmm (1)

get_all_paths (1)

get_connected_components (1)

get_state_sequence (1)

get_all_emissions (1)

get_N (1)

generate_train_data (1)

generate_test_data (1)

get_sequence (1)

add_observation (1)

get_state_sequence_prob (1)

get_theta (1)

generate_gff_file (1)

Méthodes fréquemment utilisées

classify_instance (2)

baum_welch_multiple (2)

ask (2)

compute (1)

get_random_hmm_totally_random (1)

advance_emission (1)

alpha_scaled (1)

get_default_hmm (1)

get_all_paths (1)

get_connected_components (1)

get_state_sequence (1)

get_all_emissions (1)

get_N (1)

generate_train_data (1)

generate_test_data (1)

get_sequence (1)

add_observation (1)

get_state_sequence_prob (1)

get_theta (1)

generate_gff_file (1)

get_transition_matrix (1)

influence (1)

init_random (1)

initial_probability (1)

label_codebook (1)

add_epsilon_emission_to_state (1)

_get_lc (1)

load_theta (1)

populate_alphabets (1)

_forward (1)

_be_prepared_for_baum_welch (1)

_backward (1)

generate_path (1)

backwards (1)

backward_with_scale (1)

emission_loglikelihood (1)

compute_beta (1)

create_hmm_alphabet (1)

create_hmm_from_list (1)

change_segment_in_emission (1)

Exemple #1

0

Afficher le fichier

Fichier : grammar.py Projet : taucompling/morphophonology_spe

class Grammar: def __init__(self, hmm, rule_set=None): if isinstance(hmm, HMM): self.hmm = hmm else: self.hmm = HMM(hmm) segment_table = SegmentTable() self.segment_symbol_length = uniform_encoding.log2(len(segment_table) + 1) # + 1 for the delimiter if rule_set: self.rule_set = rule_set else: self.rule_set = RuleSet(noise=False) noises = configurations.get("NOISE_RULE_SET", []) self.noise_rule_set = RuleSet.load_noise_rules_from_flat_list(noises) self._cached_hmm_transducer = None self._cached_rule_set_transducer = None self._cached_noise_rule_set_transducer = None def generate_word(self): emission = self.hmm.generate_emission() return choice(self.rule_set.get_outputs_of_word(emission)) def generate_all_words(self): # TODO: I think this also generates noised data. This should be fixed. words = [] emissions = self.hmm.generate_all_emissions() for emission in emissions: words += self.rule_set.get_outputs_of_word(emission) return words def get_transducer(self, with_noise=True): hmm_transducer = self.get_hmm_transducer() if "case_name" in configurations.configurations_dict: case_name = configurations.configurations_dict["case_name"] dot(hmm_transducer, "{}_hmm_transducer".format(case_name)) rules_set_transducer = self.get_rule_set_transducer() if with_noise: noise_rules_transducer = self.get_noise_rule_set_transducer() else: noise_rules_transducer = None return self._compose_grammar_transducers( hmm_transducer, rules_set_transducer, noise_rules_transducer ) def _compose_grammar_transducers(self, first_transducer, *other_transducers): composed_transducer = first_transducer for transducer in other_transducers: if transducer: composed_transducer.arc_sort_input() transducer.arc_sort_input() composed_transducer = composed_transducer >> transducer return composed_transducer def get_nfa(self): grammar_pyfst_transducer = self.get_transducer() # dot(grammar_pyfst_transducer, "grammar_pyfst_transducer") # grammar_pyfst_transducer.remove_epsilon() return ParsingNFA.get_from_pyfst_transducer(grammar_pyfst_transducer) def make_mutation(self): mutation_successful = False if ga_config.MUTATE_BOTH_HMM_AND_RULES: hmm_mutation_successful = False rule_set_mutation_successful = False if configurations["EVOLVE_HMM"]: hmm_mutation_successful = self.hmm.make_mutation() if configurations["EVOLVE_RULES"]: rule_set_mutation_successful = self.rule_set.make_mutation() mutation_successful = mutation_successful or rule_set_mutation_successful or hmm_mutation_successful if hmm_mutation_successful: self.invalidate_cached_hmm_transducer() if rule_set_mutation_successful: self.invalidate_cached_rule_set_transducer() else: rule_set_mutation_weight = 0 if not configurations["EVOLVE_RULES"] else configurations["MUTATE_RULE_SET"] hmm_mutation_weight = 0 if not configurations["EVOLVE_HMM"] else configurations["MUTATE_HMM"] mutation_weights = [('rule_set', rule_set_mutation_weight), ('hmm', hmm_mutation_weight)] weighted_mutatable_object_list = get_weighted_list(mutation_weights) object_name_to_mutate = choice(weighted_mutatable_object_list) if object_name_to_mutate == 'rule_set': object_to_mutate = self.rule_set elif object_name_to_mutate == 'hmm': object_to_mutate = self.hmm mutation_successful = object_to_mutate.make_mutation() if mutation_successful: if object_name_to_mutate == 'hmm': self.invalidate_cached_hmm_transducer() elif object_name_to_mutate == 'rule_set': self.invalidate_cached_rule_set_transducer() return mutation_successful def get_encoding_length(self): if not configurations["UNDERSPECIFICATION_FLAG"]: hmm_encoding_length = self.hmm.get_encoding_length(self.segment_symbol_length, restrictions_on_alphabet=configurations["RESTRICTIONS_ON_ALPHABET"]) else: hmm_encoding_length = self.hmm.get_underspecified_encoding_length() rules_encoding_length = self.rule_set.get_encoding_length() return hmm_encoding_length, rules_encoding_length def generate_word_list(self, n): result = [] for _ in range(n): result.append(self.generate_word()) return result def get_all_outputs(self, with_noise=True): transducer = self.get_transducer(with_noise=with_noise) if configurations["MINIMIZE_TRANSDUCER"]: transducer = self.minimize_transducer(transducer) transducer_symbol_table = SegmentTable().transducer_symbol_table outputs = list() for path in transducer.paths(): output = "" for i in path: symbol = transducer_symbol_table.find(i.olabel) if symbol != u"\u03b5" and symbol != MORPHEME_BOUNDARY and symbol != WORD_BOUNDARY: output += symbol outputs.append(output) return outputs def get_hmm_transducer(self): if self._cached_hmm_transducer is None: self._cached_hmm_transducer = self.hmm.get_transducer() return self._cached_hmm_transducer def get_rule_set_transducer(self): if self._cached_rule_set_transducer is None: # rule set transducer may be None self._cached_rule_set_transducer = self.rule_set.get_transducer() return self._cached_rule_set_transducer def get_noise_rule_set_transducer(self): if self._cached_noise_rule_set_transducer is None: self._cached_noise_rule_set_transducer = self.noise_rule_set.get_transducer() return self._cached_noise_rule_set_transducer def get_log_lines(self): return self.hmm.get_log_lines() + self.rule_set.get_log_lines() def invalidate_cached_hmm_transducer(self): self._cached_hmm_transducer = None def invalidate_cached_rule_set_transducer(self): self._cached_rule_set_transducer = None @staticmethod def minimize_transducer(transducer): transducer.project_output() transducer = transducer.determinize() transducer.minimize() return transducer def __getstate__(self): # Don't pickle cached transducers state = self.__dict__.copy() state['_cached_hmm_transducer'] = None state['_cached_rule_set_transducer'] = None state['_cached_noise_rule_set_transducer'] = None return state

Exemple #2

0

Afficher le fichier

Fichier : grammar.py Projet : anna-hope/morphophonology_spe

class Grammar: def __init__(self, hmm, rule_set=None): if isinstance(hmm, HMM): self.hmm = hmm else: self.hmm = HMM(hmm) segment_table = SegmentTable() self.segment_symbol_length = ceil(log(len(segment_table) + 1, 2)) # + 1 for the delimiter if rule_set: self.rule_set = rule_set else: self.rule_set = RuleSet() def generate_word(self): emission = self.hmm.generate_emission() return choice(self.rule_set.get_outputs_of_word(emission)) def get_transducer(self): hmm_transducer = self.hmm.get_transducer() if "case_name" in configurations.configurations_dict: case_name = configurations.configurations_dict["case_name"] dot(hmm_transducer, "{}_hmm_transducer".format(case_name)) rules_set_transducer = self.rule_set.get_transducer() if rules_set_transducer: hmm_transducer.arc_sort_input() rules_set_transducer.arc_sort_input() composed_hmm_rules_transducer = hmm_transducer >> rules_set_transducer else: composed_hmm_rules_transducer = hmm_transducer return composed_hmm_rules_transducer def get_nfa(self): grammar_pyfst_transducer = self.get_transducer() # dot(grammar_pyfst_transducer, "grammar_pyfst_transducer") # grammar_pyfst_transducer.remove_epsilon() return ParsingNFA.get_from_pyfst_transducer(grammar_pyfst_transducer) def make_mutation(self): num_mutations = randint(1, ga_config.MAX_MUTATIONS) mutation_result = False for _ in range(num_mutations): if ga_config.MUTATE_BOTH_HMM_AND_RULES: rule_set_success = False hmm_success = False if configurations["EVOLVE_RULES"]: rule_set_success = self.rule_set.make_mutation() if configurations["EVOLVE_HMM"]: hmm_success = self.hmm.make_mutation() mutation_result = mutation_result or rule_set_success or hmm_success else: rule_set_mutation_weight = 0 if not configurations[ "EVOLVE_RULES"] else configurations["MUTATE_RULE_SET"] hmm_mutation_weight = 0 if not configurations[ "EVOLVE_HMM"] else configurations["MUTATE_HMM"] mutation_weights = [(self.rule_set, rule_set_mutation_weight), (self.hmm, hmm_mutation_weight)] weighted_mutatable_object_list = get_weighted_list( mutation_weights) object_to_mutate = choice(weighted_mutatable_object_list) mutation_result = object_to_mutate.make_mutation() return mutation_result def get_encoding_length(self): if not configurations["UNDERSPECIFICATION_FLAG"]: hmm_encoding_length = self.hmm.get_encoding_length( self.segment_symbol_length, restrictions_on_alphabet=configurations[ "RESTRICTIONS_ON_ALPHABET"]) else: hmm_encoding_length = self.hmm.get_underspecified_encoding_length() rules_encoding_length = self.rule_set.get_encoding_length() return hmm_encoding_length, rules_encoding_length def generate_word_list(self, n): result = [] for _ in range(n): result.append(self.generate_word()) return result def get_all_outputs(self): transducer = self.get_transducer() transducer_symbol_table = SegmentTable().transducer_symbol_table outputs = list() for path in transducer.paths(): output = "" for i in path: symbol = transducer_symbol_table.find(i.olabel) if symbol != u"\u03b5" and symbol != MORPHEME_BOUNDARY and symbol != WORD_BOUNDARY: output += symbol outputs.append(output) return outputs