Python Evaluator.crosslingual_wordsim 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: src.evaluation

클래스/타입: Evaluator

메소드/함수: crosslingual_wordsim

hotexamples.com에서의 예제들: 4

Python Evaluator.crosslingual_wordsim - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 src.evaluation.Evaluator.crosslingual_wordsim에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Evaluator(15)

all_eval(11)

evaluate(3)

crosslingual_wordsim(3)

monolingual_wordsim(2)

benchmarks(2)

dist_mean_cosine(2)

eval_dis(2)

monolingual_wordanalogy(1)

model_selection_criterion(1)

global_ranking_eval(1)

eval_all_dis(1)

export_results(1)

desc_to_code_retrieval_eval(1)

create_boxplots(1)

cluster_accuracy(1)

autoencoder_step(1)

new_translation(1)

예제 #1

파일 보기

                    help="Embedding dimension")
parser.add_argument("--normalize_embeddings",
                    type=str,
                    default="",
                    help="Normalize embeddings before training")

# parse parameters
params = parser.parse_args()

# check parameters
assert params.src_lang, "source language undefined"
assert os.path.isfile(params.src_emb)
assert not params.tgt_lang or os.path.isfile(params.tgt_emb)
assert params.dico_eval == 'default' or os.path.isfile(params.dico_eval)

# build logger / model / trainer / evaluator
logger = initialize_exp(params)
src_emb, tgt_emb, mapping, _ = build_model(params, False)
trainer = Trainer(src_emb, tgt_emb, mapping, None, params)
evaluator = Evaluator(trainer)

# run evaluations
to_log = OrderedDict({'n_iter': 0})
evaluator.monolingual_wordsim(to_log)
# evaluator.monolingual_wordanalogy(to_log)
if params.tgt_lang:
    evaluator.crosslingual_wordsim(to_log)
    evaluator.word_translation(to_log)
    evaluator.sent_translation(to_log)
    # evaluator.dist_mean_cosine(to_log)

예제 #2

파일 보기

parser.add_argument("--src_emb", type=str, default="data/fastText/wiki.en.vec", help="Reload source embeddings")
parser.add_argument("--tgt_emb", type=str, default="data/fastText/wiki.it.vec", help="Reload target embeddings")
parser.add_argument("--max_vocab", type=int, default=200000, help="Maximum vocabulary size (-1 to disable)")
parser.add_argument("--emb_dim", type=int, default=300, help="Embedding dimension")
parser.add_argument("--normalize_embeddings", type=str, default="renorm", help="Normalize embeddings before training")

parser.add_argument("--alpha", type=float, default=0.23, help="Reload the hyper-param alpha")
parser.add_argument("--inv_K", type=int, default=4, help="Reload the hyper-param inv_K")

# parse parameters
params = parser.parse_args()

# check parameters
assert params.src_lang, "source language undefined"
assert os.path.isfile(params.src_emb)
assert not params.tgt_lang or os.path.isfile(params.tgt_emb)
assert params.dico_eval == 'default' or os.path.isfile(params.dico_eval)

# build logger / model / trainer / evaluator
logger = initialize_exp(params)
src_emb, tgt_emb, mapping, _ = build_model(params, False)
trainer = Trainer(src_emb, tgt_emb, mapping, None, params)
evaluator = Evaluator(trainer)

# run evaluations
to_log = OrderedDict({'n_iter': 0})
if params.tgt_lang:
    evaluator.crosslingual_wordsim(to_log, 'row')
    evaluator.word_translation(to_log,  'row')
    evaluator.dist_mean_cosine(to_log,  'row')

예제 #3

파일 보기

파일: evaluate.py 프로젝트: codealphago/MUSE

# reload pre-trained embeddings
parser.add_argument("--src_emb", type=str, default="", help="Reload source embeddings")
parser.add_argument("--tgt_emb", type=str, default="", help="Reload target embeddings")
parser.add_argument("--max_vocab", type=int, default=200000, help="Maximum vocabulary size")
parser.add_argument("--emb_dim", type=int, default=300, help="Embedding dimension")
parser.add_argument("--normalize_embeddings", type=str, default="", help="Normalize embeddings before training")


# parse parameters
params = parser.parse_args()

# check parameters
assert params.src_lang, "source language undefined"
assert os.path.isfile(params.src_emb)
assert not params.tgt_lang or os.path.isfile(params.tgt_emb)

# build logger / model / trainer / evaluator
logger = initialize_exp(params)
src_emb, tgt_emb, mapping, _ = build_model(params, False)
trainer = Trainer(src_emb, tgt_emb, mapping, None, params)
evaluator = Evaluator(trainer)

# run evaluations
to_log = OrderedDict({'n_iter': 0})
evaluator.monolingual_wordsim(to_log)
if params.tgt_lang:
    evaluator.crosslingual_wordsim(to_log)
    evaluator.word_translation(to_log)
    evaluator.sent_translation(to_log)
    # evaluator.dist_mean_cosine(to_log)

예제 #4

파일 보기

파일: evaluate.py 프로젝트: zjulins/umwe

                params.eval_pairs.append(f'{lang1}-{lang2}')

# check parameters
assert len(params.src_langs) > 0, "source language undefined"
assert all([os.path.isfile(emb) for emb in params.src_embs])
assert not params.tgt_lang or os.path.isfile(params.tgt_emb)
assert params.dico_eval == 'default' or os.path.isfile(params.dico_eval)

# build logger / model / trainer / evaluator
logger = initialize_exp(params, dump_params=False, log_name='evaluate.log')
embs, mappings, _ = build_model(params, False)
trainer = Trainer(embs, mappings, None, params)
trainer.reload_best()
evaluator = Evaluator(trainer)

# run evaluations
to_log = OrderedDict({'n_iter': 0})
all_wt = []
evaluator.monolingual_wordsim(to_log)
for eval_pair in params.eval_pairs:
    parts = eval_pair.split('-')
    assert len(parts) == 2, 'Invalid format for evaluation pairs.'
    src_lang, tgt_lang = parts[0], parts[1]
    logger.info(f'Evaluating language pair: {src_lang} - {tgt_lang}')
    evaluator.crosslingual_wordsim(to_log, src_lang=src_lang, tgt_lang=tgt_lang)
    evaluator.word_translation(to_log, src_lang=src_lang, tgt_lang=tgt_lang)
    all_wt.append(to_log[f'{src_lang}-{tgt_lang}_precision_at_1-csls_knn_10'])
    evaluator.sent_translation(to_log, src_lang=src_lang, tgt_lang=tgt_lang)

logger.info(f"Overall Word Translation Precision@1 over {len(all_wt)} language pairs: {sum(all_wt)/len(all_wt)}")