Python load_w2v 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: q60

메소드/함수: load_w2v

hotexamples.com에서의 예제들: 9

Python load_w2v - 9개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 q60.load_w2v에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

def main():
	model = load_w2v(sys.argv[1])
	words = [w for w,_ in model.most_similar(positive=['country'], topn=20)]
	vecs = [model[w] for w in words]
	result = linkage(vecs, method='ward')
	dendrogram(result, labels=words, orientation='right')
	plt.show()

예제 #2

파일 보기

파일: q64.py 프로젝트: Nishihara-Daiki/100knock

def main():
	model = load_w2v(sys.argv[1])
	with open(sys.argv[2]) as f:
		for line in f:
			if line[0] == ':':
				print(line.rstrip())
				continue
			w1, w2, w3, w4 = line.rstrip().split()
			word, prob = model.most_similar(positive=[w2, w3], negative=[w1], topn=1)[0]
			print(' '.join([w1, w2, w3, w4, word, str(prob)]))

예제 #3

파일 보기

파일: q69.py 프로젝트: Nishihara-Daiki/100knock

def main():
    model = load_w2v(sys.argv[1])
    words = [w for w, _ in model.most_similar(positive=['country'], topn=20)]
    vecs = [model[w] for w in words]

    result = TSNE(n_components=2, random_state=0).fit_transform(vecs)

    plt.scatter(result[:, 0], result[:, 1])
    for point, word in zip(result, words):
        x, y = point
        plt.annotate(word, point)
    plt.show()

예제 #4

파일 보기

파일: q67.py 프로젝트: Nishihara-Daiki/100knock

def main():
    model = load_w2v(sys.argv[1])
    words = [w for w, _ in model.most_similar(positive=['country'], topn=20)]
    vecs = [model[w] for w in words]

    labels = KMeans(n_clusters=5, random_state=0).fit_predict(vecs)
    result = [[], [], [], [], []]
    for word, label in zip(words, labels):
        result[label].append(word)

    for label in range(5):
        print('class {}:'.format(label))
        print(', '.join(result[label]) + '\n')

예제 #5

파일 보기

파일: q63.py 프로젝트: Nishihara-Daiki/100knock

def main():
    model = load_w2v(sys.argv[1])
    most_similars = model.most_similar(positive=['Spain', 'Athens'],
                                       negative=['Madrid'])
    for word, prob in most_similars:
        print('{}\t{}'.format(word, prob))

예제 #6

파일 보기

from q63 import analogy


def load_question_words():
    data = pd.read_csv(
        project_path / "data/w2v/questions-words.txt",
        sep=" ",
        skiprows=1,
        header=None,
    )
    data = data[data.iloc[:, 0] != ":"]
    return data


if __name__ == "__main__":
    print("\rSolving Q64 ... ", end="")

    w2v = load_w2v()

    data = load_question_words()
    analogies = [
        analogy(w2v, r[1], r[0], r[2], topn=1)[0]
        for _, r in tqdm(list(data.iterrows()))
    ]
    data.insert(4, 4, [a[0] for a in analogies])
    data.insert(5, 5, [a[1] for a in analogies])

    data.to_csv(project_path / "output/w2v/analogy.csv")

    print("Done.")

예제 #7

파일 보기

파일: q62.py 프로젝트: Nishihara-Daiki/100knock

def main():
    model = load_w2v(sys.argv[1])
    most_similars = model.most_similar('United_States', topn=10)
    for word, prob in most_similars:
        print('{}\t{}'.format(word, prob))

예제 #8

파일 보기

def main():
	model = load_w2v(sys.argv[1])
	similarity = model.similarity('United_States', 'U.S.')
	print(similarity)

예제 #9

파일 보기

파일: q70.py 프로젝트: simaki/nlp100

 def __init__(self, min_freq=1, root=project_path / "data/news/"):
     w2v = load_w2v()
     self.w2v = w2v
     self.min_freq = min_freq
     self.root = root
     self.padding_idx = 0