Python MarkovChain.save_training 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: markov_chain

클래스/타입: MarkovChain

메소드/함수: save_training

hotexamples.com에서의 예제들: 6

Python MarkovChain.save_training - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 markov_chain.MarkovChain.save_training에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

MarkovChain(30)

add(7)

save_training(6)

generate_tweet(6)

generateDatabase(4)

generate(4)

train(3)

load_training(3)

generate_sentence(3)

forward(2)

make_sentence(2)

generateStringWithSeed(2)

generateString(2)

walk(2)

add_text(2)

chain(2)

bulk_adjust_weights(2)

build(2)

backward(2)

addState(2)

add_value(2)

are_similiar(2)

dumpdb(1)

add_probability(1)

rand(1)

random_walk(1)

random_walk_string(1)

read_file(1)

run(1)

step(1)

setStartStateProbabilities(1)

set_tokenizer(1)

observe_file(1)

to_json(1)

train_model(1)

train_on_file(1)

update_stationary(1)

update_trans(1)

parse_and_add(1)

init_left_right(1)

next_chord(1)

generate_random_sentence(1)

fit(1)

forecast_weather(1)

generateData(1)

build_markov(1)

generateStringWithTopics(1)

generate_chain(1)

generate_quote(1)

append_to_matrix(1)

예제 #1

파일 보기

import sqlite3
from sqlite3 import Error
from markov_chain import MarkovChain

chain = MarkovChain()

database = '/home/drue/Deployment/star_trek_club/star_trek_db.sqlite3'
connection = sqlite3.connect(database)
cursor = connection.cursor()

char_name = 'PICARD'

cursor.execute('SELECT id FROM characters WHERE name=?', (char_name, ))
char_id = cursor.fetchone()[0]

cursor.execute('SELECT line FROM lines WHERE character_id=?', (char_id, ))
for result in cursor.fetchall():
    chain.train(result[0].replace('...', '').replace('--', ''))

chain.save_training(f'bin/star_trek/{char_name}.bin')

예제 #2

파일 보기

파일: scrape_trends.py 프로젝트: caseinpoint/twitter_bots

                                    max_id=next_id,
                                    lang='en')
        for t in tweets['statuses']:
            if EXCLUDE_WORDS.search(t['full_text']) is None:
                tweet = TEXT_ONLY.sub(' ', t['full_text'])
                tweet = RETWEET.sub(' ', tweet)
                tweet = USER_NAME.sub(' ', tweet)
                tweet = LINKS.sub(' ', tweet)
                tweet = AMPERSAND.sub('and', tweet)
                tweet = TYPO_HASHTAGS.sub(fix_hashtag, tweet)
                tweet = TYPO_PERIOD.sub(fix_period, tweet)
                tweet = TYPO_QUESTION.sub(fix_question, tweet)
                tweet = TYPO_EXCLAMATION.sub(fix_exclamation, tweet)
                tweet = LONE_PUNCTUATION.sub(' ', tweet)
                tweet = GT.sub('>', tweet)
                tweet = LT.sub('<', tweet)
                chain.train(tweet)
    print(f'len(chain.tree): {len(chain.tree)}')

chain.bulk_adjust_weights(fitness_functions=[
    aw_mult(aw_favor_complexity, .001),
    aw_mult(aw_favor_punctuation, .00015),
    aw_mult(aw_favor_alternating_complexity, .1)
],
                          iterations=len(chain.tree))

chain.save_training('bin/twitter/trending.bin')

print(
    f'Sample tweet: {chain.generate_tweet(append_tag="Category: #trending")}')

예제 #3

파일 보기

파일: bot_spam_user.py 프로젝트: caseinpoint/twitter_bots

        break
print(f'# of tweets: {len(tweets)}')

for t in tweets:
    # if 'retweeted_status' in t:
    # 	continue
    # tweet = USER_NAME.sub(' ', t['full_text'])
    tweet = LINKS.sub(' ', t['full_text'])
    tweet = AMPERSAND.sub('&', tweet)
    tweet = GT.sub('>', tweet)
    tweet = LT.sub('<', tweet)
    chain.train(tweet)
print(f'length of chain: {len(chain.tree)}\n')

# chain.bulk_adjust_weights(fitness_functions=[aw_mult(aw_favor_complexity, .001), aw_mult(aw_favor_punctuation, .00015), aw_mult(aw_favor_alternating_complexity, .1)], iterations=len(chain.tree))
chain.save_training(f'bin/twitter/{user}.bin')

tweets = [tweets[i] for i in range(100)]
tweets.reverse()

print(f'{"—"*64}\n')
replies = 0
for t in tweets:
    replies += 1
    print(f'___tweet #{replies}___\n')
    print(f'___original tweet:___\n{t["full_text"]}\n')

    words = sorted(re.split(r'[^a-zA-Z#]', t['full_text']),
                   key=lambda w: len(w),
                   reverse=True)
    begin = None

예제 #4

파일 보기

파일: scrape_u.py 프로젝트: caseinpoint/twitter_bots

	print(f'search_term: {user}')
	tweets = twit.statuses.user_timeline(screen_name=user, count=200, tweet_mode='extended', include_rts=False, trim_user=True)
	for t in tweets:
		if EXCLUDE_WORDS.search(t['full_text']) is None:
			tweet = TEXT_ONLY.sub(' ', t['full_text'])
			tweet = USER_NAME.sub(' ', tweet)
			tweet = LINKS.sub(' ', tweet)
			tweet = TYPO_HASHTAGS.sub(fix_hashtag, tweet)
			tweet = TYPO_PERIOD.sub(fix_period, tweet)
			tweet = TYPO_QUESTION.sub(fix_question, tweet)
			tweet = TYPO_EXCLAMATION.sub(fix_exclamation, tweet)
			tweet = LONE_PUNCTUATION.sub(' ', tweet)
			tweet = AMPERSAND.sub('and', tweet)
			tweet = GT.sub('>', tweet)
			tweet = LT.sub('<', tweet)
			chain.train(tweet)
		# chain.train(t['full_text'])
	print(f'len(chain.tree): {len(chain.tree)}')

chain.bulk_adjust_weights(fitness_functions=[aw_mult(aw_favor_complexity, .001), aw_mult(aw_favor_punctuation, .00015), aw_mult(dg_disfavor_consecutive_hashtags, .001)], iterations=len(chain.tree))

print('Sample tweet:', chain.generate_tweet())

# chain.save_training('bin/twitter/apologists.bin')
# chain.save_training('bin/twitter/atheists.bin')
chain.save_training('bin/twitter/news.bin')
# chain.save_training('bin/twitter/newagers.bin')
# chain.save_training('bin/twitter/churches.bin')
# chain.save_training('bin/twitter/trumpsterfire.bin')
# chain.save_training('bin/twitter/meta.bin')

예제 #5

파일 보기

    next_id = re.split(r'\D+', tweets['search_metadata']['next_results'])[1]
    try:
        tweets = twit.search.tweets(q=query,
                                    count=100,
                                    lang='en',
                                    result_type='recent',
                                    tweet_mode='extended',
                                    include_entities=False,
                                    max_id=next_id)
    except Exception as e:
        print('____an error occurred____')
        print(f'____search ended at i = {i+1}____')
        break
    for t in tweets['statuses']:
        if EXCLUDE_WORDS.search(t['full_text']) is None:
            tweet = clean_tweet(t['full_text'])
            chain.train(tweet)
print(f'____len(chain.tree) = {len(chain.tree)}____')

print('____adjusting weights, this may take a moment____')
chain.bulk_adjust_weights(fitness_functions=[
    aw_mult(aw_favor_complexity, .001),
    aw_mult(dg_disfavor_consecutive_hashtags, .001)
],
                          iterations=len(chain.tree))
print('____done____')

chain.save_training('bin/twitter/beliefs.bin')

print('____sample tweet____:\n', chain.generate_tweet())

예제 #6

파일 보기

from markov_chain import MarkovChain
from markov_algorithms import *

chain = MarkovChain()

chain.train_on_file(filename='training_txt/quran.txt', verbose=True)
chain.train_on_file(filename='training_txt/new_testament.csv', verbose=True)

print(f'len(chain.tree): {len(chain.tree)}\n')

# print('Adjusting weights. This may take a while.\n_\n')
# chain.bulk_adjust_weights(fitness_functions=[aw_mult(aw_favor_complexity, .001), aw_mult(aw_favor_punctuation, .00015), aw_mult(aw_favor_alternating_complexity, .1)], iterations=len(chain.tree))

chain.save_training('bin/quran_testament.bin')

for i in range(8):
    print(chain.generate_tweet(append_tag=None, follow=False), '\n_\n')