Exemplos de read_email_file em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: read_csv

Método / Função: read_email_file

Exemplos em hotexamples.com: 2

read_email_file em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de read_csv.read_email_file em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Relacionados

unwrap

py_get_from_sequence_init

new_event_loop

frame

clean_pkg_name

analyze_wiki

RFQ_Keeper_Controller

harvest_fundref

cart_product

time_format

Related in langs

ConvertDirectoryFactory (PHP)

drupal_session_start (PHP)

OboeteUser (C#)

MarketerSalaryPayment (C#)

remainingAngle (C++)

_getLastOpApplied (C++)

InClusterConfig (Go)

New (Go)

CFSecuritySecGroupIncludeByUIncludeIdxKey (Java)

WDataSeries (Java)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: load_data.py Projeto: jmrohnson/DataScience

def buildEmailText(requests, rebuild = 1, stemmer='PorterStemmer', vectorizer='TfidfVectorizer', num_features = None): rawText = {} output = {} if rebuild: for i in range(0, 54): data_file = data_directory + 'email_text/email_text_tmp_test_' + str(i) + '.txt' print "Reading data from %s" % data_file emails = read_email_file(data_file) # for req_id in emails: # text = emails[req_id] # rawText{req_id}, text]) rawText.update(emails) f = open('pickle_data/rawEmailText.pkl', 'w') pickle.dump(rawText, f) f.close() else: f = open('pickle_data/rawEmailText.pkl', 'r') rawText = pickle.load(f) f.close() requests_only = select_data(requests, 0) requests_only = [[int(req_id)] for req_id in requests_only] append_data(requests_only, rawText) for row in requests_only: if len(row) < 2: row.append("") rawText = [row[1] for row in requests_only] print "New Raw Text Array %i" % len(rawText) print "Got data from files: " print len(rawText) return preProcessText(rawText, stemmer=stemmer, vectorizer=vectorizer, num_features=num_features)

Exemplo n.º 2

0

Exibir arquivo

Arquivo: importEmailText.py Projeto: jmrohnson/DataScience

stemmer = LancasterStemmer() elif stemmer_type == 'RegexpStemmer': stemmer = RegexpStemmer('ing$|s$|e$', min=3) for word in word_list: stemmed_words.append(stemmer.stem(word)) return stemmed_words if __name__ == "__main__": final_out = {} for i in range(0, 44): data_file = data_directory + 'email_text/email_text_tmp_test_' + str(i) + '.txt' print "Reading data from %s" % data_file emails = read_email_file(data_file) for req_id in emails: text = emails[req_id] tokens = word_tokenize(text) tokens = [str(t).lower() for t in tokens] remove_stopwords(tokens) stemmed_words = stemming(tokens, 'PorterStemmer') final_out[req_id] = ' '.join(stemmed_words) i+=1 f = open('testEmailText.pkl', 'w') pickle.dump(final_out, f) f.close()