Python Document.process_document Exemples

Langage de programmation: Python

Espace de nommage/Pack: models.document

Class/Type: Document

Méthode/Fonction: process_document

Exemples au hotexamples.com: 1

Python Document.process_document - 1 exemples trouvés. Ce sont les exemples réels les mieux notés de models.document.Document.process_document extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

Document(30)

from_json(6)

path(5)

getkey(4)

save(4)

query(4)

text(3)

open(3)

updated_at(2)

to_dict(2)

tags(2)

partner(2)

new(2)

name(2)

meta(2)

value(2)

get_revision_by_timestamp(2)

date(2)

htmlcontent(1)

put(1)

clone(1)

csscontent(1)

documentName(1)

elastic_score(1)

get_by_dates(1)

process_document(1)

account(1)

get_by_page(1)

get_content(1)

get_id(1)

newname(1)

get_latest_revision(1)

get_title(1)

key(1)

Méthodes fréquemment utilisées

Document (30)

from_json (6)

path (5)

getkey (4)

save (4)

query (4)

text (3)

open (3)

updated_at (2)

to_dict (2)

Méthodes fréquemment utilisées

tags (2)

partner (2)

new (2)

name (2)

meta (2)

value (2)

get_revision_by_timestamp (2)

date (2)

htmlcontent (1)

put (1)

clone (1)

csscontent (1)

documentName (1)

elastic_score (1)

get_by_dates (1)

process_document (1)

account (1)

get_by_page (1)

get_content (1)

get_id (1)

Méthodes fréquemment utilisées

clone (1)

csscontent (1)

documentName (1)

elastic_score (1)

get_by_dates (1)

process_document (1)

account (1)

get_by_page (1)

get_content (1)

get_id (1)

newname (1)

get_latest_revision (1)

get_title (1)

key (1)

Méthodes fréquemment utilisées

newname (1)

get_latest_revision (1)

get_title (1)

key (1)

Exemple #1

0

Afficher le fichier

def load_docs(self): """ Aims at loading all the collection's documents (processed) in the collection instance. """ pickle_path = f"pickle/{self.name}_docs.p" try: self.documents = load(open(pickle_path, "rb")) self.number_of_docs = len(self.documents) except FileNotFoundError: number_document_loaded = 0 for id_directory in range(10): print(f"Loading directory {id_directory}") path_directory = self.path_to_corpus + str(id_directory) for text_file in listdir(path_directory): # create a document instance document = Document( id_doc=number_document_loaded, id_folder=id_directory, address=text_file, ) # load data and process documents (filter, remove stopwords and lemmatize) document.get_content(self.path_to_corpus) document.process_document(stopwords_list=self.stopwords, lemmatizer=self.lemmatizer) self.documents.append(document) number_document_loaded += 1 makedirs(path.dirname(pickle_path), exist_ok=True) dump(self.documents, open(pickle_path, "wb")) self.number_of_docs = number_document_loaded