Python Document.content Exemples

Langage de programmation: Python

Espace de nommage/Pack: document

Class/Type: Document

Méthode/Fonction: content

Exemples au hotexamples.com: 7

Python Document.content - 7 exemples trouvés. Ce sont les exemples réels les mieux notés de document.Document.content extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

Document(30)

__init__(9)

new_shape(5)

content(4)

apply_op(4)

snapshot(4)

delete(3)

classification(3)

getWords(3)

concatenate(3)

add_header(2)

preprocess_text(2)

getName(2)

calc_hash(2)

getNumDifferentWords(2)

getNumParagraphs(2)

add_predictions(2)

getNumTotalWords(2)

add_tag(2)

getWordCount(2)

getNumSentences(2)

copy(2)

create_or_update(2)

addCut(2)

add(2)

result_file(2)

create(2)

date(2)

render(2)

getPostingsList(1)

download(1)

empty(1)

getUrls(1)

getTopWords(1)

getMostFrequentWord(1)

end_user_action(1)

files(1)

genre(1)

getClause(1)

getClausesList(1)

getImage(1)

getMostFrequentWords(1)

ChangePage(1)

get_selection(1)

getWordsAboveFrequency(1)

remove(1)

tokenize(1)

subscribe_user(1)

statistics(1)

setTextPath(1)

Méthodes fréquemment utilisées

Document (30)

__init__ (9)

new_shape (5)

content (4)

apply_op (4)

snapshot (4)

delete (3)

classification (3)

getWords (3)

concatenate (3)

Méthodes fréquemment utilisées

add_header (2)

preprocess_text (2)

getName (2)

calc_hash (2)

getNumDifferentWords (2)

getNumParagraphs (2)

add_predictions (2)

getNumTotalWords (2)

add_tag (2)

getWordCount (2)

getNumSentences (2)

copy (2)

create_or_update (2)

addCut (2)

add (2)

result_file (2)

create (2)

date (2)

render (2)

getPostingsList (1)

Méthodes fréquemment utilisées

getNumSentences (2)

copy (2)

create_or_update (2)

addCut (2)

add (2)

result_file (2)

create (2)

date (2)

render (2)

getPostingsList (1)

download (1)

empty (1)

getUrls (1)

getTopWords (1)

getMostFrequentWord (1)

end_user_action (1)

files (1)

genre (1)

getClause (1)

getClausesList (1)

getImage (1)

getMostFrequentWords (1)

ChangePage (1)

get_selection (1)

getWordsAboveFrequency (1)

remove (1)

tokenize (1)

subscribe_user (1)

statistics (1)

setTextPath (1)

Méthodes fréquemment utilisées

download (1)

empty (1)

getUrls (1)

getTopWords (1)

getMostFrequentWord (1)

end_user_action (1)

files (1)

genre (1)

getClause (1)

getClausesList (1)

getImage (1)

getMostFrequentWords (1)

ChangePage (1)

get_selection (1)

getWordsAboveFrequency (1)

remove (1)

tokenize (1)

subscribe_user (1)

statistics (1)

setTextPath (1)

setProject (1)

setPrefix (1)

setParserObject (1)

setName (1)

setNESet (1)

setNERMap (1)

setMentionToClusterMap (1)

setMentionClustersList (1)

setFeatures (1)

ready (1)

getWordsEqualToFrequency (1)

read (1)

proofread (1)

prepare (1)

name (1)

m_pos (1)

m_docId (1)

loadXML (1)

lines (1)

isMissing (1)

Exemple #1

0

Afficher le fichier

Fichier : _test_pdf.py Projet : gcsolaroli/metadata-processor

def test_parseSimplePdf (self): samplePdfFile = os.path.join(os.getcwd(), 'samples', 'pdf', '01_simple_text.pdf') pdfProcessor = PdfProcessor(samplePdfFile) document = pdfProcessor.document() expectedDocument = Document().initWithFile(os.path.join(os.getcwd(), 'samples', 'expected outcome', 'docx', 'test_01')) self.assertEquals(expectedDocument.content(), document.content()) self.assertEquals(expectedDocument.formatting(), document.formatting())

Exemple #2

0

Afficher le fichier

Fichier : test_docx.py Projet : simplicissimus/metadata-processor

def test_textWithLineBlocks (self): sampleDocxFile = os.path.join(os.getcwd(), 'samples', 'docx', '08_line_blocks.docx') docxProcessor = DocxProcessor(sampleDocxFile) document = docxProcessor.document() expectedDocument = Document().initWithFile(os.path.join(os.getcwd(), 'samples', 'expected outcome', 'docx', 'test_08')) self.assertEquals(expectedDocument.content(), document.content()) self.assertEquals(expectedDocument.formatting(), document.formatting())

Exemple #3

0

Afficher le fichier

Fichier : test_docx.py Projet : simplicissimus/metadata-processor

def test_textWithWeirdFormatting (self): sampleDocxFile = os.path.join(os.getcwd(), 'samples', 'docx', '11_weird_formatting.docx') docxProcessor = DocxProcessor(sampleDocxFile) document = docxProcessor.document() expectedDocument = Document().initWithFile(os.path.join(os.getcwd(), 'samples', 'expected outcome', 'docx', 'test_11')) self.assertEquals(expectedDocument.content(), document.content()) self.assertEquals(expectedDocument.formatting(), document.formatting())

Exemple #4

0

Afficher le fichier

Fichier : test_substance.py Projet : gcsolaroli/metadata-processor

def test_sampleDocumentProcessing (self): sampleSubstanceFile = os.path.join(os.getcwd(), 'samples', 'substance', '01_sample.json') substanceProcessor = SubstanceProcessor().initWithFile(sampleSubstanceFile) document = substanceProcessor.document() expectedDocument = Document().initWithFile(os.path.join(os.getcwd(), 'samples', 'expected outcome', 'substance_01')) print("DOCUMENT METADATA: " + str(document.metadata())) self.assertEqual(expectedDocument.content(), document.content()) self.assertEqual(expectedDocument.metadata(), document.metadata())

Exemple #5

0

Afficher le fichier

Fichier : _test_pdf.py Projet : simplicissimus/metadata-processor

def test_parseSimplePdf(self): samplePdfFile = os.path.join(os.getcwd(), 'samples', 'pdf', '01_simple_text.pdf') pdfProcessor = PdfProcessor(samplePdfFile) document = pdfProcessor.document() expectedDocument = Document().initWithFile( os.path.join(os.getcwd(), 'samples', 'expected outcome', 'docx', 'test_01')) self.assertEquals(expectedDocument.content(), document.content()) self.assertEquals(expectedDocument.formatting(), document.formatting())

Exemple #6

0

Afficher le fichier

Fichier : test_substance.py Projet : simplicissimus/metadata-processor

def test_sampleDocumentProcessing(self): sampleSubstanceFile = os.path.join(os.getcwd(), 'samples', 'substance', '01_sample.json') substanceProcessor = SubstanceProcessor().initWithFile( sampleSubstanceFile) document = substanceProcessor.document() expectedDocument = Document().initWithFile( os.path.join(os.getcwd(), 'samples', 'expected outcome', 'substance_01')) print("DOCUMENT METADATA: " + str(document.metadata())) self.assertEqual(expectedDocument.content(), document.content()) self.assertEqual(expectedDocument.metadata(), document.metadata())

Exemple #7

0

Afficher le fichier

Fichier : corpus.py Projet : zaopuppy/settings

def corpus_line(file_path: str, encoding='utf-8', zip_type=None): suffix = '' if not zip_type else '.' + zip_type # class label class_label_file = os.path.join(file_path, '.labels' + suffix) if os.path.isfile(class_label_file): class_label_iter = parse_file(class_label_file, encoding=encoding, zip_type=zip_type) else: class_label_iter = itertools.repeat('[none]') # document name doc_name_file = os.path.join(file_path, '.names' + suffix) if os.path.isfile(doc_name_file): doc_name_iter = parse_file(doc_name_file, encoding=encoding, zip_type=zip_type) else: doc_name_iter = itertools.repeat('[none]') # doc content content_iter = parse_file(file_path + suffix, encoding=encoding, zip_type=zip_type) for doc_id, class_label, name, content in\ zip(itertools.count(0), class_label_iter, doc_name_iter, content_iter): doc = Document(name, doc_id, class_label) doc.content = content yield doc