Python split_into_sentences Exemples

Langage de programmation: Python

Espace de nommage/Pack: unbabel_text_utils.utils.split_text

Méthode/Fonction: split_into_sentences

Exemples au hotexamples.com: 3

Python split_into_sentences - 3 exemples trouvés. Ce sont les exemples réels les mieux notés de unbabel_text_utils.utils.split_text.split_into_sentences extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Associées

polynomial

computeIntHash

delay

getTimeTodayForUTC

ShotgunORM

FormatSMVRigaku

sum_by_rebin_frac

join_unicode

get_score

numtobytes

Related in langs

Generator (PHP)

Horde_MIME_Structure (PHP)

PhysicsSettings (C#)

C1ButtonTool (C#)

transition_t (C++)

init_cpu_arch (C++)

NewCountReader (Go)

RootCause (Go)

DiffPanel (Java)

IBinaryMethod (Java)

Exemple #1

0

Afficher le fichier

Fichier : test_split_sentences.py Projet : Unbabel/unbabel-text-utils

def test_split_text_and_recombine_en(self): directory = get_data_dir()+"/texts/en" for i,fn in enumerate(os.listdir(directory)): with self.subTest(i=i): text = codecs.open("%s/%s"%(directory,fn), encoding="utf-8").read() sentences, skeleton, _, _ = split_into_sentences(text,lang="en") for sentence in sentences: self.assertEqual(sentence.strip(),sentence, "Error sentences have extra spaces on edges:\n%s\n%s\n" % (sentence, sentence.strip())) new_text = join_sentences(sentences, skeleton) self.assertEqual(text,new_text, "\nT: -%s-\nN: -%s-" %(text, new_text))

Exemple #2

0

Afficher le fichier

Fichier : test_split_sentences.py Projet : Unbabel/unbabel-text-utils

def test_joint_puntation_zh(self): sentences, sizes = self.parse_data_file("sentences_with_join_punct_zh.txt") for i, (sentence, size) in enumerate(izip(sentences,sizes)): with self.subTest(i=i): sentences,_,_,_ = split_into_sentences(sentence, lang="zh-CN") self.assertEqual(len(sentences),size, "%s \n %s"%(sentence, sentences))

Exemple #3

0

Afficher le fichier

Fichier : test_split_sentences.py Projet : Unbabel/unbabel-text-utils

def test_joint_puntation_en(self): sentences, sizes = self.parse_data_file("sentences_with_join_punct_en.txt") for sentence, size in izip(sentences,sizes): with self.subTest(sentence=sentence): sentences,_,_,_ = split_into_sentences(sentence, lang="en") self.assertEqual(len(sentences),size, "%s \n %s"%(sentence, sentences))