Python read_sgm Exemples

Langage de programmation: Python

Espace de nommage/Pack: serif

Méthode/Fonction: read_sgm

Exemples au hotexamples.com: 2

Python read_sgm - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de serif.read_sgm extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Associées

Gallery

get

get_id_values

ring

get_audio_file

extract_config_selector

convertStateSeq_MAT2list

request_is_embedded

interpolate_bezier

BinaryLabels

Related in langs

acces_exceptionnel_saisie_cn_groupe_periode (PHP)

ChannelVideos (PHP)

TextChangedEvent (C#)

AntlrDocumentBuilder (C#)

tb_list_insert_tail (C++)

parse_result_page (C++)

CopyFile (Go)

MakeFileNode (Go)

ObjectFile (Java)

EventBus (Java)

Exemple #1

0

Afficher le fichier

# # [sgm] # the .sgm file # # [apf] # the .apf file # # Output: Written into the standard output. # The line number of the selected sentence and the sentence separated by a space. import sys import re import bisect from xml.dom.minidom import parse import serif import datetime if __name__ == "__main__": if len(sys.argv) != 4: print "Usage: pick_recent_date.py [date] [text] [apf]" sys.exit(1) date = serif.convert_to_date(sys.argv[1]) text = serif.read_sgm(sys.argv[2]) data = serif.read_apf(text, sys.argv[3]) btimex = serif.find_best_timex(date, text, data) if btimex: start, end = text.expand(btimex.start, btimex.end) line = serif.resolveCoref(text, data, start, end) print text.find(start) - 1, line.encode("utf-8")

Exemple #2

0

Afficher le fichier

Fichier : pick_from_clusters.py Projet : Yuyue/wikitopics

return clusters if __name__=='__main__': if len(sys.argv) != 4: print "Usage: pick_recent_date.py [YYYY-MM-DD] [/path/to/cluster/file] [/path/to/apf/directory/]" sys.exit(1) date = serif.convert_to_date(sys.argv[1]) clusters = read_clusters(open(sys.argv[2], 'r')) path = sys.argv[3] for cluster in clusters: btimex = None for article in cluster: article = article.decode('utf-8') try: text = serif.read_sgm(os.path.join(path, article + '.sentences.sgm')) data = serif.read_apf(os.path.join(path, article + '.sentences.sgm.apf')) old_btimex = btimex btimex = serif.find_best_timex(date, text, data, btimex) if btimex != old_btimex: start, end = text.expand(btimex.start, btimex.end) line = serif.resolveCoref(text, data, start, end) print article.encode('utf-8') except IOError: print article.encode('utf-8') + ' # exempted due to error. check if the apf file exists.' if btimex and line: print line.encode('utf-8') print