Python Entry.id示例

编程语言: Python

命名空间/包名称: senpy.models

类/类型: Entry

方法/功能: id

hotexamples.com的示例: 5

Python Entry.id - 已找到5个示例。这些是从开源项目中提取的最受好评的senpy.models.Entry.id现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

Entry(29)

nif__isString(9)

emotions(4)

language(4)

id(3)

sentiments(2)

jsonld(1)

nif__beginIndex(1)

nif__endIndex(1)

validate(1)

示例#1

显示文件

文件： test_models.py 项目： gsi-upm/senpy

 def test_id(self):
     """ Adding the id after creation should overwrite the automatic ID
     """
     r = Entry(_auto_id=True)
     j = r.jsonld()
     assert '@id' in j
     r.id = "test"
     j2 = r.jsonld()
     assert j2['@id'] == 'test'
     assert 'id' not in j2

示例#2

显示文件

文件： test_models.py 项目： Shasthojoy/senpy

 def test_id(self):
     """ Adding the id after creation should overwrite the automatic ID
     """
     r = Entry()
     j = r.jsonld()
     assert '@id' in j
     r.id = "test"
     j2 = r.jsonld()
     assert j2['@id'] == 'test'
     assert 'id' not in j2

示例#3

显示文件

 def analyse_entry(self, entry, params):
     chunker_type = params["delimiter"]
     original_text = entry['nif:isString']
     if chunker_type == "sentence":
         tokenizer = PunktSentenceTokenizer()
     if chunker_type == "paragraph":
         tokenizer = LineTokenizer()
     chars = list(tokenizer.span_tokenize(original_text))
     for i, chunk in enumerate(tokenizer.tokenize(original_text)):
         print(chunk)
         e = Entry()
         e['nif:isString'] = chunk
         if entry.id:
             e.id = entry.id + "#char={},{}".format(chars[i][0], chars[i][1])
         yield e

示例#4

显示文件

 def analyse_entry(self, entry, params):
     yield entry
     chunker_type = params["delimiter"]
     original_text = entry['nif:isString']
     if chunker_type == "sentence":
         tokenizer = PunktSentenceTokenizer()
     if chunker_type == "paragraph":
         tokenizer = LineTokenizer()
     chars = list(tokenizer.span_tokenize(original_text))
     if len(chars) == 1:
         # This sentence was already split
         return
     for i, chunk in enumerate(chars):
         start, end = chunk
         e = Entry()
         e['nif:isString'] = original_text[start:end]
         if entry.id:
             e.id = entry.id + "#char={},{}".format(start, end)
         yield e

示例#5

显示文件

文件： split_plugin.py 项目： gsi-upm/senpy

 def analyse_entry(self, entry, activity):
     yield entry
     chunker_type = activity.params["delimiter"]
     original_text = entry['nif:isString']
     if chunker_type == "sentence":
         tokenizer = PunktSentenceTokenizer()
     if chunker_type == "paragraph":
         tokenizer = LineTokenizer()
     chars = list(tokenizer.span_tokenize(original_text))
     if len(chars) == 1:
         # This sentence was already split
         return
     for i, chunk in enumerate(chars):
         start, end = chunk
         e = Entry()
         e['nif:isString'] = original_text[start:end]
         if entry.id:
             e.id = entry.id + "#char={},{}".format(start, end)
         yield e