Python UbuntuCorpus示例

编程语言: Python

命名空间/包名称: cotk.dataloader

类/类型: UbuntuCorpus

hotexamples.com的示例: 4

Python UbuntuCorpus - 已找到4个示例。这些是从开源项目中提取的最受好评的cotk.dataloader.UbuntuCorpus现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

UbuntuCorpus(4)

常用方法

UbuntuCorpus (4)

示例#1

显示文件

文件： test_multi_turn_dialog.py 项目： xiaoanshi/cotk

	def _load_ubuntucorpus(min_rare_vocab_times=0):
		return UbuntuCorpus("./tests/dataloader/dummy_ubuntucorpus#Ubuntu", min_rare_vocab_times=min_rare_vocab_times)

示例#2

显示文件

文件： test_multi_turn_dialog.py 项目： xiaoanshi/cotk

	def _load_ubuntucorpus(min_rare_vocab_times=0):
		from transformers import GPT2Tokenizer
		toker = PretrainedTokenizer(GPT2Tokenizer('./tests/dataloader/dummy_gpt2vocab/vocab.json', './tests/dataloader/dummy_gpt2vocab/merges.txt'))
		return UbuntuCorpus("./tests/dataloader/dummy_ubuntucorpus#Ubuntu", min_rare_vocab_times=min_rare_vocab_times, tokenizer=toker, pretrained="gpt2")

示例#3

显示文件

文件： test_multi_turn_dialog.py 项目： xiaoanshi/cotk

	def _load_ubuntucorpus(min_rare_vocab_times=0):
		from transformers import BertTokenizer
		toker = PretrainedTokenizer(BertTokenizer('./tests/dataloader/dummy_bertvocab/vocab.txt'))
		return UbuntuCorpus("./tests/dataloader/dummy_ubuntucorpus#Ubuntu", min_rare_vocab_times=min_rare_vocab_times, tokenizer=toker, pretrained="bert")

示例#4

显示文件

文件： test_multi_turn_dialog.py 项目： lemon234071/cotk

 def _load_ubuntucorpus(invalid_vocab_times=0):
     return UbuntuCorpus("./tests/dataloader/dummy_ubuntucorpus#Ubuntu",
                         invalid_vocab_times=invalid_vocab_times)