Python load_loose_json Examples

Programming Language: Python

Namespace/Package Name: experiments.mlm.mlm_utils

Method/Function: load_loose_json

Examples at hotexamples.com: 2

Python load_loose_json - 2 examples found. These are the top rated real world Python examples of experiments.mlm.mlm_utils.load_loose_json extracted from open source projects. You can rate examples to help us improve the quality of examples.

Example #1

Show file

 def load_mlm_data(path):
     from pytorch_pretrained_bert.tokenization import BertTokenizer
     tokenizer = BertTokenizer.from_pretrained(bert_model,
                                               do_lower_case=do_lower_case)
     vocab_words = list(tokenizer.vocab.keys())
     data = load_loose_json(path)
     docs = []
     for doc in data:
         paras = doc['text'].split('\n\n')
         paras = [para.strip() for para in paras if len(para.strip()) > 0]
         tokens = [tokenizer.tokenize(para) for para in paras]
         docs.append(tokens)
     return docs, tokenizer

Example #2

Show file

File: batcher.py Project: namisan/mt-dnn

 def load_mlm_data(path):
     from transformers import AutoTokenizer
     tokenizer = AutoTokenizer.from_pretrained(bert_model,
                                               cache_dir=".cache")
     vocab_words = list(tokenizer.vocab.keys())
     data = load_loose_json(path)
     docs = []
     for doc in data:
         paras = doc["text"].split("\n\n")
         paras = [
             para.strip() for para in paras if len(para.strip()) > 0
         ]
         tokens = [tokenizer.tokenize(para) for para in paras]
         docs.append(tokens)
     return docs, tokenizer