Python tokenizeの例

プログラミング言語: Python

名前空間/パッケージ名: tf_coder.datasets.github.tokenizer

メソッド/関数: tokenize

hotexamples.comのコード掲載数: 3

Python tokenize - 3件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのtf_coder.datasets.github.tokenizer.tokenizeの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: data_loader.py プロジェクト: google-research/tensorflow-coder

def get_full_context(example):
    context = get_context(example)
    if ADD_OPERATION_NAMES:
        context += ' ' + get_operations(example)
    if ADD_OPERATION_DOCSTRINGS:
        raise NotImplementedError()
    return ' '.join(tokenizer.tokenize(context))

コード例 #2

ファイルを表示

 def score_description(self, description: Text) -> Dict[Text, float]:
   description_as_context = ' '.join(tokenizer.tokenize(description))
   vectorized = self.vectorizer.transform([description_as_context])
   probas = {}
   for op_name, predict_fn in zip(self.all_names, self.predict_fns):
     proba = predict_fn(vectorized)
     probas[op_name] = proba
   return probas

コード例 #3

ファイルを表示

ファイル: data_loader.py プロジェクト: google-research/tensorflow-coder

def get_context(example: Dict[Text, List[Text]]) -> Text:
    """Gets the textual context provided in a single example."""
    docstring = example['docstring'][0]
    comments = example['comments']
    names = example['names']
    strings = example['strings']

    tokens = (tokenizer.tokenize(docstring) +
              tokenizer.tokens_from_text_list(comments) +
              tokenizer.tokens_from_text_list(names) +
              tokenizer.tokens_from_text_list(strings))
    return ' '.join(tokens)