Ejemplos de ParserUtil en Python, ejemplos de utils.ParserUtil en Python

Ejemplo n.º 1

0

Mostrar archivo

Archivo: prepare_bert_dataset.py Proyecto: zjwind/Lancer

def build_short_mode_text(method_info):
  method_text_tokens = " ".join(ParserUtil.extractNLwords([method_info['methodName']]))
  if method_text_tokens == "":
    return ""

  class_text_tokens = " ".join(ParserUtil.extractNLwords([method_info['className']]))
  return_type_text_tokens = method_info['returnType'].lower()
  param_type_text_tokens = " , ".join(
    [" ".join(ParserUtil.extractNLwords([param_type])) for param_type in method_info['paramTypes']]
  )

  text = " | ".join([class_text_tokens, method_text_tokens, return_type_text_tokens, param_type_text_tokens])
  return text

Ejemplo n.º 2

0

Mostrar archivo

Archivo: es_retriever.py Proyecto: zjwind/Lancer

    def search_snippets(self, query, with_score=False, cur_snippet=None):
        search_results = self.es.search(index=[self.index],
                                        doc_type=self.type,
                                        body=query)
        search_results = search_results['hits']['hits']

        if self.short_mode:
            query_snippet_text = " | ".join([
                " ".join(ParserUtil.extractNLwords([cur_snippet['className']
                                                    ])),
                " ".join(ParserUtil.extractNLwords([cur_snippet['methodName']
                                                    ]))
            ])
            candidate_texts = [
                " | ".join([
                    " ".join(
                        ParserUtil.extractNLwords(
                            [res['_source']['className']])), " ".join(
                                ParserUtil.extractNLwords(
                                    [res['_source']['methodName']]))
                ]) for res in search_results
            ]
        else:
            if "multi_match" in query['query']:
                # BasicQueryBuilder
                query_snippet_text = query['query']['multi_match']['query']
            elif "bool" in query['query']:
                # CombineQueryBuilder
                query_snippet_text = query['query']['bool']['should'][0][
                    'multi_match']['query']
            else:
                raise Exception()
            candidate_texts = [
                " ".join(res['_source']['tokenSequence'])
                for res in search_results
            ]

        scores = self.bert_manager.rank(query_snippet_text, candidate_texts)
        sorted_scores = sorted([(i, score) for i, score in enumerate(scores)],
                               key=lambda d: d[1],
                               reverse=True)

        if with_score:
            search_results = [(search_results[i]['_source'], score)
                              for i, score in sorted_scores]
        else:
            search_results = [
                search_results[i]['_source'] for i, score in sorted_scores
            ]

        return search_results

Ejemplo n.º 3

0

Mostrar archivo

Archivo: prepare_bert_dataset.py Proyecto: zjwind/Lancer

def process(method_info_dict, data, key1, key2, wf, short_mode):
  if data[key1] not in method_info_dict or data[key2] not in method_info_dict:
    return
  data['textA'] = build_short_mode_text(method_info_dict[data[key1]])
  data['textB'] = build_short_mode_text(method_info_dict[data[key2]])

  if (data['textA'] != "") and (data['textB'] != ""):
    # the short mode is necessary
    wf.write('%s\n' % json.dumps(data, ensure_ascii=False))
  if not short_mode:
    seq1 = method_info_dict[data[key1]]['tokenSequence']
    seq2 = method_info_dict[data[key2]]['tokenSequence']
    for ratio in [1, 2, 3, 5, 10]:
      text_a = " ".join(ParserUtil.extractNLwords(seq1[:len(seq1) // ratio]))
      text_b = " ".join(ParserUtil.extractNLwords(seq2))
      if not ((text_a == "" or text_a.endswith("| ")) or (text_b == "" or text_b.endswith("| "))):
        data_copy = copy.deepcopy(data)
        data_copy['textA'] = text_a
        data_copy['textB'] = text_b
        data_copy['ratio'] = ratio
        wf.write('%s\n' % json.dumps(data_copy, ensure_ascii=False))

Ejemplo n.º 4

0

Mostrar archivo