Python Id2Vec示例

编程语言: Python

命名空间/包名称: ast2vec.id2vec

类/类型: Id2Vec

hotexamples.com的示例: 5

Python Id2Vec - 已找到5个示例。这些是从开源项目中提取的最受好评的ast2vec.id2vec.Id2Vec现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

Id2Vec(5)

常用方法

Id2Vec (5)

示例#1

显示文件

 def as_bow(nbow: str, id2vec: str) -> BOW:
     bow = NBOW().load(source=nbow)
     if id2vec:
         id2vec = Id2Vec().load(source=id2vec)
     else:
         id2vec = Id2Vec().load(source=bow.get_dependency("id2vec")["uuid"])
     bow.become_bow(id2vec)
     del id2vec
     return bow

示例#2

显示文件

def postprocess(args):
    """
    Merges row and column embeddings produced by Swivel and writes the Id2Vec
    model.

    :param args: :class:`argparse.Namespace` with "swivel_output_directory" \
                 and "result". The text files are read from \
                 `swivel_output_directory` and the model is written to \
                 `result`.
    :return: None
    """
    log = logging.getLogger("postproc")
    log.info("Parsing the embeddings at %s...", args.swivel_output_directory)
    tokens = []
    embeddings = []
    swd = args.swivel_output_directory
    with open(os.path.join(swd, "row_embedding.tsv")) as frow:
        with open(os.path.join(swd, "col_embedding.tsv")) as fcol:
            for i, (lrow, lcol) in enumerate(zip(frow, fcol)):
                if i % 10000 == (10000 - 1):
                    sys.stdout.write("%d\r" % (i + 1))
                    sys.stdout.flush()
                prow, pcol = (l.split("\t", 1) for l in (lrow, lcol))
                assert prow[0] == pcol[0]
                tokens.append(prow[0][:TokenParser.MAX_TOKEN_LENGTH])
                erow, ecol = \
                    (numpy.fromstring(p[1], dtype=numpy.float32, sep="\t")
                     for p in (prow, pcol))
                embeddings.append((erow + ecol) / 2)
    log.info("Generating numpy arrays...")
    embeddings = numpy.array(embeddings, dtype=numpy.float32)
    log.info("Writing %s...", args.result)
    model = Id2Vec()
    model.construct(embeddings=embeddings, tokens=tokens)
    model.save(args.result)

示例#3

显示文件

 def __init__(self, id2vec=None, docfreq=None, gcs_bucket=None, **kwargs):
     if gcs_bucket:
         backend = create_backend("gcs", "bucket=" + gcs_bucket)
     else:
         backend = None
     self._id2vec = kwargs["id2vec"] = Id2Vec().load(id2vec or None,
                                                     backend=backend)
     self._df = kwargs["docfreq"] = DocumentFrequencies().load(
         docfreq or None, backend=backend)
     super(Repo2nBOWTransformer, self).__init__(**kwargs)

示例#4

显示文件

 def __init__(self, id2vec=None, docfreq=None, gcs_bucket=None, **kwargs):
     if gcs_bucket:
         backend = create_backend("gcs", "bucket=" + gcs_bucket)
     else:
         backend = None
     self._id2vec = kwargs["id2vec"] = Id2Vec().load(id2vec or None, backend=backend)
     self._df = kwargs["docfreq"] = DocumentFrequencies().load(docfreq or None, backend=backend)
     prune_df = kwargs.pop("prune_df", 1)
     if prune_df > 1:
         self._df = self._df.prune(prune_df)
     super().__init__(**kwargs)

示例#5

显示文件

文件： test_id2vec.py 项目： fineguy/ast2vec

 def setUp(self):
     self.model = Id2Vec().load(
         source=os.path.join(os.path.dirname(__file__), paths.ID2VEC))