Esempi in Python per CategoriesMultiHot

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: wikisearch.embeddings

Classe/tipologia: CategoriesMultiHot

Esempi su hotexamples.com: 2

CategoriesMultiHot in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per wikisearch.embeddings.CategoriesMultiHot, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

CategoriesMultiHot(1)

embed(1)

Metodi utilizzati di frequente

CategoriesMultiHot (1)

embed (1)

Esempio n. 1

Mostra file

File: fasttext_text_kmeans_categories_multihot.py Progetto: noodlez04/wikisearch

    def __init__(self, save_to_db=True):
        # We do not save the FastTextTitleCategoriesMultiHot to db because of size of embeddings in MongoDB
        super(FastTextTextKMeansCategoriesMultiHot,
              self).__init__(save_to_db=False)
        self._fasttext_text_kmeans_embedder = FastTextTextKMeans(save_to_db)
        self._categories_multihot_embedder = CategoriesMultiHot(save_to_db)

        # Because embeddings are not in the DB, and we want to save time during runtime, we build all concatenated
        # embeddings up-front
        fasttext_text_kmeans_embedder_titles = set(
            self._fasttext_text_kmeans_embedder._cached_embeddings.keys())
        categories_embedder_titles = set(
            self._categories_multihot_embedder._cached_embeddings.keys())
        self._cached_embeddings = {
            title: torch.cat(
                (self._fasttext_text_kmeans_embedder._cached_embeddings[title],
                 self._categories_multihot_embedder._cached_embeddings[title]),
                dim=0)
            for title in fasttext_text_kmeans_embedder_titles
            & categories_embedder_titles
        }

        # Clear caches of sub-embedders, to free up memory, because we've already got those cached entried
        # concatenated in the current embedder
        self._fasttext_text_kmeans_embedder._cached_embeddings = {}
        self._categories_multihot_embedder._cached_embeddings = {}

Esempio n. 2

Mostra file

File: word2vec_title_text_kmeans_categories_multihot.py Progetto: noodlez04/wikisearch

class Word2VecTitleTextKMeansCategoriesMultiHot(Word2VecTitle):
    def __init__(self, save_to_db=True):
        # We do not save the Word2VecTitleCategoriesMultiHot to db because of size of embeddings in MongoDB
        super(Word2VecTitleTextKMeansCategoriesMultiHot,
              self).__init__(save_to_db=False)
        self._word2vec_title_embedder = Word2VecTitle(save_to_db)
        self._word2vec_text_kmeans_embedder = Word2VecTextKMeans(save_to_db)
        self._categories_multihot_embedder = CategoriesMultiHot(save_to_db)

        # Because embeddings are not in the DB, and we want to save time during runtime, we build all concatenated
        # embeddings up-front
        word2vec_title_embedder_titles = set(
            self._word2vec_title_embedder._cached_embeddings.keys())
        word2vec_text_kmeans_embedder_titles = set(
            self._word2vec_text_kmeans_embedder._cached_embeddings.keys())
        categories_embedder_titles = set(
            self._categories_multihot_embedder._cached_embeddings.keys())
        self._cached_embeddings = {
            title: torch.cat(
                (self._word2vec_title_embedder._cached_embeddings[title],
                 self._word2vec_text_kmeans_embedder._cached_embeddings[title],
                 self._categories_multihot_embedder._cached_embeddings[title]),
                dim=0)
            for title in word2vec_title_embedder_titles
            & word2vec_text_kmeans_embedder_titles
            & categories_embedder_titles
        }

        # Clear caches of sub-embedders, to free up memory, because we've already got those cached entried
        # concatenated in the current embedder
        self._word2vec_title_embedder._cached_embeddings = {}
        self._word2vec_text_kmeans_embedder._cached_embeddings = {}
        self._categories_multihot_embedder._cached_embeddings = {}

    def _embed(self, page):
        return torch.cat(
            (self._word2vec_title_embedder.embed(page[ENTRY_TITLE]),
             self._word2vec_text_kmeans_embedder.embed(page[ENTRY_TITLE]),
             self._categories_multihot_embedder.embed(page[ENTRY_TITLE])),
            dim=0)