Python word2index示例

编程语言: Python

命名空间/包名称: stst.utils

方法/功能: word2index

hotexamples.com的示例: 6

Python word2index - 已找到6个示例。这些是从开源项目中提取的最受好评的stst.utils.word2index现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： features_bow.py 项目： zhaoyun0071/Semantic-Texual-Similarity-Toolkits

    def extract_information(self, train_instances):
        seqs = []
        for train_instance in train_instances:
            lemma_sa, lemma_sb = train_instance.get_word(
                type='lemma', stopwords=self.stopwords, lower=True)
            seqs.append(lemma_sa)
            seqs.append(lemma_sb)

        self.idf_weight = utils.idf_calculator(seqs)
        self.vocab = utils.word2index(self.idf_weight)

示例#2

显示文件

文件： features_dependency.py 项目： zhaoyun0071/Semantic-Texual-Similarity-Toolkits

 def extract_information(self, train_instances):
     seqs = []
     for train_instance in train_instances:
         dep_sa, dep_sb = train_instance.get_dependency()
         dep_sa = [(dep[1], dep[2]) for dep in dep_sa]
         dep_sb = [(dep[1], dep[2]) for dep in dep_sb]
         seqs.append(dep_sa)
         seqs.append(dep_sb)
     self.idf_weight = utils.idf_calculator(seqs)
     self.vocab = utils.word2index(self.idf_weight)

示例#3

显示文件

文件： basic_feature.py 项目： rgtjf/SemEval2018-Task12

    def extract(self, train_instance):
        warrant0, warrant1, reason, claim, title, info = train_instance.get_six(
            type='word')

        _warrant0 = warrant0 + reason + claim
        _warrant1 = warrant1 + reason + claim

        self.vocab = utils.word2index(self.unigram_dict)
        feat0 = utils.vectorize(_warrant0, self.unigram_dict, self.vocab)
        feat1 = utils.vectorize(_warrant1, self.unigram_dict, self.vocab)
        infos = [len(self.unigram_dict), 'unigram']
        return feat0 + feat1, infos

示例#4

显示文件

文件： features_bow.py 项目： zhaoyun0071/Semantic-Texual-Similarity-Toolkits

 def extract(self, train_instance):
     idf_weight = dict_utils.DictLoader().load_dict('global_idf')
     vocab = utils.word2index(idf_weight)
     sa, sb = train_instance.get_word(type='lemma',
                                      stopwords=True,
                                      lower=True)
     features, infos = utils.sentence_vectorize_features(sa,
                                                         sb,
                                                         idf_weight,
                                                         vocab,
                                                         convey='idf')
     return features, infos

示例#5

显示文件

文件： features_embedding.py 项目： zhaoyun0071/Semantic-Texual-Similarity-Toolkits

 def extract_information(self, train_instances):
     seqs = []
     for train_instance in train_instances:
         word_sa, word_sb = train_instance.get_word(
             type=self.word_type,
             stopwords=self.stopwords,
             lower=self.lower)
         seqs.append(word_sa)
         seqs.append(word_sb)
     self.idf_weight = utils.idf_calculator(seqs)
     self.vocab = utils.word2index(self.idf_weight)
     self.vocab, self.embeddings = utils.load_word_embedding(
         self.vocab, self.emb_file)

示例#6

显示文件

    def extract_information(self, train_instances):
        seqs = []
        for train_instance in train_instances:
            pos_sa, pos_sb = train_instance.get_pos_tag(stopwords=False)
            sa = [w for w, tag in pos_sa if tag == 'n']
            sb = [w for w, tag in pos_sb if tag == 'n']
            seqs.append(sa)
            seqs.append(sb)

        idf_weight = utils.idf_calculator(seqs)
        vocab = utils.word2index(idf_weight)
        self.idf_weight = idf_weight
        self.vocab, self.embeddings = utils.load_word_embedding(
            vocab, self.emb_file)