Esempi in Python per TextHelpers.getwords

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: Helpers

Classe/tipologia: TextHelpers

Metodo/funzione: getwords

Esempi su hotexamples.com: 2

TextHelpers.getwords in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per Helpers.TextHelpers.getwords, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

countwords(3)

countstringoccurencesinword(2)

countwordoccurences(2)

getwords(2)

removeWords(2)

countstringpairsinwords(1)

countwordpairoccurences(1)

getwordpairs(1)

Esempio n. 1

Mostra file

File: FeatureExtraction.py Progetto: pscrv/DecisionBibliography

    def _extractFeatures(self):
        goodWordFrequencies = {
            word: TextHelpers.countwordoccurences(word, self._goodText) /
            self._goodWordCount
            for word in {x
                         for x in TextHelpers.getwords(self._goodText)}
        }

        badWordFrequencies = {
            word: TextHelpers.countwordoccurences(word, self._badText) /
            self._badWordCount
            for word in {x
                         for x in TextHelpers.getwords(self._goodText)}
        }

        keptWords = sorted(goodWordFrequencies.keys(),
                           key=(lambda k: goodWordFrequencies[k] -
                                badWordFrequencies.get(k, 0)),
                           reverse=True)[:self._featureNumber]

        result = [WordClassificationFeature(x) for x in keptWords]

        return result

Esempio n. 2

Mostra file

File: FeatureExtraction.py Progetto: pscrv/DecisionBibliography

    def _extractFeatures(self):
        goodWords = {word for word in TextHelpers.getwords(self._goodText)}
        shortGoodWords = {
            word
            for word in goodWords if len(word) <= self._minlength
        }
        shortWordGains = {x: self._stringGain(x) for x in shortGoodWords}
        longGoodWords = set.difference(goodWords, shortGoodWords)
        stringGains = self._getSubstringGains(longGoodWords)
        allGains = stringGains
        allGains.update(shortWordGains)
        #allGains = { **stringGains, **shortWordGains }

        keptWords = sorted(allGains.keys(),
                           key=(lambda k: allGains[k]),
                           reverse=True)[:self._featureNumber]

        result = [
            StringClassificationFeature(x) for x in keptWords
            if allGains[x] > 1.0
        ]

        return result