Python ngrams Beispiele

Programmiersprache: Python

Namespace / Paketname: features

Methode / Funktion: ngrams

Beispiele auf hotexamples.com: 13

Python ngrams - 13 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die features.ngrams, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Beispiel #1

Datei anzeigen

Datei: maximumentropy.py Projekt: pombredanne/python-nlp

    def label(self, datum):
        datum_features = Counter()
        for feature in ngrams(datum, 1):
            datum_features[feature] += 1.0

        log_probs = self.get_log_probabilities(datum_features)

        return log_probs.arg_max()

Beispiel #2

Datei anzeigen

Datei: maximumentropy.py Projekt: pombredanne/python-nlp

    def label_distribution(self, datum):
        datum_features = Counter()
        for feature in ngrams(datum, 1):
            datum_features[feature] += 1.0

        log_probs = self.get_log_probabilities(datum_features)

        return log_probs

Beispiel #3

Datei anzeigen

Datei: maximumentropy.py Projekt: tensorspace/nlp-python

    def label_distribution(self, datum):
        datum_features = Counter()
        for feature in ngrams(datum, 1):
            datum_features[feature] += 1.0

        log_probs = self.get_log_probabilities(datum_features)

        return log_probs

Beispiel #4

Datei anzeigen

Datei: maximumentropy.py Projekt: tensorspace/nlp-python

    def label(self, datum):
        datum_features = Counter()
        for feature in ngrams(datum, 1):
            datum_features[feature] += 1.0

        log_probs = self.get_log_probabilities(datum_features)

        return log_probs.arg_max()

Beispiel #5

Datei anzeigen

	def label(self, datum):
		distribution = None

		for feature in ngrams(datum, 3):
			if distribution:
				distribution += self.feature_distribution[feature]
			else:
				distribution = copy(self.feature_distribution[feature])

		return distribution.arg_max()

Beispiel #6

Datei anzeigen

Datei: test_features.py Projekt: beckgom/python-nlp

	def test_one_gram(self):
		test_string = "hello"

		test_features = set(tuple(x) for x in features.ngrams(test_string, 1))
		expected_features = set(tuple(x) for x in "hello")

		for f in expected_features:
			self.assertTrue(f in test_features)
		for f in test_features:
			self.assertTrue(f in expected_features)

Beispiel #7

Datei anzeigen

Datei: test_features.py Projekt: tensorspace/nlp-python

    def test_one_gram(self):
        test_string = "hello"

        test_features = set(tuple(x) for x in features.ngrams(test_string, 1))
        expected_features = set(tuple(x) for x in "hello")

        for f in expected_features:
            self.assertTrue(f in test_features)
        for f in test_features:
            self.assertTrue(f in expected_features)

Beispiel #8

Datei anzeigen

	def label_distribution(self, datum):
		distribution = None

		for feature in ngrams(datum, 3):
			if distribution:
				distribution += self.feature_distribution[feature]
			else:
				distribution = copy(self.feature_distribution[feature])

		distribution.log_normalize()

		return distribution

Beispiel #9

Datei anzeigen

Datei: test_features.py Projekt: beckgom/python-nlp

	def test_three_grams(self):
		test_string = "hello"
		start = "<START>"
		stop = "<STOP>"

		test_features = set(tuple(x) for x in features.ngrams(test_string, 3, start, stop))
		expected_features = set(tuple(x) for x in ([start, start, 'h'], [start, 'h'], ['h'],
												   [start, 'h', 'e'], ['h', 'e'], ['e'],
												   ['h', 'e', 'l'], ['e', 'l'], ['l'],
												   ['e', 'l', 'l'], ['l', 'l'], ['l'],
												   ['l', 'l', 'o'], ['l', 'o'], ['o'],
												   ['l', 'o', stop], ['o', stop],
												   ['o', stop, stop]))

Beispiel #10

Datei anzeigen

	def train(self, labeled_data):
		self.feature_distribution = CounterMap()
		labels = set()

		for label, datum in labeled_data:
			labels.add(label)
			for feature in ngrams(datum, 3)
				self.feature_distribution[feature][label] += 1

		for feature in self.feature_distribution.iterkeys():
			self.feature_distribution[feature].default = 0.01

		self.feature_distribution.normalize()
		self.feature_distribution.log()

Beispiel #11

Datei anzeigen

Datei: test_features.py Projekt: tensorspace/nlp-python

    def test_three_grams(self):
        test_string = "hello"
        start = "<START>"
        stop = "<STOP>"

        test_features = set(
            tuple(x) for x in features.ngrams(test_string, 3, start, stop))
        expected_features = set(
            tuple(x)
            for x in ([start, start, 'h'], [start, 'h'], ['h'],
                      [start, 'h', 'e'], ['h', 'e'], ['e'], ['h', 'e', 'l'],
                      ['e', 'l'], ['l'], ['e', 'l', 'l'], ['l', 'l'], ['l'],
                      ['l', 'l', 'o'], ['l', 'o'], ['o'], ['l', 'o', stop],
                      ['o', stop], ['o', stop, stop]))

Beispiel #12

Datei anzeigen

Datei: maximumentropy.py Projekt: pombredanne/python-nlp

    def train(self, labeled_data):
        self.labels, self.features = set(), set()

        print "Building features..."
        labeled_features = []
        for label, datum in labeled_data:
            self.labels.add(label)
            features = Counter()

            for feature in ngrams(datum, 1):
                features[feature] += 1.0
                self.features.add(feature)

            labeled_features.append((label, features))

        print "%d features" % len(self.features)
        print "%d labels" % len(self.labels)

        self.train_with_features(labeled_features)

Beispiel #13

Datei anzeigen

Datei: maximumentropy.py Projekt: tensorspace/nlp-python

    def train(self, labeled_data):
        self.labels, self.features = set(), set()

        print "Building features..."
        labeled_features = []
        for label, datum in labeled_data:
            self.labels.add(label)
            features = Counter()

            for feature in ngrams(datum, 1):
                features[feature] += 1.0
                self.features.add(feature)

            labeled_features.append((label, features))

        print "%d features" % len(self.features)
        print "%d labels" % len(self.labels)

        self.train_with_features(labeled_features)