Ejemplos de extract_feature_utterances en Python

Lenguaje de programación: Python

Namespace/Package Name: dump_speaker_data

Método / Función: extract_feature_utterances

Ejemplos en hotexamples.com: 3

Python extract_feature_utterances - 3 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de dump_speaker_data.extract_feature_utterances extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Ejemplo n.º 1

Mostrar archivo

Archivo: tests.py Proyecto: pfeyz/sample-size-test

    def test_extraction(self):
        mot_words = extract_feature_utterances([self.filename], 'word', 'MOT')
        self.assertEqual(len(mot_words), 804)

        chi_pos = extract_feature_utterances([self.filename], 'pos', 'CHI')
        self.assertEqual(len(chi_pos), 741)

        all_words = extract_feature_utterances([self.filename], 'pos')
        self.assertEqual(len(all_words), 1588)

Ejemplo n.º 2

Mostrar archivo

Archivo: number_of_types.py Proyecto: pfeyz/sample-size-test

#! /usr/bin/env python2

from glob import glob
from os.path import join as pjoin
from sys import argv, exit

from dump_speaker_data import extract_feature_utterances
from sample_size_test import generate_ngrams

if __name__ == "__main__":
    try:
        files = glob(pjoin(argv[1], "*.xml"))
    except IndexError:
        print "You must include the directory containing xml files"
        exit()
    utterances = extract_feature_utterances(files, "pos", "MOT")
    bigrams = [generate_ngrams(2, ut) for ut in utterances if len(ut) > 1]
    bigrams = reduce(list.__add__, bigrams, [])
    poses = set([word for ut in utterances for word in ut])

    print "# Utterances:", len(utterances)
    print "# Bigrams:", len(bigrams)
    print "# Bigrams Types", len(set(bigrams))
    print "# of parts of speech tags:", len(poses)

"""
WORDS
# Utterances: 10445
# Bigrams: 36079
# Bigrams Types 10162

Ejemplo n.º 3

Mostrar archivo

Archivo: tests.py Proyecto: pfeyz/sample-size-test

 def setUpClass(cls):
     print "setting up", cls
     cls.filename = path.join(here, "fixtures", "eve01.xml")
     cls.utterances = extract_feature_utterances([cls.filename], 'word', 'MOT')
     cls.corpus = reduce(list.__add__, cls.utterances)  # flatten