Esempi in Python per DebateParser

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: parse_debates

Classe/tipologia: DebateParser

Esempi su hotexamples.com: 4

DebateParser in Python: 4 esempi trovati. Questi sono i migliori esempi reali in Python per parse_debates.DebateParser, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

DebateParser(1)

build_text_for_mallet(1)

parse(1)

Esempio n. 1

Mostra file

File: generate_mallet_inputs.py Progetto: Lingistic/DebateAnalysis

from parse_debates import DebateParser
import ngrams
import os
import mallet
import build_graph
import networkx

'''
main entry point for generating mallet input files project
'''
if __name__ == "__main__":
    # first parse and load the debates and create the mallet raw input
    parser = DebateParser("./data/debates")
    parser.parse()
    parser.build_text_for_mallet('./data/mallet_raw_statements.txt')

    # now generate and save bigrams for mallet replacement files
    ngrams.save_bigrams_for_replacement_file_txt([item[0] for sublist in parser.statements.values() for item in sublist],
                                      os.path.join("./data/mallet_files", "replacements.txt"))

Esempio n. 2

Mostra file

File: ngrams.py Progetto: robmcdan/semantic-analysis

    with open(path, "wb+") as output_file:
        writer = csv.writer(output_file, delimiter="\t")

        if len(statements) > 0:
            statements = [removeNonAscii(statement) for statement in statements]
            ngrams = get_bigram_likelihood(statements)
            if ngrams != '':
                for ngram in ngrams:
                    writer.writerow([ngram[0][0] + '_' + ngram[0][1], ngram[1]])

def save_bigrams_for_replacement_file_txt(statements, path):
    """
    saves likely bigrams in a txt
    :param        statements: list of strings
    :param path: output path for saved txt
    """
    with open(path, "wb+") as output_file:
        if len(statements) > 0:
            statements = [removeNonAscii(statement) for statement in statements]
            ngrams = get_bigram_likelihood(statements)
            if ngrams != '':
                for ngram in ngrams:
                    output_file.write(ngram[0][0] + ' ' + ngram[0][1] + '\n')

if __name__ == "__main__":
    parser = DebateParser("./data/debates")
    parser.parse()
    save_bigram_likelihood_tsv([item[0] for sublist in parser.statements.values() for item in sublist],
                               os.path.join("data", "ngrams.tsv"))
    save_bigrams_for_replacement_file_txt([item[0] for sublist in parser.statements.values() for item in sublist],
                                      os.path.join("./data/mallet_files", "replacements.txt"))

Esempio n. 3

Mostra file

                for ngram in ngrams:
                    writer.writerow(
                        [ngram[0][0] + '_' + ngram[0][1], ngram[1]])


def save_bigrams_for_replacement_file_txt(statements, path):
    """
    saves likely bigrams in a txt
    :param        statements: list of strings
    :param path: output path for saved txt
    """
    with open(path, "wb+") as output_file:
        if len(statements) > 0:
            statements = [
                removeNonAscii(statement) for statement in statements
            ]
            ngrams = get_bigram_likelihood(statements)
            if ngrams != '':
                for ngram in ngrams:
                    output_file.write(ngram[0][0] + ' ' + ngram[0][1] + '\n')


if __name__ == "__main__":
    parser = DebateParser("./data/debates")
    parser.parse()
    save_bigram_likelihood_tsv([
        item[0] for sublist in parser.statements.values() for item in sublist
    ], os.path.join("data", "ngrams.tsv"))
    save_bigrams_for_replacement_file_txt([
        item[0] for sublist in parser.statements.values() for item in sublist
    ], os.path.join("./data/mallet_files", "replacements.txt"))

Esempio n. 4

Mostra file

File: generate_mallet_inputs.py Progetto: ronypik/DebateAnalysis

from parse_debates import DebateParser
import ngrams
import os
import mallet
import build_graph
import networkx
'''
main entry point for generating mallet input files project
'''
if __name__ == "__main__":
    # first parse and load the debates and create the mallet raw input
    parser = DebateParser("./data/debates")
    parser.parse()
    parser.build_text_for_mallet('./data/mallet_raw_statements.txt')

    # now generate and save bigrams for mallet replacement files
    ngrams.save_bigrams_for_replacement_file_txt([
        item[0] for sublist in parser.statements.values() for item in sublist
    ], os.path.join("./data/mallet_files", "replacements.txt"))