Exemplos de dbdir em Python, exemplos de sep.context.dbdir em Python

Exemplo n.º 1

0

Exibir arquivo

Arquivo: sepgen.py Projeto: takada-at/sep

def cooccurence():
    logger.info('vocabrary load...')
    vocab = nltkwrapper.Vocab(context)
    ranking = vocab.vocab(300)
    stems = vocab.stemmer.getdict().items()
    logger.info('load words coocurence...')
    cooc = vocab.cooccurence(dict(ranking).keys()).items()
    cooc.sort(lambda x,y:cmp(y[1],x[1]))
    cooc = [(k0,k1,c) for ((k0,k1),c) in cooc]
    logger.info('save...')
    savecsv(os.path.join(context.dbdir(), 'ranking.csv'), ranking)
    savecsv(os.path.join(context.dbdir(), 'cooccurence.csv'), cooc)
    savecsv(os.path.join(context.dbdir(), 'stem.csv'), stems)

Exemplo n.º 2

0

Exibir arquivo

def cooccurence():
    logger.info('vocabrary load...')
    vocab = nltkwrapper.Vocab(context)
    ranking = vocab.vocab(300)
    stems = vocab.stemmer.getdict().items()
    logger.info('load words coocurence...')
    cooc = vocab.cooccurence(dict(ranking).keys()).items()
    cooc.sort(lambda x, y: cmp(y[1], x[1]))
    cooc = [(k0, k1, c) for ((k0, k1), c) in cooc]
    logger.info('save...')
    savecsv(os.path.join(context.dbdir(), 'ranking.csv'), ranking)
    savecsv(os.path.join(context.dbdir(), 'cooccurence.csv'), cooc)
    savecsv(os.path.join(context.dbdir(), 'stem.csv'), stems)

Exemplo n.º 3

0

Exibir arquivo

Arquivo: ranking.py Projeto: takada-at/sep

def saveranking(ranking):
    dbdir = context.dbdir()
    with io.open(os.path.join(dbdir, 'ranking.csv'), 'w') as wio:
        for word, freq in ranking:
            wio.write(u"\t".join([word, unicode(freq)]) + u"\n")

    return ranking

Exemplo n.º 4

0

Exibir arquivo

def bibliocount():
    counter = biblio.count()
    items = counter.items()
    items.sort(lambda x, y: cmp(y[1], x[1]))
    items = [[author, year, title, count]
             for ((author, year, title), count) in items]
    savecsv(os.path.join(context.dbdir(), 'biblio.csv'), items)

Exemplo n.º 5

0

Exibir arquivo

def saveranking(ranking):
    dbdir = context.dbdir()
    with io.open(os.path.join(dbdir, 'ranking.csv'), 'w') as wio:
        for word, freq in ranking:
            wio.write(u"\t".join([word, unicode(freq)]) + u"\n")

    return ranking

Exemplo n.º 6

0

Exibir arquivo

Arquivo: ranking.py Projeto: takada-at/sep

def loadranking():
    dirname = context.dbdir()
    ranking = []
    with io.open(os.path.join(dirname, 'ranking.csv')) as fio:
        for line in fio:
            word,count = line.rstrip().split("\t")
            ranking.append((word, int(count)))

    return ranking

Exemplo n.º 7

0

Exibir arquivo

def loadranking():
    dirname = context.dbdir()
    ranking = []
    with io.open(os.path.join(dirname, 'ranking.csv')) as fio:
        for line in fio:
            word, count = line.rstrip().split("\t")
            ranking.append((word, int(count)))

    return ranking

Exemplo n.º 8

0

Exibir arquivo

def preparedir():
    dirs = [
        context.datadir(),
        context.graphdir(),
        context.dbdir(),
        context.textdatadir()
    ]
    for dirname in dirs:
        if not os.path.exists(dirname):
            os.mkdir(dirname)

Exemplo n.º 9

0

Exibir arquivo

Arquivo: ranking.py Projeto: takada-at/sep

def loadorgword():
    dirname = context.dbdir()
    dic = dict()
    with io.open(os.path.join(dirname, 'stem.csv')) as fio:
        for line in fio:
            stem,org = line.rstrip().split("\t")
            dic[stem] = org

    stemmer = nltkwrapper.Stem()
    stemmer.loaddata(dic)
    return stemmer

Exemplo n.º 10

0

Exibir arquivo

def loadorgword():
    dirname = context.dbdir()
    dic = dict()
    with io.open(os.path.join(dirname, 'stem.csv')) as fio:
        for line in fio:
            stem, org = line.rstrip().split("\t")
            dic[stem] = org

    stemmer = nltkwrapper.Stem()
    stemmer.loaddata(dic)
    return stemmer

Exemplo n.º 11

0

Exibir arquivo

Arquivo: graph.py Projeto: takada-at/sep

def load(limit=1300):
    stemmer = ranking.loadorgword()
    ranks = ranking.loadtaggedranking(stemmer)
    ranks = [(w, cnt) for w,tag,cnt in ranks]
    rankdict = dict(ranks)
    words = set(w[0] for w in ranks)
    dbdir = context.dbdir()
    edges = []
    with io.open(os.path.join(dbdir,'cooccurence.csv')) as fio:
        for line in fio:
            word0,word1,count = line.rstrip().split("\t")
            word0 = stemmer.orgword(word0)
            word1 = stemmer.orgword(word1)
            if word0 in words and word1 in words:
                edges.append((word0,word1,int(count)))

    edges.sort(lambda x,y:cmp(y[2],x[2]))
    edges = [(w0,w1,k) for (w0,w1,k) in edges if k>limit]
    return (edges, rankdict)

Exemplo n.º 12

0

Exibir arquivo

def load(limit=1300):
    stemmer = ranking.loadorgword()
    ranks = ranking.loadtaggedranking(stemmer)
    ranks = [(w, cnt) for w, tag, cnt in ranks]
    rankdict = dict(ranks)
    words = set(w[0] for w in ranks)
    dbdir = context.dbdir()
    edges = []
    with io.open(os.path.join(dbdir, 'cooccurence.csv')) as fio:
        for line in fio:
            word0, word1, count = line.rstrip().split("\t")
            word0 = stemmer.orgword(word0)
            word1 = stemmer.orgword(word1)
            if word0 in words and word1 in words:
                edges.append((word0, word1, int(count)))

    edges.sort(lambda x, y: cmp(y[2], x[2]))
    edges = [(w0, w1, k) for (w0, w1, k) in edges if k > limit]
    return (edges, rankdict)

Exemplo n.º 13

0

Exibir arquivo

Arquivo: sepgen.py Projeto: takada-at/sep

def ranking():
    vocab = nltkwrapper.Vocab(context)
    ranking = vocab.vocab(300)
    stems = vocab.stemmer.getdict().items()
    savecsv(os.path.join(context.dbdir(), 'ranking.csv'), ranking)
    savecsv(os.path.join(context.dbdir(), 'stem.csv'), stems)

Exemplo n.º 14

0

Exibir arquivo

def graphdata():
    data = graph.load()
    savecsv(os.path.join(context.dbdir(), 'graphdata.csv'), data)

Exemplo n.º 15

0

Exibir arquivo

Arquivo: sepgen.py Projeto: takada-at/sep

def nnranking():
    ranks = rankmod.loadnnranking()
    savecsv(os.path.join(context.dbdir(), 'nnranking.csv'), ranks)

Exemplo n.º 16

0

Exibir arquivo

Arquivo: sepgen.py Projeto: takada-at/sep

def taggedranking():
    ranks = rankmod.loadtaggedranking()
    savecsv(os.path.join(context.dbdir(), 'taggedranking.csv'), ranks)

Exemplo n.º 17

0

Exibir arquivo

Arquivo: sepgen.py Projeto: takada-at/sep

def graphdata():
    data = graph.load()
    savecsv(os.path.join(context.dbdir(), 'graphdata.csv'), data)

Exemplo n.º 18

0

Exibir arquivo

Arquivo: sepgen.py Projeto: takada-at/sep

def bibliocount():
    counter = biblio.count()
    items = counter.items()
    items.sort(lambda x,y: cmp(y[1],x[1]))
    items = [[author, year, title, count] for ((author, year, title), count) in items]
    savecsv(os.path.join(context.dbdir(), 'biblio.csv'), items)

Exemplo n.º 19

0

Exibir arquivo

Arquivo: sepgen.py Projeto: takada-at/sep

def preparedir():
    dirs = [context.datadir(), context.graphdir(), context.dbdir(), context.textdatadir()]
    for dirname in dirs:
        if not os.path.exists(dirname):
            os.mkdir(dirname)

Exemplo n.º 20

0

Exibir arquivo

def taggedranking():
    ranks = rankmod.loadtaggedranking()
    savecsv(os.path.join(context.dbdir(), 'taggedranking.csv'), ranks)

Exemplo n.º 21

0

Exibir arquivo

def nnranking():
    ranks = rankmod.loadnnranking()
    savecsv(os.path.join(context.dbdir(), 'nnranking.csv'), ranks)

Exemplo n.º 22

0

Exibir arquivo

def ranking():
    vocab = nltkwrapper.Vocab(context)
    ranking = vocab.vocab(300)
    stems = vocab.stemmer.getdict().items()
    savecsv(os.path.join(context.dbdir(), 'ranking.csv'), ranking)
    savecsv(os.path.join(context.dbdir(), 'stem.csv'), stems)