Python getWordGrams 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: bucketing

메소드/함수: getWordGrams

hotexamples.com에서의 예제들: 4

Python getWordGrams - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 bucketing.getWordGrams에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: backoffC2C3C4.py 프로젝트: pombredanne/extended-hidden-vector-state-parser

    lst = glob.glob(dirCmb + "/*.cmb")
    ##lst = lst[:300]
    lst.sort()


    conceptMap = LexMap().read(conceptFileName)
    wordMap = LexMap().read(wordFileName)
    rConceptMap = LexMap().read(conceptFileName).reverse()
    rWordMap = LexMap().read(wordFileName).reverse()

    wordGrams = {}
    c1Grams = {}
    c2Grams = {}

    for fileName in lst:
        bucketing.getWordGrams(fileName, wordGrams, c1Grams, c2Grams)


    # number of stacks [c1, c2, c3, c4] is lower than for training
    # because during force alingnment was not decoded many _DUMMY_
    # concepts

    if not text:
        c2Grams = translate(c2Grams, wordMap, conceptMap)
        
    c2Grams4 = c2Grams
    c2Grams3 = reduceGrams(c2Grams4)
    c2Grams2 = reduceGrams(c2Grams3)

    if verbose:
        print("Number of c2Grams4: %d" % len(c2Grams4))

예제 #2

파일 보기

파일: backoffC1C2C3C4.py 프로젝트: pombredanne/extended-hidden-vector-state-parser

else:
    lst = glob.glob(dirCmb + "/*.cmb")
    ##lst = lst[:300]
    lst.sort()

    conceptMap = LexMap().read(conceptFileName)
    wordMap = LexMap().read(wordFileName)
    rConceptMap = LexMap().read(conceptFileName).reverse()
    rWordMap = LexMap().read(wordFileName).reverse()

    wordGrams = {}
    c1Grams = {}
    c2Grams = {}

    for fileName in lst:
        bucketing.getWordGrams(fileName, wordGrams, c1Grams, c2Grams)

    c1Grams[(u'_EMPTY_', u'_EMPTY_', u'_EMPTY_', u'_EMPTY_')] = 999999

    # number of stacks [c1, c2, c3, c4] is lower than for training
    # because during force alingnment was not decoded many _DUMMY_
    # concepts

    if not text:
        c1Grams = translate(c1Grams, wordMap, conceptMap)

    c1Grams4 = c1Grams
    c1Grams3 = reduceGrams(c1Grams4)
    c1Grams2 = reduceGrams(c1Grams3)
    c1Grams1 = reduceGrams(c1Grams2)

예제 #3

파일 보기

파일: statsC1C2C3C4.py 프로젝트: pombredanne/extended-hidden-vector-state-parser

print ("Start word history backoff-ing")
print ("-------------------------------------------------")

lst = glob.glob(dirHO + "/*.hddn")
##lst = lst[:300]
lst.sort()

print len(lst)

wordGrams = {}
c1Grams = {}
c2Grams = {}

for fileName in lst:
    bucketing.getWordGrams(fileName, wordGrams, c1Grams, c2Grams, fileType="hddn")


c1Grams[(u"_EMPTY_", u"_EMPTY_", u"_EMPTY_", u"_EMPTY_")] = 999999

# number of stacks [c1, c2, c3, c4] is lower than for training
# because during force alingnment was not decoded many _DUMMY_
# concepts

c1Grams4 = c1Grams
c1Grams3 = reduceGrams(c1Grams4)
c1Grams2 = reduceGrams(c1Grams3)
c1Grams1 = reduceGrams(c1Grams2)

print ("Number of c1Grams4: %d" % len(c1Grams4))
print ("Number of c1Grams3: %d" % len(c1Grams3))

예제 #4

파일 보기

print("Start word history backoff-ing")
print("-------------------------------------------------")

lst = glob.glob(dirHO + "/*.hddn")
##lst = lst[:300]
lst.sort()

print len(lst)

wordGrams = {}
c1Grams = {}
c2Grams = {}

for fileName in lst:
    bucketing.getWordGrams(fileName, wordGrams, c1Grams, c2Grams, fileType='hddn')

    
c1Grams[(u'_EMPTY_', u'_EMPTY_', u'_EMPTY_', u'_EMPTY_')] = 999999

# number of stacks [c1, c2, c3, c4] is lower than for training
# because during force alingnment was not decoded many _DUMMY_
# concepts

c1Grams4 = c1Grams
c1Grams3 = reduceGrams(c1Grams4)
c1Grams2 = reduceGrams(c1Grams3)
c1Grams1 = reduceGrams(c1Grams2)

print("Number of c1Grams4: %d" % len(c1Grams4))
print("Number of c1Grams3: %d" % len(c1Grams3))