Python Library.gen_vocablist 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: nbot.document

클래스/타입: Library

메소드/함수: gen_vocablist

hotexamples.com에서의 예제들: 3

Python Library.gen_vocablist - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 nbot.document.Library.gen_vocablist에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

gen_vocablist(3)

add_document(2)

get_document(2)

get_keys(2)

load(2)

rmv_document(2)

save(1)

예제 #1

파일 보기

파일: rss.py 프로젝트: stes/nbot

def test_db():
    gl_vlist = VocabList()
    log('searching directory: %s' % FEED_DIR)
    for dir in os.listdir(FEED_DIR):
        if '.mk4' in dir[-4:]:
            log('found database: %s' % dir)
            # open database
            db = metakit.storage(os.path.join(FEED_DIR, dir), 0)
            data = read_database(db)
            if len(data) > 0:
                # feed content in database
                log('create library')
                lib = Library()
                for feed in data:
                    lib.add_document(read_data(feed))
                vlist = lib.gen_vocablist()
                vlist.clean(5)
                gl_vlist.merge(vlist)
            db = None # close database
    print gl_vlist

예제 #2

파일 보기

파일: main.py 프로젝트: stes/nbot

def train_recsys():
    from nbot.document import Document, Library, VocabList, load_document
    
    doc0 = load_document('res/sample/blubb.html')
    doc1 = load_document('res/sample/page.html')
    doc2 = load_document('res/sample/dislikepage.html')
    
    lib_like = Library()
    lib_like.load('res/like', False)
    lib_dislike = Library()
    lib_dislike.load('res/dislike', False)
    
    like_cv = []
    keys = lib_like.get_keys()
    shuffle(keys)
    for key in keys[:5]:
        like_cv.append(lib_like.rmv_document(key))
    
    dislike_cv = []
    keys = lib_dislike.get_keys()
    shuffle(keys)
    for key in keys[:5]:
        dislike_cv.append(lib_dislike.rmv_document(key))
    
    vlist_like = lib_like.gen_vocablist()
    vlist_dislike = lib_dislike.gen_vocablist()
    
    vlist_like.clean(10)
    vlist_dislike.clean(10)
    
    like_mask = vlist_like.gen_mask()
    dislike_mask = vlist_dislike.gen_mask()
    
    mask = []
    mask.extend(like_mask)
    mask.extend(dislike_mask)
    
    rsys = RecommenderSystem(mask, len(mask))
    for key in lib_like.get_keys():
        doc = lib_like.get_document(key)
        rsys.set_rate(doc.content(), 1.)
    
    for key in lib_dislike.get_keys():
        doc = lib_dislike.get_document(key)
        rsys.set_rate(doc.content(), 0.)
    
    rsys.train(10000000, 0.1)

    likes = lib_like.get_keys()
    shuffle(likes)
    for key in likes[:5]:
        doc = lib_like.get_document(key)
        print rsys.rate(doc.content())
    
    dislikes = lib_dislike.get_keys()
    shuffle(dislikes)
    for key in dislikes[:5]:
        doc = lib_dislike.get_document(key)
        print rsys.rate(doc.content())
    
    print '---------------------------------------'
    print rsys.rate(doc0.content())
    print rsys.rate(doc1.content())
    print rsys.rate(doc2.content())
    print '---------------------------------------'
    print 'CV data'
    print '(1) LIKE'
    for doc in like_cv:
        print rsys.rate(doc.content())
    
    print '(2) DISLIKE'
    for doc in dislike_cv:
        print rsys.rate(doc.content())
    
    # This seems to work, however, more training/cv data will be necessary!  
    
    print '---------------------------------------'
    return rsys

예제 #3

파일 보기

파일: recsys.py 프로젝트: stes/nbot

 lib_dislike = Library()
 lib_dislike.load('res/dislike', False)
 
 like_cv = []
 keys = lib_like.get_keys()
 shuffle(keys)
 for key in keys[:5]:
     like_cv.append(lib_like.rmv_document(key))
 
 dislike_cv = []
 keys = lib_dislike.get_keys()
 shuffle(keys)
 for key in keys[:5]:
     dislike_cv.append(lib_dislike.rmv_document(key))
 
 vlist_like = lib_like.gen_vocablist()
 vlist_dislike = lib_dislike.gen_vocablist()
 
 vlist_like.clean(10)
 vlist_dislike.clean(10)
 
 like_mask = vlist_like.gen_mask()
 dislike_mask = vlist_dislike.gen_mask()
 
 printlist(like_mask)
 print '-------------------------------------------'
 printlist(dislike_mask)
 
 mask = []
 mask.extend(like_mask)
 mask.extend(dislike_mask)