Python Document.m_docId Beispiele

Programmiersprache: Python

Namespace / Paketname: document

Klasse / Typ: Document

Methode / Funktion: m_docId

Beispiele auf hotexamples.com: 1

Python Document.m_docId - 1 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die document.Document.m_docId, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

Document(30)

__init__(9)

new_shape(5)

content(4)

apply_op(4)

snapshot(4)

delete(3)

classification(3)

getWords(3)

concatenate(3)

add_header(2)

preprocess_text(2)

getName(2)

calc_hash(2)

getNumDifferentWords(2)

getNumParagraphs(2)

add_predictions(2)

getNumTotalWords(2)

add_tag(2)

getWordCount(2)

getNumSentences(2)

copy(2)

create_or_update(2)

addCut(2)

add(2)

result_file(2)

create(2)

date(2)

render(2)

getPostingsList(1)

download(1)

empty(1)

getUrls(1)

getTopWords(1)

getMostFrequentWord(1)

end_user_action(1)

files(1)

genre(1)

getClause(1)

getClausesList(1)

getImage(1)

getMostFrequentWords(1)

ChangePage(1)

get_selection(1)

getWordsAboveFrequency(1)

remove(1)

tokenize(1)

subscribe_user(1)

statistics(1)

setTextPath(1)

Beispiel #1

Datei anzeigen

Datei: index.py Projekt: wangxiao0722/XSearch

    for line in url_file.readlines():
        line = line.split('\t')
        summary = line[0]
        docId = int(line[1])
        url = Url()
        url.m_summary=summary
        url.m_docId=docId
        url_list.append(url)
    
    for line in doc_file.readlines():
        line = line.split('\t')
        docId = int(line[0])
        pos = int(line[1])
        document = Document()
        document.m_docId = docId
        document.m_pos = pos
        doc_list.append(document)

    index_dict = {}
    title_index_dict = {}
    output_file = open(DATA_PATH + "rawlist.data.segment",'w')
    for docId in range(0,len(url_list) - 1):
        length = doc_list[docId+1].m_pos - doc_list[docId].m_pos - 1;
        if length < 0:
            break
        raw_file.seek(doc_list[docId].m_pos)
        content = raw_file.read(length)
        head_start = content.find('version:')
        head_end = content.find('<!DOCTYPE')
        head = content[head_start:head_end]