Python read_dataset 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: corpus_reader

메소드/함수: read_dataset

hotexamples.com에서의 예제들: 2

Python read_dataset - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 corpus_reader.read_dataset에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

def create_y(data):
    y = []
    for doc in data:
        for sentence in doc.sentences:
            for pair in sentence.pairs:
                label = class_index["null"]
                if pair.ddi == "true":
                    label = class_index[pair.type]
                y.append(label)
    return y


### SPLIT DATASET ###

data = read_dataset()
n_docs = len(data)

np.random.seed(42)

train_amount = 0.7
train_ids = choice(n_docs, int(train_amount * n_docs), replace=False)
test_ids = [i for i in range(n_docs) if i not in train_ids]

training = [data[i] for i in train_ids]
test = [data[i] for i in test_ids]

print("%i training documents" % len(training))
print("%i test documents" % len(test))

### TRAINING ###

예제 #2

파일 보기

    #features.append(("drug1_type", drug1_type))
    #features.append(("drug2_type", drug2_type))
    #drug1_name = pair.e1.text
    #drug2_name = pair.e2.text
    #features.append(("drug_name", drug1_name))
    #features.append(("drug_name", drug2_name))
    
    same_drug = pair.e1.text.lower() == pair.e2.text.lower()
    features.append(("same_drug", same_drug))
    
    return features

if __name__ == "__main__":
    np.random.seed(42)
    
    data = read_dataset()
    n_docs = len(data)
    
    n_folds = 10
    folds = k_folds(n_docs, n_folds)
    if TEST:
        n_folds = 1
    
    classes = ["int", "effect", "none", "mechanism", "advise"]
    cv_results = {}
    cv_precisions = []
    cv_recalls = []
    cv_fs = []
    cv_2class_precisions = []
    cv_2class_recalls = []
    cv_2class_fs = []