Python make_vector 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: feature_vector

메소드/함수: make_vector

hotexamples.com에서의 예제들: 3

Python make_vector - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 feature_vector.make_vector에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

print('INFO: Loading annotated data.')
annot_data = list()
relations = list()
with open(par.a, mode='r', encoding='U8') as f:
    for line in f:
        lab, parent, child = line.rstrip('\n').split('\t')
        relations.append((parent, child))
        cust_feat = dict()
        if par.r:
            cust_feat = dict(custom_features[(parent, child)])
        child = child.split('_')
        parent = parent.split('_')
        lab = True if lab == '+' else False
        features = make_vector(parent=parent[0],
                               parent_pos=parent[1],
                               child=child[0],
                               child_pos=child[1],
                               custom=cust_feat)
        annot_data.append({**features, **{'result': lab}})

# split annotated data on train/validation/holdout
divided = split_data(relations,
                     train=0.65,
                     validation=0.15,
                     holdout=0.2,
                     random_seed=24)
for item in annot_data:
    parent = item['parent'] + '_' + item['parentPos']
    child = item['child'] + '_' + item['childPos']
    item['data'] = divided[(parent, child)]

예제 #2

파일 보기

파일: predict_scores.py 프로젝트: lukyjanek/universal-derivations

# load data and assign features
print('INFO: Loading annotated data.')
annot_data = list()
relations = list()
with open(par.a, mode='r', encoding='U8') as f:
    for line in f:
        lab, parent, child = line.rstrip('\n').split('\t')
        relations.append((parent, child))
        child = child.split('_')
        parent = parent.split('_')
        lab = True if lab == '+' else False
        features = make_vector(parent=parent[1],
                               parent_pos=parent[2][0],
                               child=child[1],
                               child_pos=child[2][0],
                               custom={
                                   'Pid': parent[0],
                                   'Cid': child[0]
                               })
        annot_data.append({**features, **{'result': lab}})

# split annotated data on train/validation/holdout
divided = split_data(relations,
                     train=0.65,
                     validation=0.15,
                     holdout=0.2,
                     random_seed=24)
for item in annot_data:
    parent = item['Pid'] + '_' + item['parent'] + '_' + item['parentPos']
    child = item['Cid'] + '_' + item['child'] + '_' + item['childPos']
    item['data'] = divided[(parent, child)]

예제 #3

파일 보기

                     'stThPar', 'stFoPar', 'stFiPar', 'enTwPar', 'enThPar',
                     'enFoPar', 'enFiPar', 'enTwChi', 'enThChi', 'enFoChi',
                     'enFiChi')

# load manually annotated data
rows_list = list()
with open(par.a, mode='r', encoding='utf-8') as f:
    for line in f:
        lab, child, parent = line.rstrip('\n').split('\t')

        child = child.split('_')
        parent = parent.split('_')
        lab = 1 if lab == '+' else 0

        features = make_vector(parent=parent[0],
                               parent_pos=parent[1],
                               child=child[0],
                               child_pos=child[1])
        vector = OrderedDict()
        for key in included_features:
            vector[key] = features[key]
        vector = {**vector, **{'result': lab}}

        rows_list.append(vector)

# load data to predict (if given)
if par.p:
    with open(par.p, mode='r', encoding='utf-8') as f:
        for line in f:
            child, parent = line.rstrip('\n').split('\t')

            child = child.split('_')