import pickle
from datas import data_list
from compro import process

with open("data/saved/data_list.pickle", "wb") as f:
    pickle.dump(data_list(), f)
with open("data/saved/process.pickle", "wb") as f:
    pickle.dump(process(), f)
Exemple #2
0
from tensorflow.keras import models
from tensorflow.keras import layers
from compro import process
from datas import blosum62 as blo62
from datas import data_list
from datas import nums
import matplotlib.pyplot as plt
import numpy as np
from random import shuffle

pros = process()
data = data_list()
pro = pros[0]

# pros 구조
# (pro, d_list, dnum_list)
# pro : 순서별로 몇개의 아미노산 종류가 있는지, 그것이 어느 것에는 어떤 것이 있는지 확인 ([[["M", "K"], {각각에 대한 딕셔너리}].. ])
# d_list : 하나의 위치에 2개 이상의 아미노산을 가지는 대상들의 번호
# dnum_list : d_list에서 가장 적은 개수를 가지는 아미노산의 개수 (몇개의 대상에서 mutaion이 일어났는지 확인)

# data_list는 아래와 같이 반환한다.
# [[Seq 단백질 서열, [종 이름, kcat, Kc, Sc/o, Eff., type (A or B), EMBL code], index].. ]
# 원하는 값에 대해서 최대 최소 찾기
tar = 4  # 1 : kcat, 2 : Kc, 3 : Sc/o, 4 : Eff.

data.sort(key=lambda t: -t[1][tar])
# data = data[1:]
shuffle(data)
loc_list = [
    9, 14, 31, 86, 95, 97, 99, 142, 145, 149, 183, 189, 251, 255, 256, 262,
    281, 328, 439, 449