import pickle from datas import data_list from compro import process with open("data/saved/data_list.pickle", "wb") as f: pickle.dump(data_list(), f) with open("data/saved/process.pickle", "wb") as f: pickle.dump(process(), f)
from tensorflow.keras import models from tensorflow.keras import layers from compro import process from datas import blosum62 as blo62 from datas import data_list from datas import nums import matplotlib.pyplot as plt import numpy as np from random import shuffle pros = process() data = data_list() pro = pros[0] # pros 구조 # (pro, d_list, dnum_list) # pro : 순서별로 몇개의 아미노산 종류가 있는지, 그것이 어느 것에는 어떤 것이 있는지 확인 ([[["M", "K"], {각각에 대한 딕셔너리}].. ]) # d_list : 하나의 위치에 2개 이상의 아미노산을 가지는 대상들의 번호 # dnum_list : d_list에서 가장 적은 개수를 가지는 아미노산의 개수 (몇개의 대상에서 mutaion이 일어났는지 확인) # data_list는 아래와 같이 반환한다. # [[Seq 단백질 서열, [종 이름, kcat, Kc, Sc/o, Eff., type (A or B), EMBL code], index].. ] # 원하는 값에 대해서 최대 최소 찾기 tar = 4 # 1 : kcat, 2 : Kc, 3 : Sc/o, 4 : Eff. data.sort(key=lambda t: -t[1][tar]) # data = data[1:] shuffle(data) loc_list = [ 9, 14, 31, 86, 95, 97, 99, 142, 145, 149, 183, 189, 251, 255, 256, 262, 281, 328, 439, 449