Python DataSets 예제들, deepmd.Data.DataSets Python 예제들

예제 #1

0

파일 보기

파일: test.py 프로젝트: mdj54/deepmd-kit

def test_ener (args) :
    if args.rand_seed is not None :
        np.random.seed(args.rand_seed % (2**32))

    data = DataSets (args.system, args.set_prefix, shuffle_test = args.shuffle_test)
    test_data = data.get_test ()
    numb_test = args.numb_test
    natoms = len(test_data["type"][0])
    nframes = test_data["box"].shape[0]
    numb_test = min(nframes, numb_test)
    dp = DeepPot(args.model)
    coord = test_data["coord"][:numb_test].reshape([numb_test, -1])
    box = test_data["box"][:numb_test]
    atype = test_data["type"][0]
    if dp.get_dim_fparam() > 0:
        fparam = test_data["fparam"][:numb_test] 
    else :
        fparam = None
    if dp.get_dim_aparam() > 0:
        aparam = test_data["aparam"][:numb_test] 
    else :
        aparam = None
    energy, force, virial, ae, av = dp.eval(coord, box, atype, fparam = fparam, aparam = aparam, atomic = True)
    energy = energy.reshape([numb_test,1])
    force = force.reshape([numb_test,-1])
    virial = virial.reshape([numb_test,9])
    ae = ae.reshape([numb_test,-1])
    av = av.reshape([numb_test,-1])

    l2e = (l2err (energy - test_data["energy"][:numb_test].reshape([-1,1])))
    l2f = (l2err (force  - test_data["force"] [:numb_test]))
    l2v = (l2err (virial - test_data["virial"][:numb_test]))
    l2ea= l2e/natoms
    l2va= l2v/natoms

    # print ("# energies: %s" % energy)
    print ("# number of test data : %d " % numb_test)
    print ("Energy L2err        : %e eV" % l2e)
    print ("Energy L2err/Natoms : %e eV" % l2ea)
    print ("Force  L2err        : %e eV/A" % l2f)
    print ("Virial L2err        : %e eV" % l2v)
    print ("Virial L2err/Natoms : %e eV" % l2va)

    detail_file = args.detail_file
    if detail_file is not None :
        pe = np.concatenate((np.reshape(test_data["energy"][:numb_test], [-1,1]),
                             np.reshape(energy, [-1,1])), 
                            axis = 1)
        np.savetxt(detail_file+".e.out", pe, 
                   header = 'data_e pred_e')
        pf = np.concatenate((np.reshape(test_data["force"] [:numb_test], [-1,3]), 
                             np.reshape(force,  [-1,3])), 
                            axis = 1)
        np.savetxt(detail_file+".f.out", pf,
                   header = 'data_fx data_fy data_fz pred_fx pred_fy pred_fz')
        pv = np.concatenate((np.reshape(test_data["virial"][:numb_test], [-1,9]), 
                             np.reshape(virial, [-1,9])), 
                            axis = 1)
        np.savetxt(detail_file+".v.out", pv,
                   header = 'data_vxx data_vxy data_vxz data_vyx data_vyy data_vyz data_vzx data_vzy data_vzz pred_vxx pred_vxy pred_vxz pred_vyx pred_vyy pred_vyz pred_vzx pred_vzy pred_vzz')

예제 #2

0

파일 보기

파일: test.py 프로젝트: kyla1994/deepmd_root

def _main():
    parser = argparse.ArgumentParser()
    parser.add_argument("-m",
                        "--model",
                        default="frozen_model.pb",
                        type=str,
                        help="Frozen model file to import")
    parser.add_argument("-s",
                        "--system",
                        default=".",
                        type=str,
                        help="The system dir")
    parser.add_argument("-S",
                        "--set-prefix",
                        default="set",
                        type=str,
                        help="The set prefix")
    parser.add_argument("-n",
                        "--numb-test",
                        default=100,
                        type=int,
                        help="The number of data for test")
    parser.add_argument(
        "-d",
        "--detail-file",
        type=str,
        help="The file containing details of energy force and virial accuracy")
    args = parser.parse_args()

    graph = load_graph(args.model)
    data = DataSets(args.system, args.set_prefix)

    with tf.Session(graph=graph) as sess:
        test(sess, data, args.numb_test, args.detail_file)

예제 #3

0

파일 보기

파일: train.py 프로젝트: thunderdruid/deepmd-kit

def _main():
    parser = argparse.ArgumentParser(description="*** Train a model. ***")
    parser.add_argument('INPUT', help='the input json database ')
    args = parser.parse_args()

    # load json database
    fp = open(args.INPUT, 'r')
    jdata = json.load(fp)

    # init params
    systems = j_must_have(jdata, 'systems')
    set_pfx = j_must_have(jdata, 'set_prefix')
    numb_sys = len(systems)
    seed = None
    if 'seed' in jdata.keys(): seed = jdata['seed']
    num_threads = j_must_have(jdata, 'num_threads')
    batch_size = j_must_have(jdata, 'batch_size')
    stop_batch = j_must_have(jdata, 'stop_batch')
    tot_numb_batches = 0
    print("#")
    print("# using %d system(s): " % numb_sys)
    for _sys in systems:
        s_data = DataScan(_sys, set_pfx)
        numb_batches = s_data.get_sys_numb_batch(batch_size)
        tot_numb_batches += numb_batches
        print("# %s has %d batches, and was copied by %s " %
              (_sys, numb_batches, str(s_data.get_ncopies())))
    print("#")
    lr = LearingRate(jdata, tot_numb_batches)
    final_lr = lr.value(stop_batch)

    # start tf
    tf.reset_default_graph()
    with tf.Session(config=tf.ConfigProto(
            intra_op_parallelism_threads=num_threads)) as sess:
        # init the model
        model = NNPModel(jdata, sess)
        # build the model with stats from the first system
        data = DataSets(systems[0], set_pfx, seed=seed, do_norm=False)
        model.build(data, lr)
        # train the model with the provided systems in a cyclic way
        start_time = time.time()
        count = 0
        cur_batch = model.get_global_step()
        cur_stop_batch = cur_batch
        print("# start training, start lr is %e, final lr will be %e" %
              (lr.value(cur_stop_batch), final_lr))
        model.print_head()
        while True:
            cur_sys = systems[count % numb_sys]
            data = DataSets(cur_sys, set_pfx, seed=seed, do_norm=False)
            cur_batch = cur_stop_batch
            cur_stop_batch += data.get_sys_numb_batch(batch_size)
            if cur_stop_batch > stop_batch: cur_stop_batch = stop_batch
            print("# train with %s that has %d batches" %
                  (cur_sys, cur_stop_batch - cur_batch))
            model.train(data, cur_stop_batch)
            if cur_stop_batch == stop_batch: break
            count += 1
        print("# finished training")
        end_time = time.time()
        print("# running time: %.3f s" % (end_time - start_time))

예제 #4

0

파일 보기

    def __init__(self,
                 systems,
                 set_prefix,
                 batch_size,
                 test_size,
                 rcut,
                 run_opt=None):
        self.system_dirs = systems
        self.nsystems = len(self.system_dirs)
        self.batch_size = batch_size
        if isinstance(self.batch_size, int):
            self.batch_size = self.batch_size * np.ones(self.nsystems,
                                                        dtype=int)
        assert (isinstance(self.batch_size, (list, np.ndarray)))
        assert (len(self.batch_size) == self.nsystems)
        self.data_systems = []
        self.ntypes = []
        self.natoms = []
        self.natoms_vec = []
        self.nbatches = []
        for ii in self.system_dirs:
            self.data_systems.append(DataSets(ii, set_prefix))
            sys_all_types = np.loadtxt(os.path.join(ii,
                                                    "type.raw")).astype(int)
            self.ntypes.append(np.max(sys_all_types) + 1)
        self.sys_ntypes = max(self.ntypes)
        type_map = []
        for ii in range(self.nsystems):
            self.natoms.append(self.data_systems[ii].get_natoms())
            self.natoms_vec.append(self.data_systems[ii].get_natoms_vec(
                self.sys_ntypes).astype(int))
            self.nbatches.append(self.data_systems[ii].get_sys_numb_batch(
                self.batch_size[ii]))
            type_map.append(self.data_systems[ii].get_type_map())
        self.type_map = self.check_type_map_consistency(type_map)

        # check frame parameters
        has_fparam = [ii.numb_fparam() for ii in self.data_systems]
        for ii in has_fparam:
            if ii != has_fparam[0]:
                raise RuntimeError(
                    "if any system has frame parameter, then all systems should have the same number of frame parameter"
                )
        self.has_fparam = has_fparam[0]

        # check the size of data if they satisfy the requirement of batch and test
        for ii in range(self.nsystems):
            chk_ret = self.data_systems[ii].check_batch_size(
                self.batch_size[ii])
            if chk_ret is not None:
                raise RuntimeError ("system %s required batch size %d is larger than the size %d of the dataset %s" % \
                                    (self.system_dirs[ii], self.batch_size[ii], chk_ret[1], chk_ret[0]))
            chk_ret = self.data_systems[ii].check_test_size(test_size)
            if chk_ret is not None:
                print("WARNNING: system %s required test size %d is larger than the size %d of the dataset %s" % \
                      (self.system_dirs[ii], test_size, chk_ret[1], chk_ret[0]))

        if run_opt is not None:
            self.print_summary(run_opt)

        self.prob_nbatches = [float(i)
                              for i in self.nbatches] / np.sum(self.nbatches)

        self.test_data = collections.defaultdict(list)
        self.default_mesh = []
        for ii in range(self.nsystems):
            test_system_data = self.data_systems[ii].get_test()
            for nn in test_system_data:
                self.test_data[nn].append(test_system_data[nn])
            cell_size = np.max(rcut)
            avg_box = np.average(test_system_data["box"], axis=0)
            avg_box = np.reshape(avg_box, [3, 3])
            ncell = (np.linalg.norm(avg_box, axis=1) / cell_size).astype(
                np.int32)
            ncell[ncell < 2] = 2
            default_mesh = np.zeros(6, dtype=np.int32)
            default_mesh[3:6] = ncell
            self.default_mesh.append(default_mesh)
        self.pick_idx = 0

예제 #5

0

파일 보기

파일: dp_test.py 프로젝트: neojie/mldp

def test_ener(args):
    """
    modify based on args file
    """
    if args['rand_seed'] is not None:
        np.random.seed(args['rand_seed'] % (2**32))

    data = DataSets(args['system'],
                    args['set_prefix'],
                    shuffle_test=args['shuffle_test'])
    test_data = data.get_test()
    numb_test = args['numb_test']
    natoms = len(test_data["type"][0])
    nframes = test_data["box"].shape[0]
    numb_test = min(nframes, numb_test)
    dp = DeepPot(args['model'])
    coord = test_data["coord"][:numb_test].reshape([numb_test, -1])
    box = test_data["box"][:numb_test]
    atype = test_data["type"][0]
    if dp.get_dim_fparam() > 0:
        fparam = test_data["fparam"][:numb_test]
    else:
        fparam = None
    if dp.get_dim_aparam() > 0:
        aparam = test_data["aparam"][:numb_test]
    else:
        aparam = None
    detail_file = args['detail_file']
    if detail_file is not None:
        atomic = True
    else:
        atomic = False

    ret = dp.eval(coord,
                  box,
                  atype,
                  fparam=fparam,
                  aparam=aparam,
                  atomic=atomic)
    energy = ret[0]
    force = ret[1]
    virial = ret[2]
    energy = energy.reshape([numb_test, 1])
    force = force.reshape([numb_test, -1])
    virial = virial.reshape([numb_test, 9])
    if atomic:
        ae = ret[3]
        av = ret[4]
        ae = ae.reshape([numb_test, -1])
        av = av.reshape([numb_test, -1])

    l2e = (l2err(energy - test_data["energy"][:numb_test].reshape([-1, 1])))
    l2f = (l2err(force - test_data["force"][:numb_test]))
    l2v = (l2err(virial - test_data["virial"][:numb_test]))
    l2ea = l2e / natoms
    l2va = l2v / natoms

    # print ("# energies: %s" % energy)
    print("# number of test data : %d " % numb_test)
    print("Energy L2err        : %e eV" % l2e)
    print("Energy L2err/Natoms : %e eV" % l2ea)
    print("Force  L2err        : %e eV/A" % l2f)
    print("Virial L2err        : %e eV" % l2v)
    print("Virial L2err/Natoms : %e eV" % l2va)

    if detail_file is not None:
        pe = np.concatenate((np.reshape(test_data["energy"][:numb_test],
                                        [-1, 1]), np.reshape(energy, [-1, 1])),
                            axis=1)
        np.savetxt(os.path.join(args['system'], detail_file + ".e.out"),
                   pe,
                   header='data_e pred_e')
        pf = np.concatenate((np.reshape(test_data["force"][:numb_test],
                                        [-1, 3]), np.reshape(force, [-1, 3])),
                            axis=1)
        np.savetxt(os.path.join(args['system'], detail_file + ".f.out"),
                   pf,
                   header='data_fx data_fy data_fz pred_fx pred_fy pred_fz')
        pv = np.concatenate((np.reshape(test_data["virial"][:numb_test],
                                        [-1, 9]), np.reshape(virial, [-1, 9])),
                            axis=1)
        np.savetxt(
            os.path.join(args['system'], detail_file + ".v.out"),
            pv,
            header=
            'data_vxx data_vxy data_vxz data_vyx data_vyy data_vyz data_vzx data_vzy data_vzz pred_vxx pred_vxy pred_vxz pred_vyx pred_vyy pred_vyz pred_vzx pred_vzy pred_vzz'
        )
    return numb_test, fparam[0][0], natoms, l2e, l2ea, l2f, l2v

예제 #6

0

파일 보기

파일: dp_test.py 프로젝트: neojie/mldp

def train_ener(inputs):
    """
    deepmd-kit has function test_ener which deal with test_data only
    `train_ener` are for train data only
    """

    if inputs['rand_seed'] is not None:
        np.random.seed(inputs['rand_seed'] % (2**32))

    data = DataSets(inputs['system'],
                    inputs['set_prefix'],
                    shuffle_test=inputs['shuffle_test'])

    train_data = get_train_data(data)

    numb_test = data.get_sys_numb_batch(
        1)  ## use 1 batch, # of batches are the numb of train
    natoms = len(train_data["type"][0])
    nframes = train_data["box"].shape[0]
    #print("xxxxx",nframes, numb_test)
    numb_test = nframes  #, to be investigated, original dp use min, but here should be nframes directly, I think, Jan 18, 21, min(nfames, numb_test)
    dp = DeepPot(inputs['model'])
    coord = train_data["coord"].reshape([numb_test, -1])
    box = train_data["box"]
    atype = train_data["type"][0]
    if dp.get_dim_fparam() > 0:
        fparam = train_data["fparam"]
    else:
        fparam = None
    if dp.get_dim_aparam() > 0:
        aparam = train_data["aparam"]
    else:
        aparam = None
    detail_file = inputs['detail_file']
    if detail_file is not None:
        atomic = True
    else:
        atomic = False

    ret = dp.eval(coord,
                  box,
                  atype,
                  fparam=fparam,
                  aparam=aparam,
                  atomic=atomic)
    energy = ret[0]
    force = ret[1]
    virial = ret[2]
    energy = energy.reshape([numb_test, 1])
    force = force.reshape([numb_test, -1])
    virial = virial.reshape([numb_test, 9])
    if atomic:
        ae = ret[3]
        av = ret[4]
        ae = ae.reshape([numb_test, -1])
        av = av.reshape([numb_test, -1])

    l2e = (l2err(energy - train_data["energy"].reshape([-1, 1])))
    l2f = (l2err(force - train_data["force"]))
    l2v = (l2err(virial - train_data["virial"]))
    l2ea = l2e / natoms
    l2va = l2v / natoms

    # print ("# energies: %s" % energy)
    print("# number of train data : %d " % numb_test)
    print("Energy L2err        : %e eV" % l2e)
    print("Energy L2err/Natoms : %e eV" % l2ea)
    print("Force  L2err        : %e eV/A" % l2f)
    print("Virial L2err        : %e eV" % l2v)
    print("Virial L2err/Natoms : %e eV" % l2va)

    if detail_file is not None:
        pe = np.concatenate((np.reshape(train_data["energy"],
                                        [-1, 1]), np.reshape(energy, [-1, 1])),
                            axis=1)
        np.savetxt(os.path.join(inputs['system'], detail_file + ".e.tr.out"),
                   pe,
                   header='data_e pred_e')
        pf = np.concatenate((np.reshape(train_data["force"],
                                        [-1, 3]), np.reshape(force, [-1, 3])),
                            axis=1)
        np.savetxt(os.path.join(inputs['system'], detail_file + ".f.tr.out"),
                   pf,
                   header='data_fx data_fy data_fz pred_fx pred_fy pred_fz')
        pv = np.concatenate((np.reshape(train_data["virial"],
                                        [-1, 9]), np.reshape(virial, [-1, 9])),
                            axis=1)
        np.savetxt(
            os.path.join(inputs['system'], detail_file + ".v.tr.out"),
            pv,
            header=
            'data_vxx data_vxy data_vxz data_vyx data_vyy data_vyz data_vzx data_vzy data_vzz pred_vxx pred_vxy pred_vxz pred_vyx pred_vyy pred_vyz pred_vzx pred_vzy pred_vzz'
        )
    return numb_test, fparam[0][0], natoms, l2e, l2ea, l2f, l2v