Python PandasPDB示例，biopandas.pdb.PandasPDB Python示例

示例#1

0

显示文件

文件： test_write_pdb.py 项目： RaoUmer/biopandas

def test_records():
    """Test private _read_pdb."""
    ppdb = PandasPDB()
    ppdb.read_pdb(TESTDATA_FILENAME)
    ppdb.to_pdb(path=OUTFILE, records=["HETATM"])
    with open(OUTFILE, "r") as f:
        f1 = f.read()
    os.remove(OUTFILE)
    assert f1 == hetatm

示例#2

0

显示文件

文件： test_write_pdb.py 项目： RaoUmer/biopandas

def test_anisou():
    """Test writing ANISOU entries."""
    ppdb = PandasPDB()
    ppdb.read_pdb(TESTDATA_FILENAME2)
    ppdb.to_pdb(path=OUTFILE, records=None)
    with open(OUTFILE, "r") as f:
        f1 = f.read()
    # os.remove(OUTFILE)
    assert f1 == four_eiy

示例#3

0

显示文件

文件： test_write_pdb.py 项目： RaoUmer/biopandas

def test_defaults():
    ppdb = PandasPDB()
    ppdb.read_pdb(TESTDATA_FILENAME)
    ppdb.to_pdb(path=OUTFILE, records=None)
    with open(TESTDATA_FILENAME, "r") as f:
        f1 = f.read()
    with open(OUTFILE, "r") as f:
        f2 = f.read()
    assert f1 == f2
    os.remove(OUTFILE)

示例#4

0

显示文件

def test_fetch_pdb():
    """Test fetch_pdb"""

    try:
        ppdb = PandasPDB()
        txt = ppdb._fetch_pdb('3eiy')
    except HTTPError:
        pass

    if txt:  # skip if PDB down
        txt[:100] == three_eiy[:100]
        ppdb.fetch_pdb('3eiy')
        assert ppdb.pdb_text == txt

示例#5

0

显示文件

文件： test_read_pdb.py 项目： rasbt/biopandas

def test_fetch_pdb():
    """Test fetch_pdb"""

    try:
        ppdb = PandasPDB()
        txt = ppdb._fetch_pdb('3eiy')
    except HTTPError:
        pass

    if txt:  # skip if PDB down
        txt[:100] == three_eiy[:100]
        ppdb.fetch_pdb('3eiy')
        assert ppdb.pdb_text == txt

示例#6

0

显示文件

文件： test_read_pdb.py 项目： BenJamesbabala/biopandas

def test_fetch_pdb():
    """Test fetch_pdb"""

    try:
        ppdb = PandasPDB()
        txt = ppdb._fetch_pdb('3eiy')
    except HTTPError:
        pass

    if txt: # skip if PDB down
        txt[:100] == three_eiy[:100]
        ppdb.fetch_pdb('3eiy')
        assert ppdb.pdb_text == txt
        txt = ppdb._fetch_pdb('3ey')
        err = "We're sorry, but the requested file is not available"
        assert err in txt

示例#7

0

显示文件

文件： mock_pdb_factory.py 项目： dkeem/FlavinDB

    def _gen_anisou(self):
        ''' Generate information to mimic the ANISOU part of a pdb file.

            Not implemented because not needed as of current version (1/31/2017)


        '''
        self.df = PandasPDB().read_pdb('./test.pdb').df['ANISOU']
        return

示例#8

0

显示文件

文件： test_read_pdb.py 项目： BenJamesbabala/biopandas

def test__construct_df():
    """Test pandas dataframe construction"""
    ppdb = PandasPDB()
    dfs = ppdb._construct_df(three_eiy.splitlines())
    assert set(dfs.keys()) == {'OTHERS', 'ATOM', 'ANISOU', 'HETATM'}
    assert set(dfs['ATOM'].columns) == set(ATOM_DF_COLUMNS)
    assert set(dfs['HETATM'].columns) == set(ATOM_DF_COLUMNS)
    assert set(dfs['ANISOU'].columns) == set(ANISOU_DF_COLUMNS)
    exp = pd.Series(np.array(['ATOM', 1, '', 'N', '', 'SER', '', 'A', 2, '', '',
              2.527, 54.656, -1.667, 1.0, 52.73, '', '', 'N', None, 609]),
          index=['record_name', 'atom_number', 'blank_1',
                 'atom_name', 'alt_loc', 'residue_name',
                 'blank_2', 'chain_id', 'residue_number',
                 'insertion', 'blank_3',
                 'x_coord', 'y_coord', 'z_coord',
                 'occupancy', 'b_factor', 'blank_4',
                 'segment_id', 'element_symbol',
                 'charge', 'line_idx'])
    assert exp.equals(dfs['ATOM'].loc[0, :])

示例#9

0

显示文件

文件： mock_pdb_factory.py 项目： dkeem/FlavinDB

    def _gen_others(self):
        ''' Essentialy the 'meta information' at the top of pdb files
            Will add 'OTHER' information to self.df dict


            Returns: None
        '''
        # essentially load the headers from the test.pdb file
        #   which is PDB with some things chagned to make it look obviously wrong
        self.df['OTHERS'] = PandasPDB().read_pdb('./test.pdb').df['OTHERS']
        return

示例#10

0

显示文件

文件： test_read_pdb.py 项目： smopart/biopandas

def test__construct_df():
    """Test pandas dataframe construction"""
    ppdb = PandasPDB()
    dfs = ppdb._construct_df(three_eiy.splitlines())
    assert set(dfs.keys()) == {'OTHERS', 'ATOM', 'ANISOU', 'HETATM'}
    assert set(dfs['ATOM'].columns) == set(ATOM_DF_COLUMNS)
    assert set(dfs['HETATM'].columns) == set(ATOM_DF_COLUMNS)
    assert set(dfs['ANISOU'].columns) == set(ANISOU_DF_COLUMNS)
    exp = pd.Series(np.array([
        'ATOM', 1, '', 'N', '', 'SER', '', 'A', 2, '', '', 2.527, 54.656,
        -1.667, 1.0, 52.73, '', '', 'N', None, 609
    ]),
                    index=[
                        'record_name', 'atom_number', 'blank_1', 'atom_name',
                        'alt_loc', 'residue_name', 'blank_2', 'chain_id',
                        'residue_number', 'insertion', 'blank_3', 'x_coord',
                        'y_coord', 'z_coord', 'occupancy', 'b_factor',
                        'blank_4', 'segment_id', 'element_symbol', 'charge',
                        'line_idx'
                    ])
    assert exp.equals(dfs['ATOM'].loc[0, :])

示例#11

0

显示文件

def test_get_df():
    ppdb = PandasPDB()
    ppdb.read_pdb(TESTDATA_FILENAME)

    shape = ppdb.get('c-alpha').shape
    assert shape == (174, 21), shape

    shape = ppdb.get('hydrogen', invert=True).shape
    assert shape == (1330, 21), shape

    shape = ppdb.get('hydrogen').shape
    assert shape == (0, 21), shape

    shape = ppdb.get('main chain').shape
    assert shape == (696, 21), shape

    shape = ppdb.get('heavy').shape
    assert shape == (1330, 21), shape

    shape = ppdb.get('carbon').shape
    assert shape == (473, 21), shape

示例#12

0

显示文件

def test_anisou():
    """Test writing ANISOU entries."""
    ppdb = PandasPDB()
    ppdb.read_pdb(TESTDATA_FILENAME2)
    ppdb.to_pdb(path=OUTFILE, records=None)
    with open(OUTFILE, 'r') as f:
        f1 = f.read()
    # os.remove(OUTFILE)
    assert f1 == four_eiy

示例#13

0

显示文件

def test_records():
    """Test private _read_pdb."""
    ppdb = PandasPDB()
    ppdb.read_pdb(TESTDATA_FILENAME)
    ppdb.to_pdb(path=OUTFILE, records=['HETATM'])
    with open(OUTFILE, 'r') as f:
        f1 = f.read()
    os.remove(OUTFILE)
    assert f1 == hetatm

示例#14

0

显示文件

def test_defaults():
    ppdb = PandasPDB()
    ppdb.read_pdb(TESTDATA_FILENAME)
    ppdb.to_pdb(path=OUTFILE, records=None)
    with open(TESTDATA_FILENAME, 'r') as f:
        f1 = f.read()
    with open(OUTFILE, 'r') as f:
        f2 = f.read()
    assert f1 == f2
    os.remove(OUTFILE)

示例#15

0

显示文件

文件： test_read_pdb.py 项目： rasbt/biopandas

def test_get_df():
    ppdb = PandasPDB()
    ppdb.read_pdb(TESTDATA_FILENAME)

    shape = ppdb.get('c-alpha').shape
    assert shape == (174, 21), shape

    shape = ppdb.get('hydrogen', invert=True).shape
    assert shape == (1330, 21), shape

    shape = ppdb.get('hydrogen').shape
    assert shape == (0, 21), shape

    shape = ppdb.get('main chain').shape
    assert shape == (696, 21), shape

    shape = ppdb.get('heavy').shape
    assert shape == (1330, 21), shape

    shape = ppdb.get('carbon').shape
    assert shape == (473, 21), shape

示例#16

0

显示文件

def check_structure_exists(name):
    if not name:
        raise ValueError("Empty name, cannot check if structure is valid")
    pro = None
    for _ in range(3):
        try:
            pro = PandasPDB().fetch_pdb(name)
            if pro: break
        except:
            continue
    if not hasattr(pro, 'df'):
        return False
    if len(pro.df['HETATM']) == 0 or len(pro.df["ATOM"]) == 0:
        return False

    # no errors; this structure is probably fine?
    return True

示例#17

0

显示文件

文件： test_read_pdb.py 项目： smopart/biopandas

def test_fetch_pdb():
    """Test fetch_pdb"""

    try:
        ppdb = PandasPDB()
        txt = ppdb._fetch_pdb('3eiy')
    except HTTPError:
        pass

    if txt:  # skip if PDB down
        txt[:100] == three_eiy[:100]
        ppdb.fetch_pdb('3eiy')
        assert ppdb.pdb_text == txt
        txt = ppdb._fetch_pdb('3ey')
        err = "We're sorry, but the requested file is not available"
        assert err in txt

示例#18

0

显示文件

文件： test_read_pdb.py 项目： rasbt/biopandas

def test_get_exceptions():
    ppdb = PandasPDB()
    ppdb.read_pdb(TESTDATA_FILENAME)
    ppdb.get('main-chai')

示例#19

0

显示文件

文件： test_read_pdb.py 项目： smopart/biopandas

def test_get_all():
    ppdb = PandasPDB()
    ppdb.read_pdb(TESTDATA_FILENAME)
    for i in ['c-alpha', 'hydrogen', 'main chain']:
        ppdb.get(i)

示例#20

0

显示文件

文件： test_read_pdb.py 项目： smopart/biopandas

def test__read_pdb():
    """Test private _read_pdb"""
    ppdb = PandasPDB()
    txt = ppdb._read_pdb(TESTDATA_FILENAME)
    print(txt)
    assert txt == three_eiy

示例#21

0

显示文件

文件： test_read_pdb.py 项目： smopart/biopandas

def test_anisou_input_handling():
    """Test public read_pdb"""
    ppdb = PandasPDB()
    ppdb.read_pdb(TESTDATA_FILENAME2)
    assert ppdb.pdb_text == four_eiy
    assert ppdb.code == '4eiy', ppdb.code

示例#22

0

显示文件

文件： test_read_pdb.py 项目： smopart/biopandas

def test_get_exceptions():
    ppdb = PandasPDB()
    ppdb.read_pdb(TESTDATA_FILENAME)
    ppdb.get('main-chai')

示例#23

0

显示文件

文件： test_rmsd.py 项目： BenJamesbabala/biopandas

def test_ligand():
    r = PandasPDB.rmsd(pl1.df['HETATM'], pl2.df['HETATM'], s='hydrogen', invert=True)
    assert r == 2.6444, r

示例#24

0

显示文件

文件： test_read_pdb.py 项目： smopart/biopandas

def test_read_pdb():
    """Test public read_pdb"""
    ppdb = PandasPDB()
    ppdb.read_pdb(TESTDATA_FILENAME)
    assert ppdb.pdb_text == three_eiy
    assert ppdb.code == '3eiy', ppdb.code

示例#25

0

显示文件

def test_ligand_default():
    r = PandasPDB.rmsd(pl1.df['HETATM'], pl2.df['HETATM'], s=None)
    assert r == 2.6444, r

示例#26

0

显示文件

文件： test_rmsd.py 项目： BenJamesbabala/biopandas

def test_protein():
    r = PandasPDB.rmsd(p1t48.df['ATOM'], p1t49.df['ATOM'], s='c-alpha', invert=False)
    assert r == 0.4785, r

示例#27

0

显示文件

文件： test_rmsd.py 项目： rasbt/biopandas

def test_ligand_default():
    r = PandasPDB.rmsd(pl1.df['HETATM'], pl2.df['HETATM'],
                       s=None)
    assert r == 2.6444, r

示例#28

0

显示文件

文件： test_read_pdb.py 项目： smopart/biopandas

def test__read_pdb_gz():
    """Test public _read_pdb with gzip files"""
    ppdb = PandasPDB()
    txt = ppdb._read_pdb(TESTDATA_FILENAME_GZ)
    assert txt == three_eiy

示例#29

0

显示文件

文件： test_impute.py 项目： rasbt/biopandas

# Author: Sebastian Raschka <*****@*****.**>
# License: BSD 3 clause
# Project Website: http://rasbt.github.io/biopandas/
# Code Repository: https://github.com/rasbt/biopandas


from biopandas.pdb import PandasPDB
import os
import numpy as np
import pandas as pd
from nose.tools import raises

TESTDATA_FILENAME = os.path.join(os.path.dirname(__file__), 'data',
                                 '3eiy_stripped_no_ele.pdb')

ppdb = PandasPDB()
ppdb.read_pdb(TESTDATA_FILENAME)


def test_impute_hetatm():
    new = ppdb.impute_element(sections=['HETATM'])
    assert new['HETATM']['element_symbol'][1] == 'N'
    assert new['HETATM']['element_symbol'][10] == 'O'
    assert new['ATOM']['element_symbol'][1] == ''
    assert new['ATOM']['element_symbol'][10] == ''


def test_impute_atom():
    new = ppdb.impute_element(sections=['ATOM'])
    assert new['ATOM']['element_symbol'][1] == 'C'
    assert new['ATOM']['element_symbol'][10] == 'C'

示例#30

0

显示文件

文件： test_rmsd.py 项目： BenJamesbabala/biopandas

# Project Website: http://rasbt.github.io/biopandas/
# Code Repository: https://github.com/rasbt/biopandas

from biopandas.pdb import PandasPDB
import os
import numpy as np
import pandas as pd
from nose.tools import raises


TESTDATA_1t48 = os.path.join(os.path.dirname(__file__), 'data', '1t48_995.pdb')
TESTDATA_1t49 = os.path.join(os.path.dirname(__file__), 'data', '1t49_995.pdb')
TESTDATA_lig1 = os.path.join(os.path.dirname(__file__), 'data', 'lig_conf_1.pdb')
TESTDATA_lig2 = os.path.join(os.path.dirname(__file__), 'data', 'lig_conf_2.pdb')

p1t48 = PandasPDB()
p1t48.read_pdb(TESTDATA_1t48)
p1t49 = PandasPDB()
p1t49.read_pdb(TESTDATA_1t49)

pl1 = PandasPDB()
pl1.read_pdb(TESTDATA_lig1)
pl2 = PandasPDB()
pl2.read_pdb(TESTDATA_lig2)

def test_equal():
    r = PandasPDB.rmsd(p1t48.df['ATOM'], p1t48.df['ATOM'], s=None)
    assert r == 0.000, r

@raises(AttributeError)
def test_wrong_arg():

示例#31

0

显示文件

文件： test_read_pdb.py 项目： rasbt/biopandas

def test_anisou_input_handling():
    """Test public read_pdb"""
    ppdb = PandasPDB()
    ppdb.read_pdb(TESTDATA_FILENAME2)
    assert ppdb.pdb_text == four_eiy
    assert ppdb.code == '4eiy', ppdb.code

示例#32

0

显示文件

文件： test_read_pdb.py 项目： rasbt/biopandas

def test__read_pdb():
    """Test private _read_pdb"""
    ppdb = PandasPDB()
    txt = ppdb._read_pdb(TESTDATA_FILENAME)
    print(txt)
    assert txt == three_eiy

示例#33

0

显示文件

文件： test_read_pdb.py 项目： rasbt/biopandas

def test__read_pdb_gz():
    """Test public _read_pdb with gzip files"""
    ppdb = PandasPDB()
    txt = ppdb._read_pdb(TESTDATA_FILENAME_GZ)
    assert txt == three_eiy

示例#34

0

显示文件

文件： test_rmsd.py 项目： BenJamesbabala/biopandas

def test_wrong_arg():
    r = PandasPDB.rmsd(p1t48.df['ATOM'].loc[1:, :], p1t48.df['ATOM'], s='bla')

示例#35

0

显示文件

文件： test_rmsd.py 项目： BenJamesbabala/biopandas

def test_incompatible():
    r = PandasPDB.rmsd(p1t48.df['ATOM'].loc[1:, :], p1t48.df['ATOM'], s=None)

示例#36

0

显示文件

文件： test_read_pdb.py 项目： rasbt/biopandas

def test_read_pdb():
    """Test public read_pdb"""
    ppdb = PandasPDB()
    ppdb.read_pdb(TESTDATA_FILENAME)
    assert ppdb.pdb_text == three_eiy
    assert ppdb.code == '3eiy', ppdb.code

示例#37

0

显示文件

文件： test_rmsd.py 项目： BenJamesbabala/biopandas

def test_invalid_query():
    r = PandasPDB.rmsd(p1t48.df['ATOM'].loc[1:, :], p1t48.df['ATOM'], s='bla')

示例#38

0

显示文件

文件： test_rmsd.py 项目： BenJamesbabala/biopandas

def test_equal():
    r = PandasPDB.rmsd(p1t48.df['ATOM'], p1t48.df['ATOM'], s=None)
    assert r == 0.000, r

示例#39

0

显示文件

文件： test_read_pdb.py 项目： rasbt/biopandas

def test_get_all():
    ppdb = PandasPDB()
    ppdb.read_pdb(TESTDATA_FILENAME)
    for i in ['c-alpha', 'hydrogen', 'main chain']:
        ppdb.get(i)