Python SmilesTokeniser 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: chemmltoolkit.processing.smiles

메소드/함수: SmilesTokeniser

hotexamples.com에서의 예제들: 11

Python SmilesTokeniser - 11개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 chemmltoolkit.processing.smiles.SmilesTokeniser에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

0

파일 보기

파일: test_smiles.py 프로젝트: Andy-Wilkinson/ChemMLToolkit

    def test_untokenise_smiles_with_simplify_rings(self, smiles_str, split,
                                                   tokens):
        token_list = ['?', 'C', '1', '2', '%12', '%']

        tokeniser = smiles.SmilesTokeniser(token_list,
                                           splitting_method=split,
                                           simplify_rings=True)
        smiles_result = tokeniser.untokenise_smiles(tokens)
        assert smiles_result == smiles_str

예제 #2

0

파일 보기

파일: test_smiles.py 프로젝트: Andy-Wilkinson/ChemMLToolkit

    def test_tokenise_smiles_all_tokens(self, smiles_str, tokens):
        token_list = [
            '?', 'C', 'N', 'O', 'Cl', 'Br', '[Pt]', '(', ')', '=', '1', '2',
            '3', '%10'
        ]

        tokeniser = smiles.SmilesTokeniser(token_list)
        tokens_result = tokeniser.tokenise_smiles(smiles_str)
        assert tokens_result == tokens

예제 #3

0

파일 보기

파일: test_smiles.py 프로젝트: Andy-Wilkinson/ChemMLToolkit

    def test_tokenise_smiles_with_sos_eos(self, smiles_str, token_sos,
                                          token_eos, tokens):
        token_list = ['C', 'N', 'O', 'Cl', 'Br', '<SOS>', '<EOS>']

        tokeniser = smiles.SmilesTokeniser(token_list,
                                           token_sos=token_sos,
                                           token_eos=token_eos)
        tokens_result = tokeniser.tokenise_smiles(smiles_str)
        assert tokens_result == tokens

예제 #4

0

파일 보기

파일: test_smiles.py 프로젝트: Andy-Wilkinson/ChemMLToolkit

    def test_tokenise_smiles_with_simplify_rings(self, smiles_str, split,
                                                 tokens):
        token_list = ['?', 'C', '1', '2', '3']

        tokeniser = smiles.SmilesTokeniser(token_list,
                                           splitting_method=split,
                                           simplify_rings=True)
        tokens_result = tokeniser.tokenise_smiles(smiles_str)
        assert tokens_result == tokens

예제 #5

0

파일 보기

파일: test_smiles.py 프로젝트: Andy-Wilkinson/ChemMLToolkit

    def test_tokenise_smiles_with_padding(self, smiles_str, token_pad, length,
                                          truncate, tokens):
        token_list = ['C', 'N', 'O', 'Cl', 'Br', '_', ' ']

        tokeniser = smiles.SmilesTokeniser(token_list,
                                           token_padding=token_pad,
                                           sequence_length=length,
                                           truncate_sequence=truncate)
        tokens_result = tokeniser.tokenise_smiles(smiles_str)
        assert tokens_result == tokens

예제 #6

0

파일 보기

파일: test_smiles.py 프로젝트: Andy-Wilkinson/ChemMLToolkit

    def test_tokenise_smiles_with_unknown_placeholder(self, smiles_str, split,
                                                      placeholder, tokens):
        token_list = ['C', 'Br', 'B', 'r', '?', '[Pt]', '[', 'P', 't', ']']

        tokeniser = smiles.SmilesTokeniser(token_list,
                                           splitting_method=split,
                                           token_unknown=placeholder)
        tokens_result = tokeniser.tokenise_smiles(smiles_str)
        assert tokens_result == tokens
        assert tokeniser.missing_tokens == {'S', 'N'}

예제 #7

0

파일 보기

파일: test_smiles.py 프로젝트: Andy-Wilkinson/ChemMLToolkit

    def test_tokenise_smiles_characters(self, smiles_str, tokens):
        token_list = [
            '?', 'C', 'N', 'O', 'l', 'B', '[', 'P', 't', ']', '(', ')', '=',
            '1', '2', '3', '%', '0', 'r'
        ]

        tokeniser = smiles.SmilesTokeniser(token_list,
                                           splitting_method='characters')
        tokens_result = tokeniser.tokenise_smiles(smiles_str)
        assert tokens_result == tokens

예제 #8

0

파일 보기

파일: test_smiles.py 프로젝트: Andy-Wilkinson/ChemMLToolkit

    def test_tokenise_smiles_halogens_only(self, smiles_str, tokens):
        token_list = [
            '?', 'C', 'N', 'O', 'Cl', 'Br', '[', 'P', 't', ']', '(', ')', '=',
            '1', '2', '3', '%', '0'
        ]

        tokeniser = smiles.SmilesTokeniser(token_list,
                                           splitting_method='halogens_only')
        tokens_result = tokeniser.tokenise_smiles(smiles_str)
        assert tokens_result == tokens

예제 #9

0

파일 보기

파일: test_smiles.py 프로젝트: Andy-Wilkinson/ChemMLToolkit

    def test_tokenise_smiles_with_pad_sos_eos(self, smiles_str, token_sos,
                                              token_eos, tokens):
        token_list = ['C', 'N', 'O', 'Cl', 'Br', '<SOS>', '<EOS>', '_']

        tokeniser = smiles.SmilesTokeniser(token_list,
                                           token_sos=token_sos,
                                           token_eos=token_eos,
                                           token_padding='_',
                                           sequence_length=7)
        tokens_result = tokeniser.tokenise_smiles(smiles_str)
        assert tokens_result == tokens

예제 #10

0

파일 보기

파일: test_smiles.py 프로젝트: Andy-Wilkinson/ChemMLToolkit

    def test_exception_if_seq_length_not_padding(self):
        token_list = ['?', 'C', '1', '2', '%12', '%']

        with pytest.raises(ValueError):
            _ = smiles.SmilesTokeniser(token_list, sequence_length=50)

예제 #11

0

파일 보기

파일: test_smiles.py 프로젝트: Andy-Wilkinson/ChemMLToolkit

    def test_exception_if_padding_not_seq_length(self):
        token_list = ['?', 'C', '1', '2', '%12', '%']

        with pytest.raises(ValueError):
            _ = smiles.SmilesTokeniser(token_list, token_padding='?')