Python load_otu_mapping 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: load_analysis_seqs_through_otu_table

메소드/함수: load_otu_mapping

hotexamples.com에서의 예제들: 5

Python load_otu_mapping - 5개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 load_analysis_seqs_through_otu_table.load_otu_mapping에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: submit_illlumina_through_otu_table_to_db.py 프로젝트: ElDeveloper/qiime_web_app

def main():
    option_parser, opts, args =\
       parse_command_line_parameters(**script_info)

    
    submit_to_test_db=opts.submit_to_test_db
    fasta_file_paths=opts.fasta_file_paths
    study_id=opts.study_id
    output_dir=opts.output_dir
    
    if submit_to_test_db == 'False':
        # Load the data into the database
        data_access = data_access_factory(ServerConfig.data_access_type)
    else:
        # Load the data into the database 
        data_access = data_access_factory(DataAccessType.qiime_test)


    # Get all of the fasta files
    print 'Submitting SFF data to database...'
    analysis_id = submit_sff_and_split_lib(data_access, fasta_file_paths, study_id)
    print 'Submitting OTU data to database...'
    load_otu_mapping(data_access, output_dir, analysis_id)
    print 'Completed database loading.'

예제 #2

파일 보기

파일: test_submit_analysis_seqs_and_otu_table.py 프로젝트: ElDeveloper/qiime_web_app

    def test_submit_processed_data_to_db_fasta(self):
        """submit_processed_data_to_db_fasta runs without error"""
          
        self.files_to_remove.append(join(self.wf_out,'fasta_mapping_file.txt'))
        # process the sequence data first before loading
        run_process_fasta_through_split_lib(0,'Fasting_subset',\
                                input_fp=','.join(self.fasta_fps),\
                                mapping_fp=self.fasta_map_fp,\
                                output_dir=self.wf_out, \
                                command_handler=call_commands_serially,\
                                params=self.params,\
                                qiime_config=self.qiime_config,\
                                write_to_all_fasta=False,\
                                status_update_callback=no_status_updates)

        # get key filepaths
        input_file_basename = splitext(split(self.sff_fp)[1])[0]
        otu_fp = join(self.wf_out,'picked_otus','seqs_otus.txt')
        split_lib_seqs_fp = join(self.wf_out,'split_libraries',\
                                 'seqs.fna')
        
        # run chained OTU-picking
        run_chain_pick_otus(split_lib_seqs_fp,
                           output_dir=self.gg_out,
                           command_handler=call_commands_serially,
                           params=self.params,
                           qiime_config=self.qiime_config,parallel=True,
                           status_update_callback=no_status_updates)

        input_fname = splitext(split(self.sff_fp)[-1])[0]
        db_input_fp = join(self.wf_out,input_fname)

        # submit raw data to DB
        analysis_id, input_dir, seq_run_id, split_lib_input_md5sum = \
            submit_fasta_and_split_lib(data_access,
                                       ','.join(self.fasta_fps),
                                       self.study_id, self.wf_out)
        
        # Load OTU table data
        load_otu_mapping(data_access,self.wf_out,analysis_id)
        
        # load split-library data
        split_library_id=load_split_lib_sequences(data_access,input_dir,
                                               analysis_id, seq_run_id,
                                               split_lib_input_md5sum)
        
        ### TEST raw sequence data load
        # get expected results
        print 'Analysis ID is: %s' % str(analysis_id)
        print 'Testing the SEQ_RUN loading!'
        exp_sff_md5=['412eee0be168a285415d9e4db3dbbf2f']
        exp_num_seqs=22
        exp_instr_code='FASTA'
        exp_sff_fname=['test_split_lib_seqs']
        
        # define the query to pull data from DB
        con = data_access.getSFFDatabaseConnection()
        cur = con.cursor()
        seq_run_info="""select j.seq_run_id,f.sff_filename,f.number_of_reads,f.md5_checksum,
             h.instrument_code
             from analysis j
             inner join seq_run_to_sff_file s on j.seq_run_id=s.seq_run_id
             inner join sff_file f on f.sff_file_id=s.sff_file_id
             inner join split_library_read_map slrm on j.seq_run_id=slrm.seq_run_id
             inner join sequencing_run h on h.seq_run_id=s.seq_run_id"""
        seq_run_info+=" where j.analysis_id=%s and slrm.sample_name=\'test.PCx354.281526\'" % (str(analysis_id))
        results = cur.execute(seq_run_info)

        # get observed values
        for data in results:
            obs_seq_run_id,obs_sff_filename,obs_num_of_reads,obs_sff_md5,\
            obs_instrument_code = data

        # check results
        self.assertTrue(obs_sff_filename in exp_sff_fname)
        self.assertEqual(obs_num_of_reads,exp_num_seqs)
        self.assertTrue(obs_sff_md5 in exp_sff_md5)
        self.assertEqual(obs_instrument_code,exp_instr_code)

        ### TEST split-library sequence load
        # get expected results
        print 'Testing Split-Library Data'
        exp_split_lib_seq='TTGGGCCGTGTCTCAGTCCCAATGTGGCCGATCAGTCTCTTAACTCGGCTATGCATCATTGCCTTGGTAAGCCGTTACCTTACCAACTAGCTAATGCACCGCAGGTCCATCCAAGAGTGATAGCAGAACCATCTTTCAAACTCTAGACATGCGTCTAGTGTTGTTATCCGGTATTAGCATCTGTTTCCAGGTGTTATCCCAGTCTCTTGGG'
        exp_split_lib_md5='412eee0be168a285415d9e4db3dbbf2f'
        exp_split_lib_seq_md5='59843d3394983f2caa26f583014a3389'

        # define the query to pull data from DB
        split_lib_info="""select distinct j.seq_run_id,slrm.ssu_sequence_id,l.command,l.md5_checksum,
             s.sequence_string,s.md5_checksum
             from analysis j
             inner join split_library_read_map slrm on j.seq_run_id=slrm.seq_run_id and j.split_library_run_id=slrm.split_library_run_id
             inner join ssu_sequence s on slrm.ssu_sequence_id=s.ssu_sequence_id
             inner join split_library_run l on j.split_library_run_id=l.split_library_run_id"""
        split_lib_info+=" where j.analysis_id=%s and slrm.sample_name=\'test.PCx354.281526\'" % (str(analysis_id))
        results = cur.execute(split_lib_info)

        # get observed values
        for data in results:
            obs_seq_run_id,obs_ssu_seq_id,obs_split_lib_cmd,obs_split_lib_md5,\
            obs_split_lib_seq,obs_split_lib_seq_md5 = data

        # check results
        self.assertEqual(obs_split_lib_md5,exp_split_lib_md5)
        self.assertEqual(obs_split_lib_seq,exp_split_lib_seq)
        self.assertEqual(obs_split_lib_seq_md5,exp_split_lib_seq_md5)
        
        ### TEST OTU table load
        # get expected results
        print 'Testing OTU Data!'
        exp_otu_md5='cec9b6c184ffdb12d9de4450034ab775'
        exp_threshold=97
        
        # define the query to pull data from DB
        otu_info="""select distinct j.seq_run_id,slrm.ssu_sequence_id,ot.reference_id,gr.ssu_sequence_id,
           ot.reference_id,j.otu_picking_run_id,p.command,p.md5_sum_input_file,
           p.threshold
           from analysis j
           inner join split_library_read_map slrm on j.seq_run_id=slrm.seq_run_id and j.split_library_run_id=slrm.split_library_run_id
           inner join otu_table ot on j.otu_run_set_id=ot.otu_run_set_id
           inner join gg_plus_denovo_reference gr on ot.reference_id=gr.reference_id
           inner join otu_picking_run p on j.otu_picking_run_id=p.otu_picking_run_id"""
        otu_info+=" where j.analysis_id=%s and slrm.sample_name=\'test.PCx354.281526\'" % (str(analysis_id))
        results = cur.execute(otu_info)
        
        # get observed values
        for data in results:
            obs_seq_run_id,obs_ssu_seq_id,obs_otu_id,obs_otu_ssu_id,\
            obs_prokmsa,obs_otu_picking_run_id,obs_pick_otu_cmd,\
            obs_otu_md5,obs_threshold = data

        # check results
        self.assertEqual(obs_otu_md5,exp_otu_md5)
        self.assertEqual(obs_threshold,exp_threshold)
        
        ### TEST OTU failures load
        # define the query to pull data from DB
        otu_fail_info="""select distinct j.seq_run_id,f.ssu_sequence_id
             from analysis j
             inner join split_library_read_map slrm on j.seq_run_id=slrm.seq_run_id
             inner join otu_picking_failures f on slrm.ssu_sequence_id=f.ssu_sequence_id"""
        otu_fail_info+=" where j.analysis_id=%s and slrm.sample_name=\'test.PCx635.281531\'" % (str(analysis_id))
        results = cur.execute(otu_fail_info)
        
        # get observed values
        for data in results:
            obs_seq_run_id,obs_ssu_id= data

        # check results
        self.failIfEqual(obs_seq_run_id,0)
        self.failIfEqual(obs_ssu_id,0)
        
        # delete study data from DB
        valid=data_access.deleteTestAnalysis(True,analysis_id)
        if not valid:
            print "Error: Could not delete data from DB!"

예제 #3

파일 보기

파일: test_submit_analysis_seqs_and_otu_table.py 프로젝트: ElDeveloper/qiime_web_app

    def test_submit_processed_data_to_db_illumina(self):
        """run_process_illumina_through_pick_otus runs without error"""
        
        self.files_to_remove.append(join(self.wf_out,'s8_map_incomplete.txt'))
        
        # process the sequence data first before loading
        run_process_illumina_through_split_lib(0,'Fasting_subset',\
         input_fp=','.join(self.illumina_fps),\
         mapping_fp=self.illumina_map_fp,\
         output_dir=self.wf_out, \
         command_handler=call_commands_serially,\
         params=self.params,\
         qiime_config=self.qiime_config,\
         write_to_all_fasta=False,\
         status_update_callback=no_status_updates)
        
        # get the filepaths of key files
        input_file_basename = splitext(split(self.sff_fp)[1])[0]
        otu_fp = join(self.wf_out,'picked_otus','seqs_otus.txt')
        split_lib_seqs_fp = join(self.wf_out,'split_libraries',\
                                 'seqs.fna')
        
        # run chained OTU-picking
        run_chain_pick_otus(split_lib_seqs_fp,
                            output_dir=self.gg_out,
                            command_handler=call_commands_serially,
                            params=self.params,
                            qiime_config=self.qiime_config,parallel=True,
                            status_update_callback=no_status_updates)
                                 
        input_fname = splitext(split(self.sff_fp)[-1])[0]
        db_input_fp = join(self.wf_out,input_fname)
        
        # load the study
        analysis_id, input_dir, seq_run_id, split_lib_input_md5sum = \
            submit_illumina_and_split_lib(data_access,
                                          ','.join(self.illumina_fps),
                                          self.study_id, self.wf_out)
        
        # load the OTU table data
        load_otu_mapping(data_access,self.wf_out,analysis_id)

        # load the split-library sequence data
        split_library_id=load_split_lib_sequences(data_access,input_dir,
                                              analysis_id, seq_run_id,
                                              split_lib_input_md5sum)
        
        ### TEST raw sequence data load
        # get expected results 
        print 'Analysis ID is: %s' % str(analysis_id)
        print 'Testing the SEQ_RUN loading!'
        exp_fastq_md5=['6e3c114cec9bdc8708aaa9077fd71aa6','685cac31968b74c5d99b294ac29e9fd9']
        exp_num_seqs=100
        exp_instr_code='ILLUMINA'
        exp_fastq_fname=['s_8_2_sequence_100_records.txt','s_8_1_sequence_100_records.txt']
        
        # define the query to pull data from DB
        con = data_access.getSFFDatabaseConnection()
        cur = con.cursor()
        seq_run_info="""select j.seq_run_id,f.sff_filename,f.number_of_reads,f.md5_checksum,
              h.instrument_code
              from analysis j
              inner join seq_run_to_sff_file s on j.seq_run_id=s.seq_run_id
              inner join sff_file f on f.sff_file_id=s.sff_file_id
              inner join split_library_read_map slrm on j.seq_run_id=slrm.seq_run_id
              inner join sequencing_run h on h.seq_run_id=s.seq_run_id"""
        seq_run_info+=" where j.analysis_id=%s and slrm.sample_name=\'HKE08Aug07\'" % (str(analysis_id))
        results = cur.execute(seq_run_info)
        
        # get observed values
        for data in results:
            obs_seq_run_id,obs_fastq_filename,obs_num_of_reads,obs_fastq_md5,\
            obs_instrument_code = data
            
        # check results
        self.assertTrue(obs_fastq_filename in exp_fastq_fname)
        self.assertEqual(obs_num_of_reads,exp_num_seqs)
        self.assertTrue(obs_fastq_md5 in exp_fastq_md5)
        self.assertEqual(obs_instrument_code,exp_instr_code)
        
        print 'Done testing SEQ_RUN!'
        
        # TEST split-library sequence data
        # get expected results 
        print 'Testing Split-Library Data'
        exp_split_lib_seq='TACGAAGGGAGCTAGCGTTATTCGGAATGATTGGGTGTAAAGAGTTTGTAGATTGCAAAATTTTTGTTATTAGTAAAAAATTGAATTTATTATTTAAAGATGCTTTTAATACAATTTTGCTTGAGTATAGTAGAGGAAAAT'
        exp_split_lib_md5='700a9b08947589cfdd96525c97f9bcb4'
        exp_split_lib_seq_md5='7e8278ef1f5561d997cad48eabe40847'
        
        # define the query to pull data from DB
        split_lib_info="""select distinct j.seq_run_id,slrm.ssu_sequence_id,l.command,l.md5_checksum,
              s.sequence_string,s.md5_checksum
              from analysis j
              inner join split_library_read_map slrm on j.seq_run_id=slrm.seq_run_id and j.split_library_run_id=slrm.split_library_run_id
              inner join ssu_sequence s on slrm.ssu_sequence_id=s.ssu_sequence_id
              inner join split_library_run l on j.split_library_run_id=l.split_library_run_id"""
        split_lib_info+=" where j.analysis_id=%s and slrm.sample_name=\'HKE08Aug07\'" % (str(analysis_id))
        results = cur.execute(split_lib_info)
        
        # get observed values
        for data in results:
            obs_seq_run_id,obs_ssu_seq_id,obs_split_lib_cmd,obs_split_lib_md5,\
            obs_split_lib_seq,obs_split_lib_seq_md5 = data
        
        # check results                                                    
        self.assertEqual(obs_split_lib_md5,exp_split_lib_md5)
        self.assertEqual(obs_split_lib_seq,exp_split_lib_seq)
        self.assertEqual(obs_split_lib_seq_md5,exp_split_lib_seq_md5)
        
        ### TEST OTU table load
        # get expected results
        print 'Testing OTU Data!'
        exp_otu_md5='6bc1d4693d57ddfa6abe9bd94103476d'
        exp_threshold=97
        
        # define the query to pull data from DB
        otu_info="""select distinct j.seq_run_id,slrm.ssu_sequence_id,ot.reference_id,gr.ssu_sequence_id,
            ot.reference_id,j.otu_picking_run_id,p.command,p.md5_sum_input_file,
            p.threshold
            from analysis j
            inner join split_library_read_map slrm on j.seq_run_id=slrm.seq_run_id and j.split_library_run_id=slrm.split_library_run_id
            inner join otu_table ot on j.otu_run_set_id=ot.otu_run_set_id
            inner join gg_plus_denovo_reference gr on ot.reference_id=gr.reference_id
            inner join otu_picking_run p on j.otu_picking_run_id=p.otu_picking_run_id"""
        otu_info+=" where j.analysis_id=%s and slrm.sample_name=\'SSBH05July07\'" % (str(analysis_id))
        results = cur.execute(otu_info)
        
        # get observed values
        for data in results:
            obs_seq_run_id,obs_ssu_seq_id,obs_otu_id,obs_otu_ssu_id,\
            obs_prokmsa,obs_otu_picking_run_id,obs_pick_otu_cmd,\
            obs_otu_md5,obs_threshold = data
        
        # check results 
        self.assertEqual(obs_otu_md5,exp_otu_md5)
        self.assertEqual(obs_threshold,exp_threshold)
        
        ### TEST OTU failures load
        # define the query to pull data from DB
        otu_fail_info="""select distinct j.seq_run_id,f.ssu_sequence_id
              from analysis j
              inner join split_library_read_map slrm on j.seq_run_id=slrm.seq_run_id
              inner join otu_picking_failures f on slrm.ssu_sequence_id=f.ssu_sequence_id"""
        otu_fail_info+=" where j.analysis_id=%s and slrm.sample_name=\'HKE08Aug07\'" % (str(analysis_id))
        results = cur.execute(otu_fail_info)
        
        # get observed values
        for data in results:
            obs_seq_run_id,obs_ssu_id= data
        
        # check results 
        self.failIfEqual(obs_seq_run_id,0)
        self.failIfEqual(obs_ssu_id,0)
        
        # delete loaded study data
        valid=data_access.deleteTestAnalysis(True,analysis_id)
        if not valid:
            print "Error: Could not delete data from DB!"

예제 #4

파일 보기

파일: test_submit_analysis_seqs_and_otu_table.py 프로젝트: ElDeveloper/qiime_web_app

    def test_submit_processed_data_to_db(self):
        """run_process_sff_through_pick_otus runs without error"""
        
        self.files_to_remove.append(join(self.wf_out,'Fasting_subset.fna'))
        self.files_to_remove.append(join(self.wf_out,'Fasting_subset.qual'))
        self.files_to_remove.append(join(self.wf_out,'Fasting_subset.txt'))
        
        # remove generated mapping file
        moved_mapping_file=join(self.wf_out,split(self.fasting_mapping_fp)[-1])
        self.files_to_remove.append(moved_mapping_file)
        
        # process the sequence data first before loading
        run_process_sff_through_split_lib(0,'Fasting_subset',
          sff_input_fp=self.sff_fp, 
          mapping_fp=self.fasting_mapping_fp,
          output_dir=self.wf_out,
          command_handler=call_commands_serially,
          params=self.params,
          qiime_config=self.qiime_config,convert_to_flx=False,
          write_to_all_fasta=False,
          status_update_callback=no_status_updates)
        
        # get the file basename
        input_file_basename = splitext(split(self.sff_fp)[1])[0]
        
        # get key filepaths
        otu_fp = join(self.wf_out,'picked_otus','seqs_otus.txt')
        split_lib_seqs_fp = join(self.wf_out,'split_libraries',\
                                 'seqs.fna')
        
        # run chained OTU-picking
        run_chain_pick_otus(split_lib_seqs_fp,
                            output_dir=self.gg_out,
                            command_handler=call_commands_serially,
                            params=self.params,
                            qiime_config=self.qiime_config,parallel=False,
                            status_update_callback=no_status_updates)
                                 
        input_fname = splitext(split(self.sff_fp)[-1])[0]
        db_input_fp = join(self.wf_out,input_fname)

        # submit the data
        analysis_id, input_dir, seq_run_id, split_lib_input_md5sum = \
            submit_sff_and_split_lib(data_access,db_input_fp+'.fna',
                                     self.study_id)
        # load OTU picking
        load_otu_mapping(data_access,self.wf_out,analysis_id)
        
        # load split-lib sequences
        split_library_id=load_split_lib_sequences(data_access,input_dir,
                                                analysis_id, seq_run_id,
                                                split_lib_input_md5sum)
        
        ### TEST raw sequence data load
        # expected results
        print 'Analysis ID is: %s' % str(analysis_id)
        print 'Testing the FLOW_DATA loading!'
        exp_sff_md5='314f4000857668d45a413d2e94a755fc'
        exp_num_seqs=22
        exp_read_id='FLP3FBN01ELBSX'
        exp_instr_code='GS FLX'
        exp_sff_fname='Fasting_subset'
        
        # define the query to pull data from DB
        con = data_access.getSFFDatabaseConnection()
        cur = con.cursor()
        seq_run_info="""select j.seq_run_id,f.sff_filename,f.number_of_reads,f.md5_checksum,
              h.instrument_code
              from analysis j
              inner join seq_run_to_sff_file s on j.seq_run_id=s.seq_run_id
              inner join sff_file f on f.sff_file_id=s.sff_file_id
              inner join split_library_read_map slrm on j.seq_run_id=slrm.seq_run_id
              inner join sequencing_run h on h.seq_run_id=s.seq_run_id"""
        seq_run_info+=" where j.analysis_id=%s and slrm.sequence_name=\'test.PCx634_1\'" % (str(analysis_id))
        results = cur.execute(seq_run_info)
        
        # get observed values
        for data in results:
            obs_seq_run_id,obs_sff_filename,obs_num_of_reads,obs_sff_md5,\
            obs_instrument_code = data
        
        # check results
        self.assertEqual(obs_sff_filename,exp_sff_fname)
        self.assertEqual(obs_num_of_reads,exp_num_seqs)
        self.assertEqual(obs_sff_md5,exp_sff_md5)
        self.assertEqual(obs_instrument_code,exp_instr_code)
        
        # TEST split-library data load
        # expected results
        print 'Testing Split-Library Data'
        exp_split_lib_seq='CTGGGCCGTGTCTCAGTCCCAATGTGGCCGTTTACCCTCTCAGGCCGGCTACGCATCATCGCCTTGGTGGGCCGTTACCTCACCAACTAGCTAATGCGCCGCAGGTCCATCCATGTTCACGCCTTGATGGGCGCTTTAATATACTGAGCATGCGCTCTGTATACCTATCCGGTTTTAGCTACCGTTTCCAGCAGTTATCCCGGACACATGGGCTAGG'
        exp_split_lib_md5='2c67e0acf745bef73e26c36f0b3bd00a'
        exp_split_lib_seq_md5='008918f7469f8e33d5dd6e01075d5194'

        # define the query to pull data from DB
        split_lib_info="""select distinct j.seq_run_id,slrm.ssu_sequence_id,l.command,l.md5_checksum,
              s.sequence_string,s.md5_checksum
              from analysis j
              inner join split_library_read_map slrm on j.seq_run_id=slrm.seq_run_id and j.split_library_run_id=slrm.split_library_run_id
              inner join ssu_sequence s on slrm.ssu_sequence_id=s.ssu_sequence_id
              inner join split_library_run l on j.split_library_run_id=l.split_library_run_id"""
        split_lib_info+=" where j.analysis_id=%s and slrm.sequence_name=\'test.PCx634_1\'" % (str(analysis_id))
        results = cur.execute(split_lib_info)
        
        # get observed values
        for data in results:
            obs_seq_run_id,obs_ssu_seq_id,obs_split_lib_cmd,obs_split_lib_md5,\
            obs_split_lib_seq,obs_split_lib_seq_md5 = data
        
        # check results                                            
        self.assertEqual(obs_split_lib_md5,exp_split_lib_md5)
        self.assertEqual(obs_split_lib_seq,exp_split_lib_seq)
        self.assertEqual(obs_split_lib_seq_md5,exp_split_lib_seq_md5)
        
        # TEST OTU-table data load
        # expected results
        print 'Testing OTU Data!'
        exp_otu_md5='0b8edcf8a4275730001877496b41cf55'
        exp_threshold=97
        
        # define the query to pull data from DB
        otu_info="""select distinct j.seq_run_id,slrm.ssu_sequence_id,ot.reference_id,gr.ssu_sequence_id,
            ot.reference_id,j.otu_picking_run_id,p.command,p.md5_sum_input_file,
            p.threshold
            from analysis j
            inner join split_library_read_map slrm on j.seq_run_id=slrm.seq_run_id and j.split_library_run_id=slrm.split_library_run_id
            inner join otu_table ot on j.otu_run_set_id=ot.otu_run_set_id
            inner join gg_plus_denovo_reference gr on ot.reference_id=gr.reference_id
            inner join otu_picking_run p on j.otu_picking_run_id=p.otu_picking_run_id"""
        otu_info+=" where j.analysis_id=%s and slrm.sequence_name=\'test.PCx634_2\'" % (str(analysis_id))
        results = cur.execute(otu_info)
        
        # get observed values
        for data in results:
            obs_seq_run_id,obs_ssu_seq_id,obs_otu_id,obs_otu_ssu_id,\
            obs_prokmsa,obs_otu_picking_run_id,obs_pick_otu_cmd,\
            obs_otu_md5,obs_threshold = data
        
        # check results  
        self.assertEqual(obs_otu_md5,exp_otu_md5)
        self.assertEqual(obs_threshold,exp_threshold)
        
        # TEST OTU-failures data load
        # define the query to pull data from DB
        otu_fail_info="""select distinct j.seq_run_id,f.ssu_sequence_id
              from analysis j
              inner join split_library_read_map slrm on j.seq_run_id=slrm.seq_run_id
              inner join otu_picking_failures f on slrm.ssu_sequence_id=f.ssu_sequence_id"""
        otu_fail_info+=" where j.analysis_id=%s and slrm.sequence_name=\'test.PCx634_14\'" % (str(analysis_id))
    
        results = cur.execute(otu_fail_info)
        
        # get observed values
        for data in results:
            obs_seq_run_id,obs_ssu_id= data
        
        # check results  
        self.failIfEqual(obs_seq_run_id,0)
        self.failIfEqual(obs_ssu_id,0)
        
        # delete the loaded data
        valid=data_access.deleteTestAnalysis(True,analysis_id)
        if not valid:
            print "Error: Could not delete data from DB!"

예제 #5

파일 보기

파일: submit_analysis_and_otu_table_to_db.py 프로젝트: ElDeveloper/qiime_web_app

def main():
    option_parser, opts, args =\
       parse_command_line_parameters(**script_info)

    
    submit_to_test_db=opts.submit_to_test_db
    fasta_file_paths=opts.fasta_file_paths
    study_id=opts.study_id
    output_dir=opts.output_dir
    platform=opts.platform
    user_id=opts.user_id
    
    if submit_to_test_db == 'False':
        # Load the data into the database
        data_access = data_access_factory(ServerConfig.data_access_type)
    else:
        # Load the data into the database 
        data_access = data_access_factory(DataAccessType.qiime_test)

    # Get all of the fasta files
    if (platform=='FLX' or platform=='TITANIUM'):
        print 'Submitting SFF data to database...'
        analysis_id, input_dir, seq_run_id, split_lib_input_md5sum = \
            submit_sff_and_split_lib(data_access, fasta_file_paths, study_id)
    elif platform=='ILLUMINA':
        print 'Submitting Illumina data to database...'
        analysis_id, input_dir, seq_run_id, split_lib_input_md5sum = \
            submit_illumina_and_split_lib(data_access, fasta_file_paths,
                                          study_id,output_dir)
    elif platform=='FASTA':
        print 'Submitting FASTA data to database...'
        analysis_id, input_dir, seq_run_id, split_lib_input_md5sum = \
            submit_fasta_and_split_lib(data_access, fasta_file_paths, 
                                       study_id, output_dir)
    
    '''
    # Submit Split-library loading job
    split_library_id=load_split_lib_sequences(data_access,input_dir,
                                              analysis_id, seq_run_id,
                                              split_lib_input_md5sum)
    '''

    # verify that these are not metagenomic sequences
    # otherwise load the OTU table
    study_info=data_access.getStudyInfo(study_id,user_id)
    if study_info['investigation_type'].lower() == 'metagenome':
        # skip OTU loading
        pass
    else:
        print 'Submitting OTU data to database...'
        load_otu_mapping(data_access, output_dir, analysis_id)
    

    params=[]
    params.append('OutputDir=%s' % output_dir)
    params.append('UserId=%s' % user_id)
    params.append('StudyId=%s' % study_id)
    params.append('TestDB=%s' % submit_to_test_db)
    params.append('ProcessedFastaFilepath=%s' % (fasta_file_paths))
    params.append('AnalysisId=%s' % analysis_id)
    params.append('SeqRunId=%s' % seq_run_id)
    params.append('MDchecksum=%s' % split_lib_input_md5sum)
    job_input='!!'.join(params)
    job_type='LoadSplitLibSeqsHandler'


    submitQiimeJob(study_id, user_id, job_type, job_input, data_access)
    
    print 'Completed database loading.'