Python NCBITaxonomyScrapper 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: dabeplech.scrappers.ncbi_taxonomy.taxonomy

클래스/타입: NCBITaxonomyScrapper

hotexamples.com에서의 예제들: 8

Python NCBITaxonomyScrapper - 8개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 dabeplech.scrappers.ncbi_taxonomy.taxonomy.NCBITaxonomyScrapper에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

NCBITaxonomyScrapper(7)

result_found(3)

retrieve_current_item(3)

extract_tax_id_from_url(1)

retrieve_hierarchy(1)

예제 #1

파일 보기

파일: test_taxonomy.py 프로젝트: hmenager/dabeplech

 def test_retrieve_hierarchy(self):
     scrapper = NCBITaxonomyScrapper(self.file)
     expected_list = [{
         'name': 'cellular organisms',
         'rank': 'no rank',
         'tax_id': '131567'
     }, {
         'name': 'Bacteria',
         'rank': 'superkingdom',
         'tax_id': '2'
     }, {
         'name': 'Terrabacteria group',
         'rank': 'clade',
         'tax_id': '1783272'
     }, {
         'name': 'Firmicutes',
         'rank': 'phylum',
         'tax_id': '1239'
     }, {
         'name': 'Bacilli',
         'rank': 'class',
         'tax_id': '91061'
     }, {
         'name': 'Lactobacillales',
         'rank': 'order',
         'tax_id': '186826'
     }]
     tested_list = scrapper.retrieve_hierarchy()
     self.assertListEqual(tested_list, expected_list)

예제 #2

파일 보기

파일: test_taxonomy.py 프로젝트: hmenager/dabeplech

 def test_retrieve_current_item(self):
     scrapper = NCBITaxonomyScrapper(self.file)
     expected_dict = {
         'rank': 'family',
         'tax_id': '33958',
         'name': 'Lactobacillaceae'
     }
     tested_dict = scrapper.retrieve_current_item()
     self.assertDictEqual(tested_dict, expected_dict)

예제 #3

파일 보기

파일: ncbi_taxonomy.py 프로젝트: hmenager/dabeplech

 def get(self, tax_id: int, get_model: bool = True) -> Union[NCBITaxonomyScrapper.model, dict]:
     """
     :param tax_id: NCBI taxonomy ID to retrieve data from
     :param get_model: return pydantic model (return dict if False)
     """
     full_url = f"https://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?id={tax_id}&mode=info"
     response = self.session.get(full_url)
     self.last_url_requested = full_url
     response.raise_for_status()
     scrapper = NCBITaxonomyScrapper(response.content)
     if not scrapper.result_found():
         raise requests.exceptions.HTTPError(f"{tax_id} not found in NCBI taxonomy db.")
     if get_model:
         return scrapper.validated_entry
     return scrapper.validated_entry.dict()

예제 #4

파일 보기

파일: test_taxonomy.py 프로젝트: hmenager/dabeplech

 def test_retrieve_current_item_variant_1(self):
     """
     Some entry has different display and more information, for instance tax_id 12345
     """
     file_path = os.path.join(os.path.dirname(__file__),
                              'data/tax_12345.html')
     tax_file = open(file_path, "rb")
     scrapper = NCBITaxonomyScrapper(tax_file)
     expected_dict = {
         'rank': 'species',
         'tax_id': '12345',
         'name': 'Bacillus virus GA1'
     }
     tested_dict = scrapper.retrieve_current_item()
     self.assertDictEqual(tested_dict, expected_dict)

예제 #5

파일 보기

파일: test_taxonomy.py 프로젝트: hmenager/dabeplech

 def test_retrieve_current_item_no_link(self):
     """
     Some entry has their names without a link, for instance tax_id 339588
     """
     file_path = os.path.join(os.path.dirname(__file__),
                              'data/tax_339588.html')
     tax_file = open(file_path, "rb")
     scrapper = NCBITaxonomyScrapper(tax_file)
     expected_dict = {
         'rank': 'species',
         'tax_id': '339588',
         'name': 'Peyssonnelia inamoena'
     }
     tested_dict = scrapper.retrieve_current_item()
     self.assertDictEqual(tested_dict, expected_dict)

예제 #6

파일 보기

파일: test_taxonomy.py 프로젝트: hmenager/dabeplech

 def test_extract_tax_id_from_url(self):
     tested_url = "wwwtax.cgi?mode=Undef&amp;id=131567&amp;lvl=3&amp;keep=1&amp;srchmode=1&amp;unlock"
     expected_id = "131567"
     tested_id = NCBITaxonomyScrapper.extract_tax_id_from_url(tested_url)
     self.assertEqual(tested_id, expected_id)

예제 #7

파일 보기

파일: test_taxonomy.py 프로젝트: hmenager/dabeplech

 def test_result_found_error_page(self):
     file_path = os.path.join(os.path.dirname(__file__),
                              'data/error_page.html')
     tax_file = open(file_path, "rb")
     scrapper = NCBITaxonomyScrapper(tax_file)
     self.assertFalse(scrapper.result_found())

예제 #8

파일 보기

파일: test_taxonomy.py 프로젝트: hmenager/dabeplech

 def test_result_found(self):
     scrapper = NCBITaxonomyScrapper(self.file)
     self.assertTrue(scrapper.result_found())