Exemplos de Utilities.scrap_links_from_web_page em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: meta.scripts.Utilities

Classe / Tipo: Utilities

Método / Função: scrap_links_from_web_page

Exemplos em hotexamples.com: 2

Utilities.scrap_links_from_web_page em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de meta.scripts.Utilities.Utilities.scrap_links_from_web_page em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

safe_findall(14)

dump_tsv(12)

scan_whole_dir(11)

load_tsv(10)

multi_core_queue(9)

remove_empty_values(8)

ends_with_slash(8)

dump_string(6)

single_core_queue(6)

left_merge(5)

merge_pd_series_list(4)

dict2pd_series(4)

dump_2d_array(3)

download_file(3)

filename_only(3)

is_file_valid(2)

remove_duplicate_sequences(2)

scrap_links_from_web_page(2)

load_string(2)

load_list(2)

combine_duplicate_rows(2)

get_n_majors_from_df(2)

concatenate_files(2)

flatten_2d_array(2)

dump_list(2)

get_most_similar_word_pairs(2)

get_time(1)

join_lines(1)

load_2d_array(1)

find_file_by_tail(1)

ls(1)

dump_dict(1)

decompress_file(1)

count_reads_statistics(1)

count_raw_reads_statistics(1)

count_assembly_statistics(1)

count_assembly_coverages(1)

Métodos Frequentes

safe_findall (14)

dump_tsv (12)

scan_whole_dir (11)

load_tsv (10)

multi_core_queue (9)

remove_empty_values (8)

ends_with_slash (8)

dump_string (6)

single_core_queue (6)

left_merge (5)

Métodos Frequentes

merge_pd_series_list (4)

dict2pd_series (4)

dump_2d_array (3)

download_file (3)

filename_only (3)

is_file_valid (2)

remove_duplicate_sequences (2)

scrap_links_from_web_page (2)

load_string (2)

load_list (2)

combine_duplicate_rows (2)

get_n_majors_from_df (2)

concatenate_files (2)

flatten_2d_array (2)

dump_list (2)

get_most_similar_word_pairs (2)

get_time (1)

join_lines (1)

load_2d_array (1)

find_file_by_tail (1)

Métodos Frequentes

combine_duplicate_rows (2)

get_n_majors_from_df (2)

concatenate_files (2)

flatten_2d_array (2)

dump_list (2)

get_most_similar_word_pairs (2)

get_time (1)

join_lines (1)

load_2d_array (1)

find_file_by_tail (1)

ls (1)

dump_dict (1)

decompress_file (1)

count_reads_statistics (1)

count_raw_reads_statistics (1)

count_assembly_statistics (1)

count_assembly_coverages (1)

Métodos Frequentes

ls (1)

dump_dict (1)

decompress_file (1)

count_reads_statistics (1)

count_raw_reads_statistics (1)

count_assembly_statistics (1)

count_assembly_coverages (1)

Exemplo n.º 1

0

Exibir arquivo

def __init__(self, version: str): _DL_PAGE_URL = "http://202.120.12.135/TADB2/download.html" self.describer = ReferenceDescriber() self.describer.VERSION = version self.describer.update_alias() self.reference_dir = os.path.join("/data/reference", self.describer.NAME, self.describer.ALIAS) links = [i for i in Utilities.scrap_links_from_web_page(_DL_PAGE_URL) if i.endswith(".fas")] self._fasta_types = ["nucleotide", "protein"] self._links_dict = {k: [i for i in links if i.split("/")[-2] == k] for k in self._fasta_types} assert len(self._links_dict["nucleotide"]) + len(self._links_dict["protein"]) == len(links) self.nfasta = os.path.join(self.reference_dir, "{}.fasta".format(self.describer.ALIAS)) self.pfasta = os.path.join(self.reference_dir, "{}_protein.fasta".format(self.describer.ALIAS)) self.index_dir = ""

Exemplo n.º 2

0

Exibir arquivo

Arquivo: ReferenceDescriber.py Projeto: ivasilyev/curated_projects

def __init__(self): self.describer = ReferenceDescriber() self.describer.VERSION = self._get_last_friday() self.reference_dir = os.path.join("/data/reference", self.describer.NAME, self.describer.ALIAS) links = [ i for i in Utilities.scrap_links_from_web_page(self._DL_PAGE_URL) if i.endswith(".gz") ] self._dl_queue = [] for dl_link in links: dl_dir = self.reference_dir if "_pro" in dl_link: dl_dir = os.path.join(dl_dir, "protein") elif "_nt" in dl_link: dl_dir = os.path.join(dl_dir, "nucleotide") self._dl_queue.append((dl_link, dl_dir)) self.nfasta = os.path.join(self.reference_dir, "{}.fasta".format(self.describer.ALIAS)) self.pfasta = os.path.join( self.reference_dir, "{}_protein.fasta".format(self.describer.ALIAS))