Python Utilities.filename_only Beispiele

Programmiersprache: Python

Namespace / Paketname: meta.scripts.Utilities

Klasse / Typ: Utilities

Methode / Funktion: filename_only

Beispiele auf hotexamples.com: 3

Python Utilities.filename_only - 3 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die meta.scripts.Utilities.Utilities.filename_only, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

safe_findall(14)

dump_tsv(12)

scan_whole_dir(11)

load_tsv(10)

multi_core_queue(9)

remove_empty_values(8)

ends_with_slash(8)

dump_string(6)

single_core_queue(6)

left_merge(5)

merge_pd_series_list(4)

dict2pd_series(4)

dump_2d_array(3)

download_file(3)

filename_only(3)

is_file_valid(2)

remove_duplicate_sequences(2)

scrap_links_from_web_page(2)

load_string(2)

load_list(2)

combine_duplicate_rows(2)

get_n_majors_from_df(2)

concatenate_files(2)

flatten_2d_array(2)

dump_list(2)

get_most_similar_word_pairs(2)

get_time(1)

join_lines(1)

load_2d_array(1)

find_file_by_tail(1)

ls(1)

dump_dict(1)

decompress_file(1)

count_reads_statistics(1)

count_raw_reads_statistics(1)

count_assembly_statistics(1)

count_assembly_coverages(1)

Beispiel #1

Datei anzeigen

 def set_groupdata_dict(self, groupdata_file: str):
     self.groupdata_file = groupdata_file
     self.groupdata_digest_name = Utilities.filename_only(self.groupdata_file).replace(".groupdata", "")
     groupdata_df = pd.read_table(self.groupdata_file, sep="\t", header="infer", names=["sample_name", "group_name"])
     self.groupdata_dict = {i: sorted(set(
         groupdata_df.loc[groupdata_df["group_name"] == i, ["sample_name"]])) for i in sorted(
         set(groupdata_df["group_name"]))}
     self.raw_all_sample_names_list = sorted(set(groupdata_df["sample_name"]))

Beispiel #2

Datei anzeigen

 def split(self, output_dir: str):
     output_dir = Utilities.ends_with_slash(output_dir)
     os.makedirs(output_dir, exist_ok=True)
     # Note: the dataframe must have only index and value columns
     for sample_col_name in list(self.pivot_df):
         sample_name = Utilities.filename_only(sample_col_name).split(
             "_")[0]
         sample_file_name = "{}{}.tsv".format(output_dir, sample_name)
         self.pivot_df[sample_col_name].reset_index().rename(
             columns={
                 sample_col_name: self.value_col_name
             }).to_csv(sample_file_name, sep="\t", header=True, index=False)
         self._sample_names_list.append(sample_file_name)

Beispiel #3

Datei anzeigen

Datei: ProjectDescriber.py Projekt: ivasilyev/curated_projects

 def evaluate_sampledata():
     import os
     import subprocess
     import pandas as pd
     from meta.scripts.Utilities import Utilities
     import re
     #
     df = pd.DataFrame(columns=["sample_name", "sample_path"])
     for dir_mask in [
             "/data2/bio/ecoli_komfi/raw_reads/*",
             "/data2/bio/ecoli_komfi/raw_reads2/*"
     ]:
         data_1 = [
             i.strip() for i in subprocess.getoutput(
                 "ls -d {}R1*.fastq* | sort".format(dir_mask)).split("\n")
         ]
         data_12 = [
             "{a}\t{b}".format(a=i, b=i.replace("R1", "R2"))
             if os.path.isfile(i.replace("R1", "R2")) else ""
             for i in data_1
         ]
         sample_names_list = [
             re.sub("_S.*$", "", Utilities.filename_only(i)) for i in data_1
         ]
         df = pd.concat([
             df,
             pd.DataFrame.from_dict({
                 "sample_name": sample_names_list,
                 "sample_path": data_12
             })
         ],
                        axis=0,
                        ignore_index=True)
     #
     df["group_id"] = "group_id"
     #
     os.makedirs(ProjectDescriber.directory, exist_ok=True)
     df.loc[:,
            ["sample_name", "group_id"]].to_csv(ProjectDescriber.groupdata,
                                                sep='\t',
                                                index=False,
                                                header=False)
     df.loc[:, ["sample_name", "sample_path"]].to_csv(
         ProjectDescriber.sampledata, sep='\t', index=False, header=False)
     subprocess.getoutput(
         "sed -i 's|\"||g' {}".format(ProjectDescriber.sampledata)
     )  # Tab-containing columns items are flanked by '"'