Ejemplos de ReadFile.SPARKreadFile en Python

Lenguaje de programación: Python

Clase / Tipo: ReadFile

Método / Función: SPARKreadFile

Ejemplos en hotexamples.com: 2

Python ReadFile.SPARKreadFile - 2 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de ReadFile.SPARKreadFile de paquete python36patterns extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

ReadFile(16)

get_inventory_types(9)

QAData(5)

ReadExpectFile(4)

file_reading_gen(4)

ReadConfiguration(3)

delete_note_in_numberFile(2)

read_caps(2)

AlgebraFile(2)

get_option(2)

SPARKreadFile(2)

ReadAgents(2)

Read_JPG(2)

ReadRealFlie(2)

creat_world_city_dictionary(1)

doSomething(1)

ATractableSubsetsFile(1)

filesize(1)

get_init_inv_vals(1)

check_pass(1)

get_mins(1)

readFileForKMean(1)

read_decrement(1)

read_times(1)

creat_corpus_city_dictionary(1)

Tecplot(1)

check_login(1)

__reset(1)

Vtk(1)

UserRatingMatrix(1)

ReadLocations(1)

ReadInteractions(1)

ReadFromFile(1)

ReadFilesList(1)

ReadEvents(1)

Read(1)

InputOutput(1)

InputControl(1)

GetListUSerTest(1)

GetData(1)

CSVtoDictConverter(1)

writeToKMeaFile(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: MultiProcess.py Proyecto: Daniele-db2/DNA_Alignment

def mP(a, tab, Aligner, sc):
    manager = multiprocessing.Manager()
    alignments = manager.list()
    cores = int(input('Inserisci il numero di processori: '))
    if cores > multiprocessing.cpu_count():
        cores = multiprocessing.cpu_count()
        print("Superato il numero massimo di processori,", str(cores),
              "in uso")
    else:
        print(str(cores), "processori in uso")
    processes = []
    data = ReadFile.SPARKreadFile(sc)
    dict = [x["SEQ"] for x in data.rdd.collect()]
    #dict = ReadFile.HengLireadFile() #Heng Li
    chunk_size = len(dict) / cores
    slices = Chunks(dict, math.ceil(chunk_size))
    for i, s in enumerate(slices):
        procname = 'processor' + str(i)
        p = multiprocessing.Process(target=Alignment.mPalignment,
                                    args=(a, tab, Aligner, s, alignments,
                                          procname))
        p.start()
        processes.append(p)
    for p in processes:
        p.join()
    DF = spark.createDataFrame(alignments)
    DataFrame = DF.join(data, on=['seq'], how='inner')
    return DataFrame

Ejemplo n.º 2

Mostrar archivo

Archivo: main.py Proyecto: Daniele-db2/DNA_Alignment

from pyspark.shell import sqlContext
import Alignment
import createBam
import MultiProcess
from pyspark import SparkContext, SparkConf
from timeit import default_timer as timer
import os
import ReadFile
import SparkAligner
import Aligner
import pickle
import HashTable
from datetime import datetime

sc = SparkContext.getOrCreate()
data = ReadFile.SPARKreadFile(sc)
dict = [x["SEQ"] for x in data.rdd.collect()]

#CODICE CON MAPPY ===================================================================================================================
a = mp.Aligner("reference.fa", preset="map-ont")
alignmentsS = []
# alignmentsH = []
tab = str.maketrans('ACTG', 'TGAC')
AlignerS = namedtuple('SEQ', [
    'contig', 'flag', 'seq', 'pos', 'mapq', 'cigar', 'is_primary', 'MDtag',
    'cstag'
])  #SPARK
# AlignerH = namedtuple('SEQ', ['contig', 'Rname', 'flag', 'pos', 'mapq', 'cigar', 'seq', 'is_primary', 'MDtag', 'cstag','basequal']) #Heng Li

# startMP = timer()
# DataFrameMP = MultiProcess.mP(a, tab, AlignerS, sc) #MULTIPROCESSORE SPARK