Exemplos de Data.url em Python

Linguagem de programação: Python

Espaço para nome / nome do pacote: data

Classe / Tipo: Data

Método / Função: url

Exemplos em hotexamples.com: 2

Data.url em Python - 2 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de data.Data.url em Python extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

Data(30)

__init__(24)

importDataFromMat(8)

access_list(6)

format(5)

LoadFile(4)

P(4)

O(4)

getvalue(4)

build(3)

get_chunk_replication_degree(3)

add(3)

I(3)

file(3)

CreateDataFile(3)

get_file_modifications(3)

test(3)

get_all_stores(2)

actualizaRanking(2)

add_chunk(2)

makeGraph(2)

addCoref(2)

outputitems(2)

insertitemid(2)

populate_from_file(2)

getDates(2)

increment_replication_degree(2)

get_all_servers(2)

getCloses(2)

X_train_holdout(2)

getallkeys(2)

get_zips(2)

delete_chunk_removed(2)

extract(2)

extract_data(2)

find_interface(2)

get_ground(2)

chunk_owner(2)

get_chunk_minimum_replication_degree(2)

HP_gpu(2)

FromOneHot(2)

GetDocument(2)

ReadBatch(2)

url(2)

get_movie_num(1)

get_movie_summary(1)

get_movie_text(1)

get_news_list(1)

get_ordered_chunks_difference_replication_degree(1)

get_places(1)

Métodos Frequentes

Data (30)

__init__ (24)

importDataFromMat (8)

access_list (6)

format (5)

LoadFile (4)

P (4)

O (4)

getvalue (4)

build (3)

Métodos Frequentes

get_chunk_replication_degree (3)

add (3)

I (3)

file (3)

CreateDataFile (3)

get_file_modifications (3)

test (3)

get_all_stores (2)

actualizaRanking (2)

add_chunk (2)

makeGraph (2)

addCoref (2)

outputitems (2)

insertitemid (2)

populate_from_file (2)

getDates (2)

increment_replication_degree (2)

get_all_servers (2)

getCloses (2)

X_train_holdout (2)

Métodos Frequentes

makeGraph (2)

addCoref (2)

outputitems (2)

insertitemid (2)

populate_from_file (2)

getDates (2)

increment_replication_degree (2)

get_all_servers (2)

getCloses (2)

X_train_holdout (2)

getallkeys (2)

get_zips (2)

delete_chunk_removed (2)

extract (2)

extract_data (2)

find_interface (2)

get_ground (2)

chunk_owner (2)

get_chunk_minimum_replication_degree (2)

HP_gpu (2)

FromOneHot (2)

GetDocument (2)

ReadBatch (2)

url (2)

get_movie_num (1)

get_movie_summary (1)

get_movie_text (1)

get_news_list (1)

get_ordered_chunks_difference_replication_degree (1)

get_places (1)

Métodos Frequentes

getallkeys (2)

get_zips (2)

delete_chunk_removed (2)

extract (2)

extract_data (2)

find_interface (2)

get_ground (2)

chunk_owner (2)

get_chunk_minimum_replication_degree (2)

HP_gpu (2)

FromOneHot (2)

GetDocument (2)

ReadBatch (2)

url (2)

get_movie_num (1)

get_movie_summary (1)

get_movie_text (1)

get_news_list (1)

get_ordered_chunks_difference_replication_degree (1)

get_places (1)

resetData (1)

train (1)

get_realisations (1)

to_sparse_matrix (1)

get_results (1)

get_saying_author (1)

get_saying_num (1)

get_saying_text (1)

get_teams (1)

get_vehicle (1)

get_word_list (1)

to_gpu (1)

get_players (1)

get_movie_director (1)

get_movie_name (1)

get_file_id (1)

get_chunk_sha256 (1)

get_custom_job (1)

get_custom_name (1)

get_custom_phone (1)

Exemplo n.º 1

0

Exibir arquivo

Arquivo: data_extractor.py Projeto: carloshpds/BCC-2s13-PI4-web-crawler

def getData(self, url): data = Data() try: req = urllib2.Request(url, headers={'User-Agent' : "Magic Browser"}) request = urllib2.urlopen(req) mime = request.info().getheader('Content-Type') code = request.code print(colored('[' + mime + '] ' + url, 'yellow')) if code is 200: if 'text/html' in mime: html = request.read() data = self.parse(html, url) else: #ANALYSIS TYPE data.url = url data.type = mime elif code is 400: data.broke = True except UnicodeEncodeError as e : print(colored(e, 'red')) data.broke = True return data

Exemplo n.º 2

0

Exibir arquivo

Arquivo: data_extractor.py Projeto: carloshpds/BCC-2s13-PI4-web-crawler

def parse(self, html, path): html = BeautifulSoup(html) DOMElementURL = html.find_all('a', href=True) DOMElementImages = html.find_all('img', { "src" : True } ) DOMElementIframes = html.find_all('iframe', {"src" : True}) contentUrl = [] contentImg = [] contentVid = [] contentDoc = [] #Recupera todas as URLS for url in DOMElementURL: url = urlparse.urljoin(path, url['href']) containsPath = self.path in url isVisited = url not in self.visitedUrls if containsPath and isVisited: contentUrl.append(url) #Recupera todas as IMGS for img in DOMElementImages: img = urlparse.urljoin(path, img['src']) containsPath = self.path in img isVisited = img not in self.visitedImages if containsPath and isVisited: contentImg.append(img) self.visitedImages.append(img) #PROCURA ESPECIAL for iframe in DOMElementIframes : iframeSrc = str(iframe["src"]) #PROCURA POR VIDEOS for target in self.targetVideos: containsTarget = target in iframeSrc contentVid.append(iframSrc) self.visitedVideos.append(iframeSrc) #PROCURA POR DOCS for target in self.targetDocuments: containsTarget = target in iframeSrc contentDoc.append(iframSrc) self.visitedDoc.append(iframeSrc) data = Data() data.url = [path] data.urls = contentUrl data.img = contentImg data.doc = contentDoc data.vid = contentVid return data