Ejemplos de DataStore.store_data en Python

Lenguaje de programación: Python

Namespace/Package Name: data_store

Clase / Tipo: DataStore

Método / Función: store_data

Ejemplos en hotexamples.com: 1

Python DataStore.store_data - 1 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de data_store.DataStore.store_data extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

DataStore(30)

get_instance(7)

update(6)

from_filename(5)

disconnect(5)

activate(4)

shutdown(4)

create_data_store(3)

get_settings(3)

print(3)

get_path(3)

read_practices_from_csv_file(3)

read_students_from_csv_file(3)

list(3)

save_settings(3)

set_ds_type(3)

save_profile(2)

load(2)

retrieve_from_file(2)

add_event_matches(2)

apply_active_profile(2)

get_paths(2)

net_saver(1)

next(1)

store_data(1)

set_enabled(1)

purgeDataset(1)

purge(1)

set_active_profile(1)

select_data(1)

records_saver(1)

insert(1)

rename(1)

rewind(1)

addSourceFile(1)

get_students(1)

i(1)

delete_profile(1)

add_document(1)

add_file(1)

add_profile(1)

append(1)

bin_1d(1)

bin_2d(1)

createDataset(1)

create_address_csv_file(1)

deactivate(1)

dimensions_saver(1)

has_next(1)

extract_addresses(1)

Ejemplo n.º 1

Mostrar archivo

class WebSpider(scrapy.Spider):    
   name = "web"

   def __init__(self):
      dispatcher.connect(self.spider_closed, signals.spider_closed)
      self.dstore = DataStore()   

   # Scrapy's method to start crawling
   def start_requests(self):
      # Seed URLs
      urls = [
         'https://es.wikipedia.org/wiki/Procesamiento_de_lenguajes_naturales',
         'https://es.wikipedia.org/wiki/Aprendizaje_autom%C3%A1tico',
         'https://es.wikipedia.org/wiki/B%C3%BAsqueda_y_recuperaci%C3%B3n_de_informaci%C3%B3n',
         'https://es.wikipedia.org/wiki/Modelo_de_espacio_vectorial'
      ]

      # Start crawling process
      for u in urls:
         yield scrapy.Request(url=u, callback=self.parse)

      # Set scraped count to 0
      self.count = 0

   # Crawling Algorithm
   def parse(self, response):
      ''' This method is called repeatedly to process documents from the URL frontier.

      Scrapy handles compliance of Politeness policies    
      '''

      url = response.request.url

      # Remove html tags from the document
      raw_text = GetText(response.body)

      # Preprocess the document's content
      tokens = Preprocess(raw_text)

      # Add document to be stored in local storage
      if self.count < LIMIT:
         self.dstore.add_document(tokens, response.body, url)

      # Extract url references and add them to the url frontier
      for a in response.css('a'):
         if 'href' in a.attrib:
            yield response.follow(a, callback=self.parse)

      # Limit of pages to crawl
      if self.count > LIMIT:
         raise CloseSpider(reason='reached_limit')    # Force spider to close

      print(str(self.count) + '\n\n')     # IGNORE/COMMENT THIS
      
      self.count += 1
      

   def spider_closed(self, spider):
      # Store scraped documents when spider finishes crawling
      self.dstore.store_data()