Esempi in Python per Settings.SEEDS_SOURCE

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: frontera.settings

Classe/tipologia: Settings

Metodo/funzione: SEEDS_SOURCE

Esempi su hotexamples.com: 6

Settings.SEEDS_SOURCE in Python: 6 esempi trovati. Questi sono i migliori esempi reali in Python per frontera.settings.Settings.SEEDS_SOURCE, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

Settings(30)

get(12)

set(10)

BACKEND(8)

object_from(5)

MESSAGE_BUS(4)

STRATEGY(4)

SPIDER_LOG_CONSUMER_BATCH_SIZE(3)

SEEDS_SOURCE(3)

MIDDLEWARES(2)

CANONICAL_SOLVER(2)

NEW_ATTRIBUTE(1)

SEEDS_AWS_ACCESS_KEY(1)

SEEDS_AWS_SECRET_ACCESS_KEY(1)

SPIDER_FEED_PARTITIONS(1)

SPIDER_PARTITION_ID(1)

MAX_REQUESTS(1)

MAX_NEXT_REQUESTS(1)

Esempio n. 1

Mostra file

    def seed_loader_setup(self, seeds_content=None):
        seed_path = os.path.join(self.tmp_path, 'seeds.txt')
        default_content = """
https://www.example.com
https://www.scrapy.org
"""
        seeds_content = seeds_content or default_content
        with open(seed_path, 'wb') as tmpl_file:
            tmpl_file.write(seeds_content.encode('utf-8'))
        assert os.path.isfile(seed_path)  # Failure of test itself
        settings = Settings()
        settings.SEEDS_SOURCE = seed_path
        crawler = type('crawler', (object, ), {})
        crawler.settings = settings
        return FileSeedLoader(crawler)

Esempio n. 2

Mostra file

File: test_seed_loader.py Progetto: Preetwinder/frontera

    def seed_loader_setup(self, seeds_content=None):
        seed_path = os.path.join(self.tmp_path, 'seeds.txt')
        default_content = """
https://www.example.com
https://www.scrapy.org
"""
        seeds_content = seeds_content or default_content
        with open(seed_path, 'wb') as tmpl_file:
            tmpl_file.write(seeds_content.encode('utf-8'))
        assert os.path.isfile(seed_path)  # Failure of test itself
        settings = Settings()
        settings.SEEDS_SOURCE = seed_path
        crawler = type('crawler', (object,), {})
        crawler.settings = settings
        return FileSeedLoader(crawler)

Esempio n. 3

Mostra file

    def setUp(self):
        self.tmp_path = mkdtemp()
        settings = Settings()
        settings.SEEDS_SOURCE = 's3://some-bucket/seeds-folder'
        settings.SEEDS_AWS_ACCESS_KEY = 'access_key'
        settings.SEEDS_AWS_SECRET_ACCESS_KEY = 'secret_key'
        crawler = type('crawler', (object, ), {})
        crawler.settings = settings
        self.seed_path_1 = os.path.join(self.tmp_path, 'seeds1.txt')
        self.seed_path_2 = os.path.join(self.tmp_path, 'seeds2.txt')
        s1_content = """
https://www.example.com
https://www.scrapy.org
"""
        s2_content = """
https://www.dmoz.org
https://www.test.com
"""

        with open(self.seed_path_1, 'wb') as tmpl_file:
            tmpl_file.write(s1_content.encode('utf-8'))
        with open(self.seed_path_2, 'wb') as tmpl_file:
            tmpl_file.write(s2_content.encode('utf-8'))
        self.seed_loader = S3SeedLoader(crawler)

Esempio n. 4

Mostra file

File: test_seed_loader.py Progetto: Preetwinder/frontera

    def setUp(self):
        self.tmp_path = mkdtemp()
        settings = Settings()
        settings.SEEDS_SOURCE = 's3://some-bucket/seeds-folder'
        settings.SEEDS_AWS_ACCESS_KEY = 'access_key'
        settings.SEEDS_AWS_SECRET_ACCESS_KEY = 'secret_key'
        crawler = type('crawler', (object,), {})
        crawler.settings = settings
        self.seed_path_1 = os.path.join(self.tmp_path, 'seeds1.txt')
        self.seed_path_2 = os.path.join(self.tmp_path, 'seeds2.txt')
        s1_content = """
https://www.example.com
https://www.scrapy.org
"""
        s2_content = """
https://www.dmoz.org
https://www.test.com
"""

        with open(self.seed_path_1, 'wb') as tmpl_file:
            tmpl_file.write(s1_content.encode('utf-8'))
        with open(self.seed_path_2, 'wb') as tmpl_file:
            tmpl_file.write(s2_content.encode('utf-8'))
        self.seed_loader = S3SeedLoader(crawler)

Esempio n. 5

Mostra file

 def test_invalid_s3_seed_source(self):
     crawler = type('crawler', (object, ), {})
     settings = Settings()
     settings.SEEDS_SOURCE = 'invalid_url'
     crawler.settings = settings
     self.assertRaises(NotConfigured, S3SeedLoader, crawler)

Esempio n. 6

Mostra file

File: test_seed_loader.py Progetto: Preetwinder/frontera

 def test_invalid_s3_seed_source(self):
     crawler = type('crawler', (object,), {})
     settings = Settings()
     settings.SEEDS_SOURCE = 'invalid_url'
     crawler.settings = settings
     self.assertRaises(NotConfigured, S3SeedLoader, crawler)