Python Crawler.init примеры использования

Язык программирования: Python

Пространство имен/Пакет: crawler.crawler

Класс/Тип: Crawler

Метод/Функция: __init__

Примеров на hotexamples.com: 3

Python Crawler.__init__ - 3 примера найдено. Это лучшие примеры Python кода для crawler.crawler.Crawler.__init__, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

Crawler(30)

crawl(20)

close(7)

run(6)

start(5)

load_and_tokenize(3)

__init__(3)

attempt_login(2)

stop(2)

fetch_stock_data(2)

scrape(2)

max_depth(1)

retrieve_user_comments(1)

raw_report(1)

report(1)

retrieve_information(1)

retrieve_total_user_comments_score(1)

retrieve_user_avg_karma(1)

progress_bar(1)

scan(1)

retrieve_user_posts(1)

return_all_content(1)

save_found_weburls(1)

launch(1)

scrape_links(1)

search(1)

soupify(1)

start_bfs(1)

start_dfs(1)

start_poll(1)

steps_count(1)

learn(1)

get_tag_by_id(1)

get_user_by_post_id(1)

getMostFrequentWords(1)

add_rules(1)

add_seeds(1)

build_post_data(1)

crawl_dest(1)

crawl_files(1)

crawl_next_url(1)

create_remote_dir(1)

documents(1)

fetch_case_detail_link(1)

fill_disallow_urls(1)

find_all_urls(1)

getText(1)

get_url(1)

get_8k_form(1)

get_dependency_list(1)

Пример #1

Показать файл

 def __init__(self, starting_url=False, save=False, initial_seed=False):
     Crawler.__init__(self)
     #No database values, just these attributes
     self.url = starting_url if starting_url else self.base_url + "/w/Category:Artist"
     self.save = save
     self.initial_seed = initial_seed
     #self.url = self.tree.xpath("//div[@class='listPagination'][1]/a[contains(text(), 'next')]/@href")[0]
     return

Пример #2

Показать файл

    def __init__(self, url, save=False, initial_seed=False):
        Crawler.__init__(self)
        #Database values
        self.row_id = False
        self.name = ''
        self.url = url

        #Other variables
        self.save = save #If not saving, print for debugging and testing purposes
        self.initial_seed = initial_seed
        return

Пример #3

Показать файл

    def __init__(self, dj_id, dj_name, url, save=False, initial_seed=False):
        Crawler.__init__(self)
        #Database values
        self.row_id = False
        self.dj_id = dj_id
        self.url = url
        self.track_ids = list()
        self.multi_dj = False
        self.multi_version = True
        self.page_mod_time = False

        #Other attributes, including xpath components
        self.dj_name = dj_name
        self.searchable_dj_name = self.dj_name.split("(")[0].strip()
        self.no_comments_selector = "not(contains(@class,'commenttextfield'))"
        self.tree = self.get_tree(url)
        self.track_texts = list()
        self.save = save #If not saving, print for debugging and testing purposes
        self.initial_seed = initial_seed
        return

Python Crawler.__init__ примеры использования

Python Crawler.init примеры использования