Python Collector 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: src.collector

클래스/타입: Collector

hotexamples.com에서의 예제들: 8

Python Collector - 8개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 src.collector.Collector에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

collect(6)

Collector(5)

start(1)

자주 사용되는 메소드들

collect (6)

Collector (5)

start (1)

예제 #1

파일 보기

def test_collect(start_expr: str, end_expr: str, start_cnt: int,
                 end_cnt: int) -> None:
    collected = Collector.collect(
        user="******",
        date_range=DateRange(
            start=date.fromisoformat(start_expr),
            end=date.fromisoformat(end_expr),
        ),
    )

    # Use mangled variable for test only
    assert collected._Extractor__user == "lntuition"
    assert collected._Extractor__df.iloc[0]["date"] == pd.Timestamp(start_expr)
    assert collected._Extractor__df.iloc[-1]["date"] == pd.Timestamp(end_expr)
    assert collected._Extractor__df.iloc[0]["count"] == pd.to_numeric(
        start_cnt)
    assert collected._Extractor__df.iloc[-1]["count"] == pd.to_numeric(end_cnt)

예제 #2

파일 보기

from src.collector import Collector
from src.config.req import config
from time import sleep

if __name__ == '__main__':
    clc = Collector()

    while True:
        clc.collect()
        print('Sleeping...')
        sleep(config.sleep_time)

예제 #3

파일 보기

파일: setup.py 프로젝트: So1itarius/Polus

from src.collector import Collector

if __name__ == "__main__":
    collector = Collector()
    #Для удобства я использую сортировку страниц сайта, поэтому такая ссылка
    starturl = "http://tenders.polyusgold.com/purchases/?NAME=&CODE=&BU=&PT=&ORDER=DATE_ACTIVE_TO%3AASC"
    archiveurl = "http://tenders.polyusgold.com/archive/?NAME=&BU=&PT=&ORDER=DATE_ACTIVE_TO%3ADESC"
    #Запускаем активные и архив по очереди,передавая статус и время
    p = collector.collect(starturl, "2", None)
    print("checking archive ...")
    collector.collect(archiveurl, "3", p)

예제 #4

파일 보기

from time import sleep
from src.collector import Collector
from settings import sleep_time

if __name__ == "__main__":
    collector = Collector(quantity=None,
                          publish_date=None,
                          base_url='https://etpgpb.ru')
    while True:
        collector.collect()
        #break
        sleep(sleep_time)

예제 #5

파일 보기

from src.collector import Collector

if __name__ == '__main__':
    Collector().collect()

예제 #6

파일 보기

파일: main.py 프로젝트: yao97/wafan

    phpsessid = 't4cjka7f4nedrmmq7dubipji16'

    # 日记内容保存路径
    content_file_path = 'data/content.txt'

    # 日记时间保存路径
    time_file_path = 'data/time.txt'

    # 词云图片保存路径
    content_png_path = 'data/content.png'

    # 统计时间柱状图保存路径
    time_png_path = 'data/time.png'

    # 爬取数据
    # url: 某个人的饭否主页
    # phpsessid: 登录饭否后浏览器 Cookie 中的值
    # content_file_path: 日记内容保存路径
    # time_file_path: 日记时间保存路径
    Collector.collect(url, phpsessid, content_file_path, time_file_path)

    # 分词，制作词云
    # content_file_path: 日记内容保存路径
    # content_png_path: 词云图片保存路径
    Analyzer.segment_and_visualize(content_file_path, content_png_path)

    # 统计发日记时间
    # time_file_path: 日记时间保存路径
    # time_png_path: 时间柱状图保存路径
    Analyzer.count_times(time_file_path, time_png_path)

예제 #7

파일 보기

파일: init.py 프로젝트: pedronalbert/coloso-collector

def initCollector(region):
    collector = Collector(region, interval)
    collector.start()

예제 #8

파일 보기

import os
from datetime import date

from src.collector import Collector
from src.date import DateRange
from src.extractor import Extractor
from src.skeleton import SkeletonFactory
from src.writer import Writer

if __name__ == "__main__":
    factory = SkeletonFactory(
        language=os.environ["INPUT_LANGUAGE"],
    )

    Writer(
        extractor=Collector.collect(
            user=os.environ["INPUT_USER"],
            date_range=DateRange(
                start=date.fromisoformat(os.environ["INPUT_START_DATE"]),
                end=date.fromisoformat(os.environ["INPUT_END_DATE"]),
            ),
        ),
        skeleton_string_map=factory.get_string_map(),
        skeleton_list_map=factory.get_list_map(),
    ).write(
        file_name=os.environ["INPUT_FILE_NAME"],
    )