Python MongoSupply 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: mongosupply

클래스/타입: MongoSupply

hotexamples.com에서의 예제들: 7

Python MongoSupply - 7개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 mongosupply.MongoSupply에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

MongoSupply(2)

find_one(1)

insert(1)

remove(1)

예제 #1

파일 보기

 def __init__(self):
     self.database = MongoSupply()
     self.data = []
     self.window = WINDOW_SIZE
     self.HOST = ""
     self.prefix = ""
     self.suffix = ""
     self.MAX_PAGE = 47

예제 #2

파일 보기

파일: crawler.py 프로젝트: lehman3087/LogisticsPlatform

 def __init__(self):
     self.database = MongoSupply()
     self.data = []
     self.window = WINDOW_SIZE
     self.HOST = ""
     self.prefix = ""
     self.suffix = ""
     self.MAX_PAGE = 47

예제 #3

파일 보기

import tornado.httpserver
import tornado.ioloop
import tornado.options
import tornado.web
from mongosupply import MongoSupply
from tornado.options import define, options

database = MongoSupply()
define("port", default = 8000, help = "run on the given port", type = int)

class CityTopHandler(tornado.web.RequestHandler):
    def post(self):
        str_json = self.get_argument("data")
        dict_json = eval(str_json)
        dict_id = dict_json["id"]
        del dict_json["id"]
        list_json = [{key: {"$regex": dict_json[key]}} for key in dict_json]
        obj = {"$or": list_json}
        if dict_id == "":
            dict_id = "54503ce46a63436a5088db00"    # a very tiny ObjectId
        self.write(database.query(obj))
        self.add_header("new", database.newer(dict_id, obj))
        self.flush()

class LatestHandler(tornado.web.RequestHandler):
    def get(self):
        self.write(database.latest())
        self.flush()

    def post(self):
        str_json = self.get_argument("data")

예제 #4

파일 보기

import datetime
from cn0256 import Crawler0256
from cn56110 import Crawler56110
from com51yunli import Crawler51yunli
from com8glw import Crawler8glw
from comchinawutong import CrawlerChinawutong
from comfala56 import CrawlerFala56
from net56888 import Crawler56888
from mongosupply import MongoSupply

database = MongoSupply()
frequency = [[Crawler0256, Crawler51yunli], [Crawler56888, CrawlerFala56, 
          CrawlerChinawutong, Crawler56888, Crawler8glw, Crawler56110]]
minute = datetime.datetime.now().minute
crawlers = [item[minute % len(item)] for item in frequency]
for c in crawlers:
    data = c().crawl()
    for item in reversed(data):
        item["datetime"] = datetime.datetime.now()
        database.insert(item)

예제 #5

파일 보기

class Crawler():
    def __init__(self):
        self.database = MongoSupply()
        self.data = []
        self.window = WINDOW_SIZE
        self.HOST = ""
        self.prefix = ""
        self.suffix = ""
        self.MAX_PAGE = 47

    def crawl(self):
        count = 1
        while self.window > 0 and count < self.MAX_PAGE:
            page = self.get(self.request(count))
            if page is None:
                break
            self.uniform(page)
            count += 1
        logging.info("Successful to fetch %d items from %s", len(self.data),
                     self.HOST)
        return self.data

    def get(self, request):
        try:
            response = urllib.request.urlopen(request, timeout=TIMEOUT)
        except urllib.error.URLError:
            logging.warning("Failed to fetch: " + request.full_url)
            return None
        page = response.read()
        try:
            page = page.decode("utf8")
        except UnicodeDecodeError:
            page = page.decode("gbk")
        return page

    def request(self, num_page):
        url = self.HOST + self.prefix + str(num_page) + self.suffix
        return self.url2request(url)

    def url2request(self, url):
        return urllib.request.Request(url)

    def uniform(self, page):
        pass

    def good(self, item):
        keys = [
            "site", "url", "from", "to", "date", "deadline", "title", "type",
            "volume", "quality", "packing", "vehicle", "length", "attention",
            "fee", "contact", "others", "datetime"
        ]
        data = {}
        for key in keys:
            data[key] = ""
        for key in item:
            data[key] = item[key]
        return data

    def lifetime(self, begin, end=LIFETIME):
        date = self.list2date(begin)
        if type(end) is int or len(end) < 2:  # chinawutong ['长期货源']
            if type(end) is not int:
                end = LIFETIME
            deadline = date + datetime.timedelta(end)
        else:
            deadline = self.list2date(end)
        if date > self.today():
            date = self.today()
        if deadline < date:
            deadline = date + datetime.timedelta(LIFETIME)
        return date, deadline

    def list2date(self, date):
        today = self.today()
        date = [int(x) for x in ([today.year] + date)[-3:]]
        return today.replace(date[0], date[1], date[-1])

    def today(self):
        return datetime.datetime.combine(datetime.date.today(),
                                         datetime.time())

    def exist(self, obj):
        return self.database.find_one(obj) is not None

예제 #6

파일 보기

파일: crawler.py 프로젝트: lehman3087/LogisticsPlatform

class Crawler():
    def __init__(self):
        self.database = MongoSupply()
        self.data = []
        self.window = WINDOW_SIZE
        self.HOST = ""
        self.prefix = ""
        self.suffix = ""
        self.MAX_PAGE = 47

    def crawl(self):
        count = 1
        while self.window > 0 and count < self.MAX_PAGE:
            page = self.get(self.request(count))
            if page is None:
                break
            self.uniform(page)
            count += 1
        logging.info("Successful to fetch %d items from %s", 
                len(self.data), self.HOST)
        return self.data

    def get(self, request):
        try:
            response = urllib.request.urlopen(request, timeout = TIMEOUT)
        except urllib.error.URLError:
            logging.warning("Failed to fetch: " + request.full_url)
            return None
        page = response.read()
        try:
            page = page.decode("utf8")
        except UnicodeDecodeError:
            page = page.decode("gbk")
        return page

    def request(self, num_page):
        url = self.HOST + self.prefix + str(num_page) + self.suffix
        return self.url2request(url)

    def url2request(self, url):
        return urllib.request.Request(url)

    def uniform(self, page):
        pass

    def good(self, item):
        keys = ["site", "url", "from", "to", "date", "deadline", "title", 
        "type", "volume", "quality", "packing", "vehicle", "length", 
        "attention", "fee", "contact", "others", "datetime"]
        data = {}
        for key in keys:
            data[key] = ""
        for key in item:
            data[key] = item[key]
        return data

    def lifetime(self, begin, end = LIFETIME):
        date = self.list2date(begin)
        if type(end) is int or len(end) < 2:    # chinawutong ['长期货源']
            if type(end) is not int:
                end = LIFETIME
            deadline = date + datetime.timedelta(end)
        else:
            deadline = self.list2date(end)
        if date > self.today():
            date = self.today()
        if deadline < date:
            deadline = date + datetime.timedelta(LIFETIME)
        return date, deadline

    def list2date(self, date):
        today = self.today()
        date = [int(x) for x in ([today.year] + date)[-3:]]
        return today.replace(date[0], date[1], date[-1])

    def today(self):
        return datetime.datetime.combine(datetime.date.today(), datetime.time())

    def exist(self, obj):
        return self.database.find_one(obj) is not None

예제 #7

파일 보기

파일: maintenance.py 프로젝트: reference-project/LogisticsPlatform

import datetime
from mongosupply import MongoSupply

database = MongoSupply()
today = datetime.datetime.combine(datetime.date.today(), datetime.time())
obj = {"deadline": {"$lt": today}}
database.remove(obj)