Ejemplo n.º 1
    def get_stations(self):
        c.logging('Begin load stations info')

        # проверяем есть ли у нас файл с информацией о системах, если нет - скачиваем
        if not os.path.exists(c.station_data_file):
            c.logging('Can\'t find station data file. Load it from www.davek.com.au')
            c.get_web_object(c.station_data_url, c.station_data_file)
            c.logging('Load station data file comlete')

        stp = c.stationpattern

        f = open(c.station_data_file, 'r')

        while True:
            # читаем файл построчно
            line = f.readline()
            if not line: break

            # обрезаем перенос строки в конце
            line = line[0:-1]

            if stp.search(line):
                search_result = stp.search(line).groups()

                tmp_system = search_result[0].lower()
                tmp_station = search_result[1].lower()

                if tmp_system not in self.cache_data[c.cd_st]:
                    self.cache_data[c.cd_st][tmp_system] = {}

                self.cache_data[c.cd_st][tmp_system][tmp_station] = search_result[2:]

        c.logging('Finish load stations info')
Ejemplo n.º 2
    def get_systems(self):
        c.logging('Begin load systems info')
        # проверяем есть ли у нас файл с информацией о системах, если нет - скачиваем
        if not os.path.exists(c.system_data_file):
            c.logging('Can\'t find system data file. Load it from www.davek.com.au')
            c.get_web_object(c.system_data_url, c.system_data_file)
            c.logging('Load system data file comlete')

        smp = c.systemspattern

        f = open(c.system_data_file, 'r')

        while True:
            # читаем файл построчно
            line = f.readline()
            if not line: break

            # обрезаем перенос строки в конце
            line = line[0:-1]

            if smp.search(line):
                self.cache_data[c.cd_sm][str((smp.search(line).groups())[0].lower())] = (smp.search(line).groups())[1:]

        c.logging('Finish load systems info')
Ejemplo n.º 3
    def calc_best_routes(self):
        c.logging('Begin best route calculation')
        t_best_route_array = []
        t_station_array = []
        i = 0
        # создадим массив для того чтобы были неповторяющиеся отношения
        for system in self.cache_data[c.cd_pr]:
            for station in self.cache_data[c.cd_pr][system]:
                if int((self.cache_data[c.cd_st][system][station])[0]) <= c.station_distance:
                    t_station_array.append({'system': system, 'station': station})
                    i += 1

        # общее кол-во станций в переборе
        i = round(i*i/2)
        print('Общее кол-во станций в переборе: {}'.format(i))
        # для текущего указателя перебора
        y = 0
        # для сохранения текущего прогресса
        z = 0
        # low_system_distance = 0
        # max_system_distance = 30
        print('Построение массива маршрутов: ', end='')
        while len(t_station_array) > 0:
            route_begin = t_station_array.pop()
            for route_end in t_station_array:
                # забыл  проверить на расстояние
                if c.low_system_distance < self.calc_distance(route_begin['system'], route_end['system']) <= c.max_system_distance:
                    t_direct = self.get_in_td(route_begin['system'], route_end['system'], route_begin['station'], route_end['station'])
                    t_reverse = self.get_in_td(route_begin['system'], route_end['system'], route_begin['station'], route_end['station'], 'r')
                    if t_direct['status'] == 1 and t_reverse['status'] == 1:
                        t_best_route_array.append({'direct': t_direct, 'reverse': t_reverse})
                y += 1
                if (round((y/i)*100) % 10) == 0 and round((y/i)*10) != z:
                    z = round((y/i)*10)
                    print('#', end='')
        t_best_route_array.sort(key = c.best_sort_func, reverse = True)

        for route in t_best_route_array:
            with open(c.output_file_name, mode='a') as f:
                f.write('route: {} [{} ls] --> {} [{} ls] ({: >5} ly) profit: {: >5} cr\n'.format(route['direct']['route_begin'], route['direct']['station_a_dist'], route['direct']['route_end'], route['direct']['station_b_dist'], route['direct']['route_dist'], (int(route['direct']['profit']) + int(route['reverse']['profit']))))
                f.write('\t{: <21}: profit {: >5} cr, buy {: >5} cr, sell {: >5} cr, stock {: >9}, demand {: >9}\n'.format(route['direct']['product'], route['direct']['profit'], route['direct']['buy'], route['direct']['sell'], route['direct']['stock'], route['direct']['demand']))
                f.write('\t{: <21}: profit {: >5} cr, buy {: >5} cr, sell {: >5} cr, stock {: >9}, demand {: >9}\n'.format(route['reverse']['product'], route['reverse']['profit'], route['reverse']['buy'], route['reverse']['sell'], route['reverse']['stock'], route['reverse']['demand']))

        c.logging('End best route calculation')
Ejemplo n.º 4
 def __init__(self):
     super(CacheData, self).__init__()
     #c.cd_pr = 'prices'
     #c.cd_sm = 'systems'
     #c.cd_st = 'stations'
     #cd_stsl_ar = 'station_slave_array'
     #td_ar = 'trade_array'
     self.cache_data = {c.cd_pr: {}, c.cd_sm: {}, c.cd_st: {}, c.cd_stsl_ar: {}, c.td_ar: []}
     # TODO: перенести очистку лога в какое-нибудь другое место
     # очищаем лог файл и говорим о начале работы
     c.logging('Begin create cache data')
     # получаем информацию о системах, станциях и ценах
     c.logging('End create cache data')
Ejemplo n.º 5
  Module to create a simple sql database for recording crawled urls.
  This is used to avoid outright duplication of enriched articles.

import sqlite3
import argparse
import os
import logging
import sys
import config

log = config.logging()

def get_default_db():
    return os.path.join(config.here(),
                        os.path.join('..', os.path.join('data', 'urls.db')))

def connect(db_file):
    return sqlite3.connect(db_file)

def insert(db_file, date, urls):
    if type(urls) is not list:
        urls = [urls]
    urls = [str(x) for x in urls]
    conn = connect(db_file)
    c = conn.cursor()
    for url in urls:
Ejemplo n.º 6
    def get_price(self):

        c.logging('Begin load price info')

        # проверяем есть ли у нас файл с информацией о ценах, если нет - скачиваем
        # TODO: сделать проверку на актуальность файла и перезакачивать, если он протух
        if not os.path.exists(c.station_price_file):
            c.logging('Can\'t find price data file. Load it from www.davek.com.au')
            c.get_web_object(c.station_price_url, c.station_price_file)
            c.logging('Load price data file comlete')

        pp = c.pricepattern
        ps = c.pricepattern_system_line
        sdp = c.sd_pattern
        system_name = ''
        station_name = ''

        f = open(c.station_price_file, 'r')

        while True:
            # читаем файл построчно
            line = f.readline()
            if not line: break
            # обрезаем перенос строки в конце
            line = line[0:-1]

            if ps.search(line):
                # если строка содержит систему и станцию, парсим ее
                system_name = ((ps.search(line).groups())[0]).lower()
                station_name = ((ps.search(line).groups())[1]).lower()
                # проверяем станцию на размер и наоичие в кеше станций
                if system_name not in self.cache_data[c.cd_st] or \
                   station_name not in self.cache_data[c.cd_st][system_name] or \
                   (self.cache_data[c.cd_st][system_name][station_name])[2] != 'L':
                    # если размер не подходит, оставляем систему и станцию незаполненными. 
                    # это и будет одним из признаком сохранять товар или нет
                    system_name = ''
                    station_name = ''
                    # если по размеру проходит, создаем структуру в словаре (если ее еще нет)
                    if system_name not in self.cache_data[c.cd_pr]:
                        self.cache_data[c.cd_pr][system_name] = {}
                    if station_name not in self.cache_data[c.cd_pr][system_name]:
                        self.cache_data[c.cd_pr][system_name][station_name] = {}

            elif system_name != '' and station_name != '' and pp.search(line):
                product = ((pp.search(line).groups())[0]).lower()
                sell = (pp.search(line).groups())[1]
                buy = (pp.search(line).groups())[2]
                demand = (pp.search(line).groups())[3]
                stock = (pp.search(line).groups())[4]
                timestamp = (pp.search(line).groups())[5]

                if demand == '?' or demand == '-':
                    demand = -1
                if stock == '?' or stock == '-':
                    stock = -1

                if sdp.search(str(demand)):
                    demand = (sdp.search(str(demand)).groups())[0]

                if sdp.search(str(stock)):
                    stock = (sdp.search(str(stock)).groups())[0]

                self.cache_data[c.cd_pr][system_name][station_name][product] = (sell, buy, demand, stock, timestamp)
        # ----------------------------------------------------------------------------------------------------------
        c.logging('End load price info')