Python HGStockNetSpiderUtils.returnStartContext примеры использования

Язык программирования: Python

Класс/Тип: HGStockNetSpiderUtils

Метод/Функция: returnStartContext

Примеров на hotexamples.com: 2

Python HGStockNetSpiderUtils.returnStartContext - 2 примера найдено. Это лучшие примеры Python кода для HGStockNetSpiderUtils.returnStartContext, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

filterContextByTarget(2)

returnStartContext(2)

divisionTarget(1)

findAllTarget(1)

getMySQLConn(1)

removeSpecialCharacter(1)

Пример #1

Показать файл

Файл: HGStockNetSpider.py Проект: nicevoice/SpiderKTServer

def crawDailyStockComments(link,webNet):
    currentList = []
    startContext = HGStockNetSpiderUtils.returnStartContext(link,'<ul class="ul-news-list">')
    startContext = HGStockNetSpiderUtils.filterContextByTarget(startContext,'<ul','</ul>')
    len = HGStockNetSpiderUtils.findAllTarget(startContext,'<li>')
    for i in range(len):
        targetContext = HGStockNetSpiderUtils.divisionTarget(startContext,'<li>','</li>')
        startContext = targetContext['nextContext']
        currentContext =  targetContext['targetContext']
        linkUrl = webNet + HGStockNetSpiderUtils.filterContextByTarget(currentContext,'<a href="','">')
        title = HGStockNetSpiderUtils.filterContextByTarget(currentContext,'">','</a>')
        currentYear = str(time.strftime('%Y',time.localtime(time.time())))+'-'
        pubDate = currentYear + HGStockNetSpiderUtils.filterContextByTarget(currentContext,'[',']')
        descriptContext = crawDailyDescriptContext(linkUrl)
        currentList.append([str(uuid.uuid1()),linkUrl,title,pubDate,descriptContext,'STOCK','HGNET'])
    return currentList

Пример #2

Показать файл

Файл: HGStockNetSpider.py Проект: nicevoice/SpiderKTServer

def crawDailyDescriptContext(linkUrl):
    startContext = HGStockNetSpiderUtils.returnStartContext(linkUrl,'<div class="article_con" id="div-article-content">')
    filterContext = HGStockNetSpiderUtils.filterContextByTarget(startContext,'<p>','</p>')
    filterContext = HGStockNetSpiderUtils.removeSpecialCharacter(filterContext)
    return filterContext