Python getHTML 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: commonFunctions

메소드/함수: getHTML

hotexamples.com에서의 예제들: 3

Python getHTML - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 commonFunctions.getHTML에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

def download_other_fin_data_from_URL(url,index):
    try:
        if url.startswith('http://www.moneycontrol.com/india/stockpricequote/'):
            mcURLsplit = url.split('/')
            mcSymbol = mcURLsplit[-1]
            mcName = mcURLsplit[-2]
            annualFinancialURL = moneycontrolURL+'financials/'+mcName+'/balance-sheet/'+mcSymbol+'#'+mcSymbol
            annualDataHTML = getHTML(annualFinancialURL)
            directory = 'data/financials/'+str(index)+'/'
            if not os.path.exists(directory):
                os.makedirs(directory)
            dumpData(annualDataHTML, directory+'balanceSheet.p')
            annualFinancialURL = moneycontrolURL+'financials/'+mcName+'/cash-flow/'+mcSymbol+'#'+mcSymbol
            annualDataHTML = getHTML(annualFinancialURL)
            directory = 'data/financials/'+str(index)+'/'
            if not os.path.exists(directory):
                os.makedirs(directory)
            dumpData(annualDataHTML, directory+'cash_flow.p')
            annualFinancialURL = moneycontrolURL+'financials/'+mcName+'/ratios/'+mcSymbol+'#'+mcSymbol
            annualDataHTML = getHTML(annualFinancialURL)
            directory = 'data/financials/'+str(index)+'/'
            if not os.path.exists(directory):
                os.makedirs(directory)
            dumpData(annualDataHTML, directory+'ratios.p')
            annualFinancialURL = moneycontrolURL+'financials/'+mcName+'/profit-loss/'+mcSymbol+'#'+mcSymbol
            annualDataHTML = getHTML(annualFinancialURL)
            directory = 'data/financials/'+str(index)+'/'
            if not os.path.exists(directory):
                os.makedirs(directory)
            dumpData(annualDataHTML, directory+'profit_loss.p')
            annualFinancialURL = moneycontrolURL+'financials/'+mcName+'/capital-structure/'+mcSymbol+'#'+mcSymbol
            annualDataHTML = getHTML(annualFinancialURL)
            directory = 'data/financials/'+str(index)+'/'
            if not os.path.exists(directory):
                os.makedirs(directory)
            dumpData(annualDataHTML, directory+'capital_structure.p')
    except:
        print 'error'

예제 #2

파일 보기

def download_split_data_from_URL(url,index):
    try:
        if url.startswith('http://www.moneycontrol.com/india/stockpricequote/'):
            mcURLsplit = url.split('/')
            mcSymbol = mcURLsplit[-1]
            mcName = mcURLsplit[-2]
            annualFinancialURL = moneycontrolURL+'company-facts/'+mcName+'/splits/'+mcSymbol+'#'+mcSymbol
            annualDataHTML = getHTML(annualFinancialURL)
            directory = 'data/financials/'+str(index)+'/'
            if not os.path.exists(directory):
                os.makedirs(directory)
            dumpData(annualDataHTML, directory+'splits.p')
    except:
        print 'error'

예제 #3

파일 보기

def download_fin_data_from_URL(url, driver = ""):
    if url.startswith('http://www.moneycontrol.com/india/stockpricequote/'):
        mcURLsplit = url.split('/')
        mcSymbol = mcURLsplit[-1]
        mcName = mcURLsplit[-2]
        mcSector = mcURLsplit[-3]
        annualFinancialURL = moneycontrolURL+'financials/'+mcName+'/results/yearly/'+mcSymbol+'#'+mcSymbol
        quarterlyFinancialURL = moneycontrolURL+'financials/'+mcName+'/results/quarterly-results/'+mcSymbol+'#'+mcSymbol
        annualDataHTML = getHTML(annualFinancialURL)

        closeDriver = False
        if driver == "":
            driver = webdriver.Chrome()
            time.sleep(2)
            closeDriver = True
        driver.get(quarterlyFinancialURL)
        quarterDataHTML1 = ""
        quarterDataHTML2 = ""
        while True:
            quarterDataHTML1 = driver.page_source
            if quarterDataHTML1.find('Basic EPS') != -1 or quarterDataHTML1.find('Data Not Available for Quarterly Results')!= -1:
                break
            time.sleep(0.5)
        time.sleep(2)
        l = driver.find_elements_by_class_name("prevnext")
        if len(l) > 0:
            l[-1].click()
            time.sleep(2)
            while True:
                quarterDataHTML2 = driver.page_source
                if quarterDataHTML2 != quarterDataHTML1 and (quarterDataHTML2.find('Basic EPS') != -1 or quarterDataHTML2.find('Data Not Available for Quarterly Results')!= -1):
                    break
                time.sleep(1)
            if closeDriver:
                driver.close()
        return (annualDataHTML, quarterDataHTML1, quarterDataHTML2)

    else:
        print 'invalid url'
        return None