Python HTMLData примеры использования

Язык программирования: Python

Пространство имен/Пакет: lib.HTMLData

Класс/Тип: HTMLData

Примеров на hotexamples.com: 12

Python HTMLData - 12 примеров найдено. Это лучшие примеры Python кода для lib.HTMLData.HTMLData, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

getStringHTMLData(8)

SaveHTML(2)

Пример #1

Показать файл

	def CreateQuery(self, buildData=None):
		data = hhAPI.getCityCode(self.city, JSONParser.Parse(HTMLData.getStringHTMLData('https://api.hh.ru/areas', 'utf-8')))
		link = "https://api.hh.ru/vacancies?specialization="
		for spec in self.specializationIdList[:-1]:
			if spec.split(".")[0] in self.importantSpecializations:
				link += spec + "&specialization="
		link += self.specializationIdList[-1]
		link += "&area=1"
		print(buildData)
		if buildData is not None:
			print("self.progLangs union = ")
			print(self.progLangs[0].union(buildData))
		else:
			print("self.progLangs = ")
			print(self.progLangs)
		if self.progLangs is not None:
			link += "&text="
			for lang in self.progLangs[0]:
				link += lang + "%20or%20"
			link = link[:-8]
		link += "&per_page=200"
		print(link)
		res = JSONParser.Parse(HTMLData.getStringHTMLData(link, 'utf-8'))
		#print(res)
		print("result len = " + str(res['found']))
		res = self.ReadManyVacancyes(res['items'])
		return res

Пример #2

Показать файл

	def ReadManyVacancyes(self, JSONAllVacancyData):
		result = []
		count = 0
		for item in JSONAllVacancyData:
			# print(item)
			count += 1
			findedInCache = VacancyCache.objects.filter(vacancy_Id=item['url'].split("vacancies/")[1])
			if len(findedInCache) == 0:
				VacancyJson = JSONParser.Parse(HTMLData.getStringHTMLData(item['url'], 'utf-8'))
				if VacancyJson['salary'] is not None and VacancyJson['salary']['to'] != None and VacancyJson['salary']['from'] != None:
					vacancy = VacancyCache(name=VacancyJson['name'], description=VacancyJson['description'],
					                       url=VacancyJson['alternate_url'],
					                       company_name=VacancyJson['employer']['name'], salary_start=VacancyJson['salary']['from'],
					                       salary_end=VacancyJson['salary']['to'], vacancy_Id=VacancyJson['id'])
					self.SaveVacancyToDB(vacancy)
					result.append(vacancy)
				else:
					vacancy = VacancyCache(name=VacancyJson['name'], description=VacancyJson['description'],
					                       url=VacancyJson['alternate_url'],
					                       company_name=VacancyJson['employer']['name'], salary_start=0,
					                       salary_end=0, vacancy_Id=VacancyJson['id'])
					self.SaveVacancyToDB(vacancy)
					result.append(vacancy)
			else:
				result.append(findedInCache[0])
			if count > 100:
				break
		# print(len(result))
		return result

Пример #3

Показать файл

	def GetJSONByUserName(UserName):
		res = None
		link = "https://api.github.com/users/" + UserName + "/repos"
		# print(link)
		try:
			res = JSONParser.Parse(HTMLData.getStringHTMLData(link, 'utf-8'))
		except:
			print("wrong git hub url, ignoring")
		return res

Пример #4

Показать файл

Файл: GitHubAPI.py Проект: BorisGuliyan/Diplom

 def GetJSONByUserName(UserName):
     res = None
     link = "https://api.github.com/users/" + UserName + "/repos"
     # print(link)
     try:
         res = JSONParser.Parse(HTMLData.getStringHTMLData(link, "utf-8"))
     except:
         print("wrong git hub url, ignoring")
     return res

Пример #5

Показать файл

	def GetLanguages(UserName):
		languagesLinks = []
		languagesNames = []
		ReposJSON = GitHubAPI.GetJSONByUserName(UserName)
		if ReposJSON is not None:
			for val in ReposJSON:
				languagesLinks.append(val['languages_url'])
			for link in languagesLinks:     #TODO may be sloooowwwww
				keysList = JSONParser.Parse(HTMLData.getStringHTMLData(link, 'utf-8')).keys()   #слишком медленно работает
				for lang in keysList:
					# print(lang)
					if lang.lower() in commonLangs:
						languagesNames.append(lang.lower())
			# print(set(languagesNames))
		return set(languagesNames)
			#languagesNames.append(JSONParser.Parse(HTMLData.getStringHTMLData(link, 'utf-8')))

Пример #6

Показать файл

Файл: GitHubAPI.py Проект: BorisGuliyan/Diplom

 def GetLanguages(UserName):
     languagesLinks = []
     languagesNames = []
     ReposJSON = GitHubAPI.GetJSONByUserName(UserName)
     if ReposJSON is not None:
         for val in ReposJSON:
             languagesLinks.append(val["languages_url"])
         for link in languagesLinks:  # TODO may be sloooowwwww
             keysList = JSONParser.Parse(
                 HTMLData.getStringHTMLData(link, "utf-8")
             ).keys()  # слишком медленно работает
             for lang in keysList:
                 # print(lang)
                 if lang.lower() in commonLangs:
                     languagesNames.append(lang.lower())
                     # print(set(languagesNames))
     return set(languagesNames)

Пример #7

Показать файл

Файл: EduStandartsParser.py Проект: mithron/Diplom

	def GetOneStandart(link):
		HTMLData.SaveHTML(link, "cp1251", "out.html")
		return HTMLData.getStringHTMLData(link, "cp1251")

Пример #8

Показать файл

Файл: EduStandartsParser.py Проект: mithron/Diplom

	def GetHTML(cls):
		HTMLData.SaveHTML("http://www.edu.ru/db/cgi-bin/portal/spe/prog_list_new.plx?substr=&rasd=all&st=all&kod=all",
			"cp1251", "output.html")

Пример #9

Показать файл

Файл: __init__.py Проект: mithron/Diplom

import pymorphy2

from lib.JSONParser import JSONParser
from lib.HTMLData import HTMLData
from lib.EduStandartsParser import EduStandartsParser
import urllib.error

morph = pymorphy2.MorphAnalyzer()
SpecializationDict = None
try:
    SpecializationDict = JSONParser.Parse(
        HTMLData.getStringHTMLData("https://api.hh.ru/specializations",
                                   "utf-8"))
except urllib.error.URLError:
    print("Connection error, I can not work")
    exit()
#EduStandartsParser.GetHTML()
commonLangs = [
    "c", "c++", "ruby", "python", "javascript", "java", "c#", "f#", "css",
    "objective-c", "go", "shell", "perl", "php", "lisp", "haskell", "pascal",
    "assembly", "scala", "sql", "с++"
]

Пример #10

Показать файл

Файл: __init__.py Проект: BorisGuliyan/Diplom

import pymorphy2

from lib.JSONParser import JSONParser
from lib.HTMLData import HTMLData
from lib.EduStandartsParser import EduStandartsParser
import urllib.error

morph = pymorphy2.MorphAnalyzer()
SpecializationDict = None
try:
	SpecializationDict = JSONParser.Parse(HTMLData.getStringHTMLData("https://api.hh.ru/specializations", "utf-8"))
except urllib.error.URLError:
	print("Connection error, I can not work")
	exit()
#EduStandartsParser.GetHTML()
commonLangs = ["c", "c++", "ruby", "python", "javascript", "java", "c#", "f#", "css", "objective-c", "go", "shell", "perl",
	               "php", "lisp", "haskell", "pascal", "assembly", "scala", "sql", "с++"]

Пример #11

Показать файл

	def getPossibleEdulevels(self):
		edudata = JSONParser.Parse(HTMLData.getStringHTMLData("https://api.hh.ru/dictionaries", 'utf-8'))['education_level']
		result = []
		for val in edudata:
			result.append(val['name'])
		return result

Пример #12

Показать файл

	def getDictionary(link):
		return JSONParser.Parse(HTMLData.getStringHTMLData(link, "utf-8"))