Python LrmiBase 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: converter.spiders.lrmi_base

클래스/타입: LrmiBase

hotexamples.com에서의 예제들: 19

Python LrmiBase - 19개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 converter.spiders.lrmi_base.LrmiBase에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

__init__(3)

getBase(2)

자주 사용되는 메소드들

__init__ (3)

getBase (2)

예제 #1

파일 보기

 def getValuespaces(self, response):
     valuespaces = LrmiBase.getValuespaces(self, response)
     try:
         range = response.xpath(
             '//ul[@class="sidebar__information"]/li[@class="sidebar__information-item"]/*[contains(@class,"icon-level")]/parent::*//text()'
         ).get().replace('Stufe', '').strip().split(' - ')
         if len(range):
             valuespaces.add_value(
                 'educationalContext',
                 ValuespaceHelper.educationalContextByGrade(range))
     except:
         pass
     try:
         discipline = response.xpath(
             '//ul[@class="sidebar__information"]/li[@class="sidebar__information-item"]/*[contains(@class,"icon-subject")]/parent::*//text()'
         ).getall()
         valuespaces.add_value('discipline', discipline)
     except:
         pass
     lrt = response.meta['item'].get('type')
     valuespaces.add_value('learningResourceType', lrt)
     try:
         toolType = list(
             map(
                 lambda x: x.strip(),
                 response.xpath(
                     '//ul[@class="sidebar__information"]/li[@class="sidebar__information-item"]/*[contains(@class,"icon-settings")]/parent::*//text()'
                 ).getall()))
         # @TODO: proper mapping, maybe specialised tool field?
         valuespaces.add_value('learningResourceType', toolType)
     except:
         pass
     return valuespaces

예제 #2

파일 보기

 def getValuespaces(self, response):
     valuespaces = LrmiBase.getValuespaces(self, response)
     disciplines = ["politik", "geschichte"]
     for discipline in disciplines:
         if "/" + discipline in response.url:
             valuespaces.add_value("discipline", discipline)
     return valuespaces

예제 #3

파일 보기

 def getLOMGeneral(self, response):
     general = LrmiBase.getLOMGeneral(self, response)
     general.replace_value(
         'title',
         HTMLParser().unescape(response.meta['item'].get('name').strip()))
     #general.add_value('keyword', list(filter(lambda x: x,map(lambda x: x.strip(), response.xpath('//*[@id="ContentModuleApp"]//*[@class="topic-name"]//text()').getall()))))
     return general

예제 #4

파일 보기

 def getBase(self, response):
     base = LrmiBase.getBase(self, response)
     #base.replace_value('thumbnail', self.url + '/media/' + response.meta['item'].get('image'))
     base.replace_value(
         'thumbnail', self.url +
         response.xpath('//img[@class="content-info__image"]/@src').get())
     base.replace_value('type', self.getType(response))
     return base

예제 #5

파일 보기

 def getLOMTechnical(self, response):
     technical = LrmiBase.getLOMTechnical(self, response)
     technical.replace_value("format", "text/html")
     # technical.add_value("size", self.getLRMI(
     #     "ContentSize", response=response))
     url = self.getLRMI("mainEntityOfPage", response=response)
     if not url:
         url = response.url
     technical.replace_value("location", url)
     return technical

예제 #6

파일 보기

 def getLicense(self, response):
     license = LrmiBase.getLicense(self, response)
     license_value: str = response.xpath(
         "//div[@class='cc-license']/a/@href").get()
     if license_value:
         # remove language link from license
         if license_value.endswith("deed.de"):
             license_value = license_value[:-len("deed.de")]
         elif license_value.endswith("de/"):
             license_value = license_value[:-len("de/")]
         license.replace_value("url", license_value)
     return license

예제 #7

파일 보기

    def getLOMGeneral(self, response):
        general = LrmiBase.getLOMGeneral(self, response)
        general.replace_value(
            "identifier", self.getLRMI("mainEntityOfPage", response=response))

        # Keywords
        keywords: List[str] = [
            keyword.strip() for keyword in self.getLRMI(
                "keywords", response=response).split(",")
        ]
        general.replace_value("keyword", keywords)

        # Language TODO fill in value by hand or leave empty?
        general.add_value("language",
                          self.getLRMI("inLanguage", response=response))

        # Description
        general.add_value("description",
                          self.getLRMI("description", response=response))
        return general

예제 #8

파일 보기

    def getLOMLifecycle(self, response):
        name = self.getLRMI("author", response=response)
        lifecycle = LrmiBase.getLOMLifecycle(self, response)

        if name == "Bundeszentrale für politische Bildung":
            lifecycle.add_value("role", "author")
            # if author organization
            lifecycle.add_value("organization", name)

        elif name == "Redaktion":
            lifecycle.add_value("role", "author")
            # if author organization
            lifecycle.add_value("organization", name)

        elif "Redaktion werkstatt.bpb.de" in name:
            lifecycle.add_value("role", "author")
            # if author organization
            lifecycle.add_value("organization", name)

        elif ", " not in name:
            # maybe one author
            lifecycle.add_value("role", "author")
            author = name.split(" ")
            lifecycle.add_value("firstName", " ".join(author[:-1]).strip())
            lifecycle.add_value("lastName", author[-1].strip())

        elif ", " in name:
            for author_name in name.split(","):
                lifecycle.add_value("role", "author")
                author = author_name.split(" ")
                lifecycle.add_value("firstName", " ".join(author[:-1]).strip())
                lifecycle.add_value("lastName", author[-1].strip())

        elif "und" in name:
            for author_name in name.split("und"):
                lifecycle.add_value("role", "author")
                author = author_name.split(" ")
                lifecycle.add_value("firstName", " ".join(author[:-1]).strip())
                lifecycle.add_value("lastName", author[-1].strip())

        return lifecycle

예제 #9

파일 보기

 def __init__(self, **kwargs):
     LrmiBase.__init__(self, **kwargs)

예제 #10

파일 보기

 def getLicense(self, response):
     license = LrmiBase.getLicense(self, response)
     return license

예제 #11

파일 보기

 def getLOMTechnical(self, response):
     technical = LrmiBase.getLOMTechnical(self, response)
     technical.replace_value('format', 'text/html')
     technical.replace_value('location', response.url)
     return technical

예제 #12

파일 보기

 def getLOMEducational(self, response):
     educational = LrmiBase.getLOMEducational(self, response)
     educational.add_value(
         'description',
         HTMLParser().unescape(response.meta['item'].get('teaser')))
     return educational

예제 #13

파일 보기

 def getBase(self, response):
     base = LrmiBase.getBase(self, response)
     base.replace_value("thumbnail", None)
     return base

예제 #14

파일 보기

 def __init__(self, **kwargs):
     LrmiBase.__init__(self, **kwargs)
     CrawlSpider.__init__(self, **kwargs)

예제 #15

파일 보기

 def mapResponse(self, response):
     return LrmiBase.mapResponse(self, response)

예제 #16

파일 보기

 def handleEntry(self, response):
     return LrmiBase.parse(self, response)

예제 #17

파일 보기

 def __init__(self, **kwargs):
     SitemapSpider.__init__(self)
     LrmiBase.__init__(self, **kwargs)

예제 #18

파일 보기

 def parse(self, response):
     return LrmiBase.parse(self, response)

예제 #19

파일 보기

파일: digitallearninglab_spider.py 프로젝트: torsten-simon/oeh-search-etl

 def getLOMTechnical(self, response):
     technical = LrmiBase.getLOMTechnical(self, response)
     technical.replace_value("format", "text/html")
     technical.replace_value("location", response.url)
     return technical