Python remove_all_tags 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: prjparser.aParser

메소드/함수: remove_all_tags

hotexamples.com에서의 예제들: 6

Python remove_all_tags - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 prjparser.aParser.remove_all_tags에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: async_html_parser.py 프로젝트: aregina/news_project

 def worker(news):
     html = urlOpen.get_html(news.url)
     print(str(news.pk) + "     ", end='\n')
     if html:
         text = textParser.get_text_from_html(html)
         url_list = [url for url in aParser.get_a_from_news_text(news_url=news.url, text=text)]
         text = aParser.remove_all_tags(text)
         text = text_prerparer.text_preparer(text)
         return NewsText(news=news, text=text), url_list

예제 #2

파일 보기

파일: htmlParser.py 프로젝트: aregina/news_project

def parse_news_text(news_text: NewsText):
    print(str(news_text.pk) + "     ", end='\r')
    for url in aParser.get_a_from_news_text(news_url=news_text.news.url, text=news_text.text):
        url_in_text = UrlInText.objects.filter(url=url)[:1]
        if url_in_text.exists():
            url_in_text = url_in_text[0]
        else:
            url_in_text = UrlInText.objects.create(url=url)
        url_in_text.news.add(news_text.news)
    news_text.text = aParser.remove_all_tags(news_text.text)
    news_text.is_parsed = True
    news_text.save()

예제 #3

파일 보기

 def worker(news):
     html = urlOpen.get_html(news.url)
     print(str(news.pk) + "     ", end='\n')
     if html:
         text = textParser.get_text_from_html(html)
         url_list = [
             url for url in aParser.get_a_from_news_text(news_url=news.url,
                                                         text=text)
         ]
         text = aParser.remove_all_tags(text)
         text = text_prerparer.text_preparer(text)
         return NewsText(news=news, text=text), url_list

예제 #4

파일 보기

파일: htmlParser.py 프로젝트: aregina/news_project

def parse_news_text(news_text: NewsText):
    print(str(news_text.pk) + "     ", end='\r')
    for url in aParser.get_a_from_news_text(news_url=news_text.news.url,
                                            text=news_text.text):
        url_in_text = UrlInText.objects.filter(url=url)[:1]
        if url_in_text.exists():
            url_in_text = url_in_text[0]
        else:
            url_in_text = UrlInText.objects.create(url=url)
        url_in_text.news.add(news_text.news)
    news_text.text = aParser.remove_all_tags(news_text.text)
    news_text.is_parsed = True
    news_text.save()

예제 #5

파일 보기

파일: async_html_parser.py 프로젝트: aregina/news_project

 def writer(container):
     news_text_obj, url_list = container
     for url in url_list:
         url_in_text = UrlInText.objects.filter(url=url)[:1]
         if url_in_text.exists():
             url_in_text = url_in_text[0]
         else:
             url_in_text = UrlInText(url=url)
             url_in_text.save()
         url_in_text.news.add(news_text_obj.news)
     news_text_obj.text = aParser.remove_all_tags(news_text_obj.text)
     news_text_obj.is_parsed = True
     news_text_obj.save()
     print("news_text_id {}".format(news_text_obj.pk))

예제 #6

파일 보기

 def writer(container):
     news_text_obj, url_list = container
     for url in url_list:
         url_in_text = UrlInText.objects.filter(url=url)[:1]
         if url_in_text.exists():
             url_in_text = url_in_text[0]
         else:
             url_in_text = UrlInText(url=url)
             url_in_text.save()
         url_in_text.news.add(news_text_obj.news)
     news_text_obj.text = aParser.remove_all_tags(news_text_obj.text)
     news_text_obj.is_parsed = True
     news_text_obj.save()
     print("news_text_id {}".format(news_text_obj.pk))