Python get_a_from_news_text示例

编程语言: Python

命名空间/包名称: prjparser.aParser

方法/功能: get_a_from_news_text

hotexamples.com的示例: 6

Python get_a_from_news_text - 已找到6个示例。这些是从开源项目中提取的最受好评的prjparser.aParser.get_a_from_news_text现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

文件： async_html_parser.py 项目： aregina/news_project

 def worker(news):
     html = urlOpen.get_html(news.url)
     print(str(news.pk) + "     ", end='\n')
     if html:
         text = textParser.get_text_from_html(html)
         url_list = [url for url in aParser.get_a_from_news_text(news_url=news.url, text=text)]
         text = aParser.remove_all_tags(text)
         text = text_prerparer.text_preparer(text)
         return NewsText(news=news, text=text), url_list

示例#2

显示文件

文件： htmlParser.py 项目： aregina/news_project

def parse_news_text(news_text: NewsText):
    print(str(news_text.pk) + "     ", end='\r')
    for url in aParser.get_a_from_news_text(news_url=news_text.news.url, text=news_text.text):
        url_in_text = UrlInText.objects.filter(url=url)[:1]
        if url_in_text.exists():
            url_in_text = url_in_text[0]
        else:
            url_in_text = UrlInText.objects.create(url=url)
        url_in_text.news.add(news_text.news)
    news_text.text = aParser.remove_all_tags(news_text.text)
    news_text.is_parsed = True
    news_text.save()

示例#3

显示文件

 def worker(news):
     html = urlOpen.get_html(news.url)
     print(str(news.pk) + "     ", end='\n')
     if html:
         text = textParser.get_text_from_html(html)
         url_list = [
             url for url in aParser.get_a_from_news_text(news_url=news.url,
                                                         text=text)
         ]
         text = aParser.remove_all_tags(text)
         text = text_prerparer.text_preparer(text)
         return NewsText(news=news, text=text), url_list

示例#4

显示文件

文件： htmlParser.py 项目： aregina/news_project

def parse_news_text(news_text: NewsText):
    print(str(news_text.pk) + "     ", end='\r')
    for url in aParser.get_a_from_news_text(news_url=news_text.news.url,
                                            text=news_text.text):
        url_in_text = UrlInText.objects.filter(url=url)[:1]
        if url_in_text.exists():
            url_in_text = url_in_text[0]
        else:
            url_in_text = UrlInText.objects.create(url=url)
        url_in_text.news.add(news_text.news)
    news_text.text = aParser.remove_all_tags(news_text.text)
    news_text.is_parsed = True
    news_text.save()

示例#5

显示文件

文件： async_html_parser.py 项目： aregina/news_project

 def worker(news_text: NewsText):
     url_list = [url for url in aParser.get_a_from_news_text(news_url=news_text.news.url, text=news_text.text)]
     return news_text, url_list

示例#6

显示文件

 def worker(news_text: NewsText):
     url_list = [
         url for url in aParser.get_a_from_news_text(
             news_url=news_text.news.url, text=news_text.text)
     ]
     return news_text, url_list