Python Article.page Exemples

Langage de programmation: Python

Espace de nommage/Pack: articles.models

Class/Type: Article

Méthode/Fonction: page

Exemples au hotexamples.com: 4

Python Article.page - 4 exemples trouvés. Ce sont les exemples réels les mieux notés de articles.models.Article.page extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

Article(30)

author(8)

publication_date(6)

issue(5)

medium(5)

page(4)

content(4)

create_for_testing(4)

category(3)

get_by_slug(3)

body(3)

typeid(2)

by(2)

items_visible_to(2)

items_reviewable_by(2)

create_content_type(2)

category_id(2)

is_published(2)

get_recent(2)

summary(2)

items_live(1)

get_by_tag(1)

get_by_kind(1)

last_name(1)

status_id(1)

main_text_trevor(1)

lead_text_trevor(1)

status_detail(1)

markup(1)

first_name(1)

on(1)

overline(1)

owner(1)

text(1)

owner_username(1)

permstring(1)

phone(1)

publish_date(1)

release_dt(1)

sourct(1)

get_by_date(1)

date_published(1)

filter_valid(1)

author_id(1)

abstract(1)

add_node(1)

add_tags(1)

allow_anonymous_edit(1)

allow_anonymous_view(1)

allow_member_edit(1)

Méthodes fréquemment utilisées

Article (30)

author (8)

publication_date (6)

issue (5)

medium (5)

page (4)

content (4)

create_for_testing (4)

category (3)

get_by_slug (3)

Méthodes fréquemment utilisées

body (3)

typeid (2)

by (2)

items_visible_to (2)

items_reviewable_by (2)

create_content_type (2)

category_id (2)

is_published (2)

get_recent (2)

summary (2)

items_live (1)

get_by_tag (1)

get_by_kind (1)

last_name (1)

status_id (1)

main_text_trevor (1)

lead_text_trevor (1)

status_detail (1)

markup (1)

first_name (1)

Méthodes fréquemment utilisées

items_live (1)

get_by_tag (1)

get_by_kind (1)

last_name (1)

status_id (1)

main_text_trevor (1)

lead_text_trevor (1)

status_detail (1)

markup (1)

first_name (1)

on (1)

overline (1)

owner (1)

text (1)

owner_username (1)

permstring (1)

phone (1)

publish_date (1)

release_dt (1)

sourct (1)

get_by_date (1)

date_published (1)

filter_valid (1)

author_id (1)

abstract (1)

add_node (1)

add_tags (1)

allow_anonymous_edit (1)

allow_anonymous_view (1)

allow_member_edit (1)

Méthodes fréquemment utilisées

on (1)

overline (1)

owner (1)

text (1)

owner_username (1)

permstring (1)

phone (1)

publish_date (1)

release_dt (1)

sourct (1)

get_by_date (1)

date_published (1)

filter_valid (1)

author_id (1)

abstract (1)

add_node (1)

add_tags (1)

allow_anonymous_edit (1)

allow_anonymous_view (1)

allow_member_edit (1)

allow_member_view (1)

allow_user_edit (1)

allow_user_view (1)

art_len (1)

article_org (1)

article_title (1)

auteur (1)

authorByLine (1)

author_name (1)

fax (1)

body_by (1)

brief (1)

categorie (1)

classname (1)

click_number (1)

comment_number (1)

contenu (1)

count_links (1)

create_articles (1)

creator (1)

Exemple #1

0

Afficher le fichier

Fichier : spiders.py Projet : Rossonero/xinzhuan

def _get_zgqnb_article(self, url, date, page_name): print url medium = Medium.objects.get(pk=1836) urls = bs4.BeautifulSoup(requests.get(url).content).find('div', {'id' : 'titleList'}).find_all('a') for a in urls: article_url = urljoin(url, a.get('href')) soup = bs4.BeautifulSoup(requests.get(article_url).content) title = soup.find('h1').text print title article = Article() article.medium = medium article.title = title article.url = article_url article.publication_date = date article.page = page_name p_list = [] for p in soup.find('div', {'id' : 'ozoom'}).find_all('p'): p_list.append(p.text) content = '\n'.join(p_list) article.content = content if Article.objects.filter(medium=medium).filter(url=article_url).count(): article = Article.objects.filter(medium=medium).get(url=article_url) article.content = content article.save()

Exemple #2

0

Afficher le fichier

Fichier : spiders.py Projet : Rossonero/xinzhuan

def _get_rmrb_article(self, content): medium = Medium.objects.get(pk=1081) article = Article() article.medium = medium article.title = content.find('h1').text.strip() for author_name in content.find_all('div', {'class' : 'summary'})[0].find_all('a'): try: author = Journalist.objects.get(medium=medium, name=author_name.text.strip()) except: pass else: article.author = author break for li in content.find_all('div', {'class' : 'summary'})[-1].find_all('li'): if li.text.find(u'报纸日期') != -1: p = re.compile('(\d+)-(\d+)-(\d+)') publication_date = p.search(li.text).group() if li.text.find(u'版名') != -1: page = li.text.replace('\n','').replace(u'【版名】', '').replace(' ', '') else: page = '头版' article.issue = self._get_issue_from_date(publication_date, 'rmrb') article.page = page article.publication_date = datetime.datetime.strptime(publication_date, '%Y-%m-%d') article, created = Article.objects.get_or_create(medium=article.medium, title=article.title, issue=article.issue, publication_date=article.publication_date) print article.title return article

Exemple #3

0

Afficher le fichier

Fichier : spiders.py Projet : Rossonero/xinzhuan

def _get_whb_article(self, url, date,issue, page): medium = Medium.objects.get(pk=1399) soup = bs4.BeautifulSoup(requests.get(url).content) for title in soup.find('div', {'id' : 'BT'}).find_all('a'): article_page_url = urljoin(url, title.get('href')) r = requests.get(article_page_url) if r.status_code == 404: continue article_page = bs4.BeautifulSoup( r.content) if Article.objects.filter(medium=medium).filter(url=article_page_url).count(): article = Article.objects.filter(medium=medium).get(url=article_page_url) else: article = Article() article.medium = medium article.url = article_page_url article.publication_date = date article.page = page.text.strip() article.issue = issue print article_page_url title = article_page.title.text.strip().replace(u'文汇报 - ', '') article.title = title article.content = article_page.find('div', {'id' : 'articleText'}).text.strip().replace(u'　　', '\n ') article.save()

Exemple #4

0

Afficher le fichier

Fichier : spiders.py Projet : Rossonero/xinzhuan

def _get_qlwb_article(self, url, date, issue, page): print page medium = Medium.objects.get(pk=1025) soup = bs4.BeautifulSoup(requests.get(url).content) if Article.objects.filter(medium=medium).filter(url=url).count(): article = Article.objects.filter(medium=medium).get(url=url) else: article = Article() article.medium = medium article.title = soup.find('td', {'class' : 'font01'}).text.strip().replace(u'　　', '\n ') article.url = url article.publication_date = date article.page = page article.issue = issue article.content = soup.find('span', {'id' : 'contenttext'}).text.strip().replace(u'　　', '\n ') article.save()