Python Post.site_name 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: content_extraction.elements

클래스/타입: Post

메소드/함수: site_name

hotexamples.com에서의 예제들: 2

Python Post.site_name - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 content_extraction.elements.Post.site_name에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

forum_id(2)

forum_name(2)

forum_url(2)

site_name(2)

topic_id(2)

topic_name(2)

date(1)

link(1)

quote(1)

text(1)

user_id(1)

user_name(1)

user_url(1)

예제 #1

파일 보기

파일: shavemyface.py 프로젝트: ChinHui-Chen/newssip

 def new_post():    
     post = Post()
     post.site_name = 'shavemyface'
     post.forum_url = forum_url
     post.forum_id = forum_id
     post.forum_name = forum_name
     post.topic_name = topic_name
     post.topic_id = topic_id
     return post

예제 #2

파일 보기

파일: menessentials.py 프로젝트: ChinHui-Chen/newssip

    def extract_posts(self, soup, filename):
        """Extract posts"""

        forum = soup.find('td', 'navbar-links').find('a', {'href': re.compile('^viewforum.php\?.*')})
        forum_url = forum['href']
        forum_id = re.search('(\d+)', forum_url).group(1)
        forum_name = self.get_text(forum)
        
        topic = soup.find('td', 'content content-navbar').table.find('span', 'gen').a
        topic_name = topic.b.string
        topic_url = topic['href']
        topic_id = re.search('viewtopic.php.*\Wt=(\d+)', topic_url).group(1)
        
        posts = []
        messages = soup.findAll('div', 'postbody')
        for msg in messages:
            post = Post()
            posts.append(post)        
            
            post.site_name = 'menessentials'
            post.forum_url = forum_url
            post.forum_id = forum_id
            post.forum_name = forum_name
            post.topic_name = topic_name
            post.topic_id = topic_id
            
            date = msg.parent.find('span', 'postdate')
            post.date = datetime.strptime(self.get_text(date), "Posted: %a %b %d, %Y %I:%M %p")
            
            user = msg.parent.parent.find('span', 'name').a
            if user:
                post.user_name = user.string
                post.user_url = user["href"]
                post.user_id = re.search('u=(\d+)', post.user_url).group(1)
            
            post.quote = []
            for quote in reversed(msg.findAll('table', 'quote')):  # Reverse, to handle nested quotes
                quote.extract()
                q = Quote()
                q.text = self.get_text(quote.find('td', 'quote'))
                quote_user = self.get_text(quote.find('td', 'quote_user'))
                q.user_name = re.sub('\s*wrote:$', '', quote_user)
                post.quote.append(q)
            
            # Now, after quotes are removed, we can extract the text of the post         
            post.text = self.get_text(msg)
            
            # Extract links
            post.link = []
            for link in msg.findAll('a', href=True):
                    post.link.append(link['href'])
                
            

        print >>sys.stderr, '    ', len(posts), 'posts'
        return posts