Python FacebookMongoConnectorの例、egovbench_mongo.FacebookMongoConnector Pythonの例

コード例 #1

0

ファイルを表示

ファイル: egovbench_facebookcrawler.py プロジェクト: oditouchiha/egovbench

    def __init__(self, credFile='egovbench_credentials.ini', confFile='egovbench_config.ini'):

        credparser = SafeConfigParser()
        credparser.read(credFile)
        self.access_token = credparser.get('FacebookCredentials', 'access_token')

        confparser2 = SafeConfigParser()
        confparser2.read(confFile)
        self.crawllimit = int(confparser2.get('CrawlerConfig', 'crawllimit'))

        logger = logging.getLogger()
        logger.setLevel(logging.DEBUG)

        if not logger.handlers:

            formatter = logging.Formatter('%(asctime)s - %(levelname)s - %(message)s')

            fh = RotatingFileHandler('logs/facebook/egovbench_facebook.log', maxBytes=20971520, backupCount=5)
            fh.setLevel(logging.DEBUG)
            fh.setFormatter(formatter)
            logger.addHandler(fh)

            ch = logging.StreamHandler()
            ch.setLevel(logging.INFO)
            ch.setFormatter(formatter)
            logger.addHandler(ch)

        self.p = Pusher()
        self.fc = FacebookCollector()
        self.fmc = FacebookMongoConnector()

コード例 #2

0

ファイルを表示

ファイル: egovbench_facebooktrigger.py プロジェクト: oditouchiha/egovbench

    def __init__(self):

        logger = logging.getLogger()
        logger.setLevel(logging.DEBUG)

        if not logger.handlers:

            formatter = logging.Formatter(
                '%(asctime)s - %(levelname)s - %(message)s')

            logpath = '/home/addi/egovbench/logs/facebook/egovbench_facebooktrigger.log'

            try:
                fh = RotatingFileHandler(logpath,
                                         maxBytes=20971520,
                                         backupCount=5)
                fh.setLevel(logging.DEBUG)
                fh.setFormatter(formatter)
                logger.addHandler(fh)

                ch = logging.StreamHandler()
                ch.setLevel(logging.INFO)
                ch.setFormatter(formatter)
                logger.addHandler(ch)

            except FileNotFoundError:
                self.createdirectory(logpath)

        self.fmc = FacebookMongoConnector()

コード例 #3

0

ファイルを表示

ファイル: egovbench_scorer.py プロジェクト: oditouchiha/egovbench

    def getPostTypeScoreDocument(self):

        update_document = {}

        post_types = self.fmc.getPostTypeDistinct('post_type')

        for post_type in post_types:

            posttypeattribute = {'post_type': post_type}

            super(FacebookScorer, self).__init__(
                posttypeattribute,
                FacebookMongoConnector(),
                'post_reactions.like',
                'post_commentCount',
                'post_shareCount',
                'page_id',
                'post_type'
            )

            self.prompt('{} Creating score document . . .'.format(json.dumps(self.filter_dict)))

            update_document['_id'] = posttypeattribute['post_type']

            update_document['result.scores'] = {}
            update_document['result.scores']['engagement_index_score'] = self.getEngagementIndexScore()

            self.prompt('{} Score document created!'.format(json.dumps(self.filter_dict)))

            self.mongo_connector_class.updatePostTypeResult(update_document)

コード例 #4

0

ファイルを表示

ファイル: egovbench_scorer.py プロジェクト: oditouchiha/egovbench

    def getAccountPostTypeScoreDocument(self):

        update_document = {}

        post_types = self.fmc.getPostTypeDistinct('post_type')

        for post_type in post_types:

            self.filter_dict.pop('post_type', None)
            posttypeattribute = {'post_type': post_type}
            posttypeattribute.update(self.filter_dict)

            super(FacebookScorer, self).__init__(
                posttypeattribute,
                FacebookMongoConnector(),
                'post_reactions.like',
                'post_commentCount',
                'post_shareCount',
                'page_id',
                'post_type'
            )

            self.prompt('{} Creating score document . . .'.format(json.dumps(self.filter_dict)))

            update_document['page_id'] = self.filter_dict['page_id'].lower()

            update_document['post_type_result.%s.scores' % (post_type)] = {}
            update_document['post_type_result.%s.scores' % (post_type)]['engagement_index_score'] = self.getEngagementIndexScore()

            self.prompt('{} Score document created!'.format(json.dumps(self.filter_dict)))

        return update_document

コード例 #5

0

ファイルを表示

ファイル: egovbench_scorer.py プロジェクト: oditouchiha/egovbench

    def __init__(self, filterDict, confFile='/home/addi/egovbench/apps/pythons/egovbench_config.ini'):
        super(FacebookScorer, self).__init__(
            filterDict,
            FacebookMongoConnector(),
            'post_reactions.like',
            'post_commentCount',
            'post_shareCount',
            'page_id',
            'post_type'
        )

        self.filter_dict = filterDict
        self.fmc = FacebookMongoConnector()

        # Mengambil skor sentimen reaction dari file egovbench_config.ini
        self.confparser = SafeConfigParser()
        self.confparser.read(confFile)

コード例 #6

0

ファイルを表示

ファイル: egovbench_facebookcrawler.py プロジェクト: oditouchiha/egovbench

class Pusher(FacebookCrawler):

    def __init__(self):
        self.fp = FacebookParser()
        self.fmc = FacebookMongoConnector()
        self.fkp = FacebookKafkaPost()
        self.fkc = FacebookKafkaComment()

    def pushPostDocument(self, complete_dict):

        post_document = self.fp.getPostDocument(complete_dict)
        self.fmc.updatePost(post_document)
        self.fkp.send_message(post_document)

    def pushCommentDocument(self, complete_dict):

        comment_document = self.fp.getCommentDocument(complete_dict)

        for comment in comment_document:
            self.fmc.updateComment(comment)
            self.fkc.send_message(comment)

    def pushAccountDocument(self, complete_dict):

        for i in range(10, 0, -1):
            time.sleep(1)
            self.prompt('Updating account in {}'.format(i))

        account_document = self.fp.getAccountDocument(complete_dict)
        self.fmc.updateAccount(account_document)

コード例 #7

0

ファイルを表示

ファイル: egovbench_facebookcrawler.py プロジェクト: oditouchiha/egovbench

class Pusher(FacebookCrawler):

    def __init__(self):
        self.fp = FacebookParser()
        self.fmc = FacebookMongoConnector()
        # self.fkp = FacebookKafkaPost()
        # self.fkc = FacebookKafkaComment()

    def pushPostDocument(self, complete_dict):

        '''
            Fungsi ini memanggil fungsi getPostDocument() dari kelas TwitterParser() untuk mengubah data
            crawling ke dalam struktur post document, dan memasukannya ke dalam post collection di MongoDB
            dengan menggunakan fungsi updatePost() milik TwitterMongoConnector()
        '''
        post_document = self.fp.getPostDocument(complete_dict)
        self.fmc.updatePost(post_document)

        # for i in range(2, 0, -1):
        #     time.sleep(1)
        #     self.prompt('Sending message to stream in {}'.format(i))

        # self.fkp.send_message(post_document)

    def pushCommentDocument(self, complete_dict):

        comment_document = self.fp.getCommentDocument(complete_dict)
        self.fmc.updateComment(comment_document)

            # for i in range(2, 0, -1):
            #     time.sleep(1)
            #     self.prompt('Sending message to stream in {}'.format(i))

            # self.fkc.send_message(comment)

    def pushAccountDocument(self, complete_dict):

        '''
            Fungsi ini memanggil fungsi getAccountDocument() dari kelas TwitterParser() untuk mengubah data
            crawling ke dalam struktur account document, dan memasukannya ke dalam account collection di MongoDB
            dengan menggunakan fungsi updateAccount() milik TwitterMongoConnector()
        '''

        for i in range(20, 0, -1):
            time.sleep(1)
            self.prompt('Updating account in {}'.format(i))

        account_document = self.fp.getAccountDocument(complete_dict)
        self.fmc.updateAccount(account_document)

コード例 #8

0

ファイルを表示

ファイル: egovbench_facebookcrawler.py プロジェクト: oditouchiha/egovbench

 def __init__(self):
     self.fp = FacebookParser()
     self.fmc = FacebookMongoConnector()

コード例 #9

0

ファイルを表示

ファイル: egovbench_facebookcrawler.py プロジェクト: oditouchiha/egovbench

class FacebookCrawler():

    def __init__(self, credFile='egovbench_credentials.ini', confFile='egovbench_config.ini'):

        credparser = SafeConfigParser()
        credparser.read(credFile)
        self.access_token = credparser.get('FacebookCredentials', 'access_token')

        confparser2 = SafeConfigParser()
        confparser2.read(confFile)
        self.crawllimit = int(confparser2.get('CrawlerConfig', 'crawllimit'))

        logger = logging.getLogger()
        logger.setLevel(logging.DEBUG)

        if not logger.handlers:

            formatter = logging.Formatter('%(asctime)s - %(levelname)s - %(message)s')

            fh = RotatingFileHandler('logs/facebook/egovbench_facebook.log', maxBytes=20971520, backupCount=5)
            fh.setLevel(logging.DEBUG)
            fh.setFormatter(formatter)
            logger.addHandler(fh)

            ch = logging.StreamHandler()
            ch.setLevel(logging.INFO)
            ch.setFormatter(formatter)
            logger.addHandler(ch)

        self.p = Pusher()
        self.fc = FacebookCollector()
        self.fmc = FacebookMongoConnector()

    def prompt(self, texts):
        return logging.info('[EGOVBENCH_FACEBOOKCRAWLER]>' + ' ' + texts)

    def launch(self):
        self.prompt('Launching . . .')

        accounts = self.fmc.collectAccounts()

        for account in accounts[98:]:

            pemda_id = account['_id']
            pemda_name = account['name']

            resmi_page_id = account['facebook_resmi']
            if resmi_page_id is not '':
                try:
                    self.crawlPost(pemda_id, pemda_name, 'resmi', resmi_page_id)
                except NoAccountException as e:
                    logging.critical(e)
                    pass

            # influencer_page_id = account['facebook_influencer']
            # if influencer_page_id is not '':
            #     try:
            #         self.crawlPost(pemda_id, pemda_name, 'influencer', influencer_page_id)
            #     except NoAccountException as e:
            #         logging.critical(e)
            #         pass

    def crawlPost(self, pemdaID, pemdaName, pageType, pageID):
        self.prompt('(pemda_id: {}, pemda_name: {}, page_type: {}, page_id: {}) Crawl Started!'.format(
            pemdaID,
            pemdaName,
            pageType,
            pageID
        ))

        channel_exist = self.fmc.checkAccount(pageID.lower())

        if channel_exist:
            crawllimit = self.crawllimit
        else:
            crawllimit = None

        complete_dict = {}

        complete_dict['account'] = {}
        complete_dict['account']['page_id'] = pageID.lower()
        complete_dict['account']['page_type'] = pageType

        base = "https://graph.facebook.com/v3.0"
        node = "/{}".format(pageID)
        parameters = "?access_token={}&fields=id,name,fan_count,posts.limit({})".format(self.access_token, self.crawllimit)
        since_date = "2016-01-01"
        until_date = ""

        since = ".since({})".format(since_date) if since_date \
            is not '' else ''
        until = ".until({})".format(until_date) if until_date \
            is not '' else ''

        after = ''

        fields = "{message,link,created_time,type,name,id,comments.limit(0).summary(true),shares," + \
                 "reactions.type(LIKE).summary(total_count).limit(0).as(like)," +\
                 "reactions.type(LOVE).summary(total_count).limit(0).as(love)," +\
                 "reactions.type(WOW).summary(total_count).limit(0).as(wow)," +\
                 "reactions.type(HAHA).summary(total_count).limit(0).as(haha)," +\
                 "reactions.type(SAD).summary(total_count).limit(0).as(sad)," +\
                 "reactions.type(ANGRY).summary(total_count).limit(0).as(angry)}"

        posts_crawled = 0

        searchnextpage = True
        while searchnextpage:

            url = base + node + parameters + since + until + after + fields
            j_input = json.loads(self.requestUntilSucceed(url).decode())

            complete_dict['account']['page_id_number'] = j_input['id']
            complete_dict['account']['page_name'] = j_input['name']
            complete_dict['account']['page_fanCount'] = j_input['fan_count']

            if 'posts' in j_input:

                for post in j_input['posts']['data']:

                    complete_dict['post'] = {}
                    complete_dict['post']['post_id'] = post['id']
                    complete_dict['post']['post_type'] = post['type']
                    complete_dict['post']['post_message'] = '' if 'message' not in post else eu.cleanStrings(post['message'])
                    complete_dict['post']['post_createdtime'] = eu.formatFacebookTime(post['created_time'])

                    complete_dict['post']['post_commentCount'] = 0 if 'comments' not in post else post['comments']['summary']['total_count']
                    complete_dict['post']['post_shareCount'] = 0 if 'shares' not in post else post['shares']['count']

                    complete_dict['post']['post_reaction'] = {}
                    complete_dict['post']['post_reaction']['like'] = post['like']['summary']['total_count']
                    complete_dict['post']['post_reaction']['love'] = post['love']['summary']['total_count']
                    complete_dict['post']['post_reaction']['wow'] = post['wow']['summary']['total_count']
                    complete_dict['post']['post_reaction']['haha'] = post['haha']['summary']['total_count']
                    complete_dict['post']['post_reaction']['sad'] = post['sad']['summary']['total_count']
                    complete_dict['post']['post_reaction']['angry'] = post['angry']['summary']['total_count']

                    self.p.pushPostDocument(complete_dict)

                    # returned_comments = []
                    # returned_comments = self.collectPostComments(post['id'])

                    # complete_dict['comment'] = returned_comments

                    # self.p.pushCommentDocument(complete_dict)

                    posts_crawled += 1

                    self.prompt('(page_id: {}) {} Post crawled!'.format(
                            pageID,
                            posts_crawled
                    ))

                    if posts_crawled == crawllimit:
                        searchnextpage = False
                        break

                after = ".after({})".format(j_input['posts']['paging']['cursors']['after'])

            else:
                searchnextpage = False

            self.prompt("(page_id: {}) All Post crawled! total: {}".format(pageID, posts_crawled))

        self.p.pushAccountDocument(complete_dict)

        self.prompt('(pemda_id: {}, pemda_name: {}, page_type: {}, page_id: {}) Finished crawling!'.format(
            pemdaID,
            pemdaName,
            pageType,
            pageID
        ))

    def collectPostComments(self, postID):
        self.prompt("(post_id: {}) Collecting post's comments . . .".format(postID))

        comment_list_returned = []

        comments_collected = 0

        base = "https://graph.facebook.com/v3.0"
        node = "/{}".format(postID)
        parameters = "?access_token={}&fields=comments".format(self.access_token)
        nextcommentpage = ''

        url = base + node + parameters + nextcommentpage

        searchnextpage = True
        while searchnextpage:

            data = json.loads(self.requestUntilSucceed(url).decode())

            if 'comments' in data:

                for comment in data['comments']['data']:

                    comment_dict = {}
                    comment_dict['comment_id'] = comment['id']
                    comment_dict['comment_message'] = eu.cleanStrings(comment['message'])
                    comment_dict['comment_createdDate'] = eu.formatFacebookTime(comment['created_time'])

                    comment_list_returned.append(comment_dict)

                    comments_collected += 1

                    if comments_collected % 10 == 0:
                        self.prompt("(post_id: {}) {} Comments collected!".format(postID, comments_collected))

                if 'next' in data['comments']['paging']:
                    url = data['comments']['paging']['next']
                else:
                    searchnextpage = False

            else:
                searchnextpage = False

        self.prompt("(post_id: {}) All Post's comments collected! total: {}".format(postID, comments_collected))

        return comment_list_returned

    def requestUntilSucceed(self, url):

        for i in range(5, 0, -1):
            time.sleep(1)
            self.prompt('Sleeping to avoid rate limit. Continuing in {}'.format(i))

        req = Request(url)
        success = False
        while success is False:
            try:
                response = urlopen(req)
                if response.getcode() == 200:
                    success = True

            except HTTPError as err:
                if err.code == 404:
                    raise NoAccountException

            except requests.exceptions.SSLError as e:
                logging.error('ERROR: ' + e)

            except Exception as e:
                logging.error(e)
                time.sleep(1)

                logging.error("Error for URL {}: {}".format(url, datetime.datetime.now()))
                logging.error("Retrying...")

        return response.read()

コード例 #10

0

ファイルを表示

ファイル: egovbench_facebookcrawler.py プロジェクト: oditouchiha/egovbench

 def __init__(self):
     self.fp = FacebookParser()
     self.fmc = FacebookMongoConnector()
     self.fkp = FacebookKafkaPost()
     self.fkc = FacebookKafkaComment()

コード例 #11

0

ファイルを表示

ファイル: egovbench_scorer.py プロジェクト: oditouchiha/egovbench

class FacebookScorer(EIScorer):

    def __init__(self, filterDict, confFile='/home/addi/egovbench/apps/pythons/egovbench_config.ini'):
        super(FacebookScorer, self).__init__(
            filterDict,
            FacebookMongoConnector(),
            'post_reactions.like',
            'post_commentCount',
            'post_shareCount',
            'page_id',
            'post_type'
        )

        self.filter_dict = filterDict
        self.fmc = FacebookMongoConnector()

        # Mengambil skor sentimen reaction dari file egovbench_config.ini
        self.confparser = SafeConfigParser()
        self.confparser.read(confFile)

    def getReactionScore(self, reaction):

        self.prompt('{} Calculating {} reaction score . . .'.format(json.dumps(self.filter_dict), reaction))

        ''' Template scoring untuk menghitung Reaction Score '''

        reactionCount = self.getFieldSum('post_reactions.{}'.format(reaction))

        total_reactionCount = self.getFieldSum('post_reactions.like') \
                            + self.getFieldSum('post_reactions.angry') \
                            + self.getFieldSum('post_reactions.wow') \
                            + self.getFieldSum('post_reactions.sad') \
                            + self.getFieldSum('post_reactions.haha') \
                            + self.getFieldSum('post_reactions.love')

        sentiment_score = self.confparser.get('SentimentScoreConfig', reaction)

        try:
            reaction_score = float(sentiment_score) * (reactionCount / total_reactionCount)
        except ZeroDivisionError as er:
            logging.warning(er)
            reaction_score = None

        self.prompt('{} {} reaction score: {}'.format(json.dumps(self.filter_dict), reaction, reaction_score))

        return reaction_score

    def getLikeScore(self):
        ''' Menghitung skor reaction 'like' '''
        return self.getReactionScore('like')

    def getAngryScore(self):
        ''' Menghitung skor reaction 'angry' '''
        return self.getReactionScore('angry')

    def getWowScore(self):
        ''' Menghitung skor reaction 'wow' '''
        return self.getReactionScore('wow')

    def getSadScore(self):
        ''' Menghitung skor reaction 'sad' '''
        return self.getReactionScore('sad')

    def getHahaScore(self):
        ''' Menghitung skor reaction 'haha' '''
        return self.getReactionScore('haha')

    def getLoveScore(self):
        ''' Menghitung skor reaction 'love' '''
        return self.getReactionScore('love')

    def getTotalReactionScore(self):

        ''' Menghitung total reaction score '''

        self.prompt('{} Calculating Reaction Score . . .'.format(json.dumps(self.filter_dict)))

        try:
            total_reaction_score = self.getLikeScore() \
                                 + self.getAngryScore() \
                                 + self.getWowScore() \
                                 + self.getSadScore() \
                                 + self.getHahaScore() \
                                 + self.getLoveScore()

        except (ValueError, KeyError, TypeError) as er:
            logging.warning(er)
            total_reaction_score = None

        self.prompt('{} Reaction Score: '.format(json.dumps(self.filter_dict)) + str(total_reaction_score))

        return total_reaction_score

    def getAccountStatisticDocument(self):

        self.prompt('{} Creating score document . . .'.format(json.dumps(self.filter_dict)))

        update_document = {}

        update_document['page_id'] = self.filter_dict['page_id'].lower()
        update_document['page_fanCount'] = self.getFollowerCount()

        update_document['result.statistics'] = {}
        update_document['result.statistics']['postCount'] = self.getPostCount()
        update_document['result.statistics']['commentCount'] = self.getFieldSum('post_commentCount')
        update_document['result.statistics']['reshareCount'] = self.getFieldSum('post_shareCount')

        update_document['result.statistics']['reactions'] = {}
        update_document['result.statistics']['reactions']['like'] = self.getFieldSum('post_reactions.like')
        update_document['result.statistics']['reactions']['angry'] = self.getFieldSum('post_reactions.angry')
        update_document['result.statistics']['reactions']['wow'] = self.getFieldSum('post_reactions.wow')
        update_document['result.statistics']['reactions']['sad'] = self.getFieldSum('post_reactions.sad')
        update_document['result.statistics']['reactions']['haha'] = self.getFieldSum('post_reactions.haha')
        update_document['result.statistics']['reactions']['love'] = self.getFieldSum('post_reactions.love')

        self.prompt('{} Score document created!'.format(json.dumps(self.filter_dict)))

        return update_document

    def getAccountScoreDocument(self):

        self.prompt('{} Creating score document . . .'.format(json.dumps(self.filter_dict)))

        update_document = {}

        update_document['page_id'] = self.filter_dict['page_id'].lower()

        update_document['result.scores'] = {}

        update_document['result.scores']['popularity_likeScore'] = {}
        update_document['result.scores']['popularity_likeScore']['popularity_likeScore_1'] = self.getP1()
        update_document['result.scores']['popularity_likeScore']['popularity_likeScore_3'] = self.getP3()

        update_document['result.scores']['commitment_commentScore'] = {}
        update_document['result.scores']['commitment_commentScore']['commitment_commentScore_1'] = self.getC1()
        update_document['result.scores']['commitment_commentScore']['commitment_commentScore_3'] = self.getC3()

        update_document['result.scores']['virality_shareScore'] = {}
        update_document['result.scores']['virality_shareScore']['virality_shareScore_1'] = self.getV1()
        update_document['result.scores']['virality_shareScore']['virality_shareScore_3'] = self.getV3()

        update_document['result.scores']['engagement_index_score'] = self.getEngagementIndexScore()

        engagement_index_score_normalized = self.getAccountNormalizedEngagementIndexScore()
        update_document['result.scores']['engagement_index_score_normalized'] = engagement_index_score_normalized * 100 if engagement_index_score_normalized else None

        update_document['result.scores']['reaction_score'] = {}
        update_document['result.scores']['reaction_score']['total'] = self.getTotalReactionScore()

        self.prompt('{} Score document created!'.format(json.dumps(self.filter_dict)))

        return update_document

    def getAccountPostTypeScoreDocument(self):

        update_document = {}

        post_types = self.fmc.getPostTypeDistinct('post_type')

        for post_type in post_types:

            self.filter_dict.pop('post_type', None)
            posttypeattribute = {'post_type': post_type}
            posttypeattribute.update(self.filter_dict)

            super(FacebookScorer, self).__init__(
                posttypeattribute,
                FacebookMongoConnector(),
                'post_reactions.like',
                'post_commentCount',
                'post_shareCount',
                'page_id',
                'post_type'
            )

            self.prompt('{} Creating score document . . .'.format(json.dumps(self.filter_dict)))

            update_document['page_id'] = self.filter_dict['page_id'].lower()

            update_document['post_type_result.%s.scores' % (post_type)] = {}
            update_document['post_type_result.%s.scores' % (post_type)]['engagement_index_score'] = self.getEngagementIndexScore()

            self.prompt('{} Score document created!'.format(json.dumps(self.filter_dict)))

        return update_document

    def getPostTypeStatisticDocument(self):

        update_document = {}

        post_types = self.fmc.getPostTypeDistinct('post_type')

        for post_type in post_types:

            posttypeattribute = {'post_type': post_type}

            super(FacebookScorer, self).__init__(
                posttypeattribute,
                FacebookMongoConnector(),
                'post_reactions.like',
                'post_commentCount',
                'post_shareCount',
                'page_id',
                'post_type'
            )

            self.prompt('{} Creating statistic document . . .'.format(json.dumps(self.filter_dict)))

            update_document['_id'] = posttypeattribute['post_type']

            update_document['result.statistics'] = {}
            update_document['result.statistics']['postCount'] = self.getPostCount()

            self.prompt('{} Statistic document created!'.format(json.dumps(self.filter_dict)))

            self.mongo_connector_class.updatePostTypeResult(update_document)

    def getPostTypeScoreDocument(self):

        update_document = {}

        post_types = self.fmc.getPostTypeDistinct('post_type')

        for post_type in post_types:

            posttypeattribute = {'post_type': post_type}

            super(FacebookScorer, self).__init__(
                posttypeattribute,
                FacebookMongoConnector(),
                'post_reactions.like',
                'post_commentCount',
                'post_shareCount',
                'page_id',
                'post_type'
            )

            self.prompt('{} Creating score document . . .'.format(json.dumps(self.filter_dict)))

            update_document['_id'] = posttypeattribute['post_type']

            update_document['result.scores'] = {}
            update_document['result.scores']['engagement_index_score'] = self.getEngagementIndexScore()

            self.prompt('{} Score document created!'.format(json.dumps(self.filter_dict)))

            self.mongo_connector_class.updatePostTypeResult(update_document)

コード例 #12

0

ファイルを表示

ファイル: egovbench_facebooktrigger.py プロジェクト: oditouchiha/egovbench

class FacebookTrigger():
    def createdirectory(self, path):
        os.makedirs(os.path.dirname(path), exist_ok=True)

    def __init__(self):

        logger = logging.getLogger()
        logger.setLevel(logging.DEBUG)

        if not logger.handlers:

            formatter = logging.Formatter(
                '%(asctime)s - %(levelname)s - %(message)s')

            logpath = '/home/addi/egovbench/logs/facebook/egovbench_facebooktrigger.log'

            try:
                fh = RotatingFileHandler(logpath,
                                         maxBytes=20971520,
                                         backupCount=5)
                fh.setLevel(logging.DEBUG)
                fh.setFormatter(formatter)
                logger.addHandler(fh)

                ch = logging.StreamHandler()
                ch.setLevel(logging.INFO)
                ch.setFormatter(formatter)
                logger.addHandler(ch)

            except FileNotFoundError:
                self.createdirectory(logpath)

        self.fmc = FacebookMongoConnector()

    def prompt(self, texts):
        logging.info('[EGOVBENCH_FACEBOOKTRIGGER]>' + ' ' + texts)

    def launch(self):

        self.prompt('Launching trigger . . .')

        self.fmc.resetTemp()

        counter = 0

        while True:

            cursor = self.fmc.activateTailableCursor()

            while cursor.alive:

                try:
                    message = cursor.next()
                    self.prompt('(page_id: {}) Message received!'.format(
                        message['id']))

                    if message['page_type'] == 'resmi':

                        self.prompt(
                            '(page_id: {}) Resmi detected, calculating score . . .'
                            .format(message['id']))

                        self.pushAccountResult(message['id'])

                        counter += 1

                    elif message['page_type'] == 'influencer':

                        self.prompt(
                            '(page_id: {}) Influencer detected, skipping . . .'
                            .format(message['id']))

                    self.prompt(
                        '==================================================================='
                    )

                    if counter % 100 == 0:
                        self.pushPostTypeResult()

                except StopIteration:
                    time.sleep(1)

    def pushPostTypeResult(self):

        fs = FacebookScorer(None)

        fs.getPostTypeStatisticDocument()

        fs.getPostTypeScoreDocument()

    def pushAccountResult(self, value):

        filter_dict = {'page_id': value}

        fs = FacebookScorer(filter_dict)

        accountStatisticDocument = fs.getAccountStatisticDocument()
        self.fmc.updateAccountResult(accountStatisticDocument)

        accountScoreDocument = fs.getAccountScoreDocument()
        self.fmc.updateAccountResult(accountScoreDocument)

        accountPostTypeScoreDocument = fs.getAccountPostTypeScoreDocument()
        self.fmc.updateAccountResult(accountPostTypeScoreDocument)

        self.fmc.updatePemdaScores(value)