Python TweetFiles Beispiele

Programmiersprache: Python

Namespace / Paketname: library.twitter

Klasse / Typ: TweetFiles

Beispiele auf hotexamples.com: 10

Python TweetFiles - 10 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die library.twitter.TweetFiles, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

iterateTweetsFromGzip(5)

Beispiel #1

Datei anzeigen

Datei: time_to_process_points.py Projekt: kykamath/hd_streams_clustering

def getStatsForCDA():
    global previousTime
    default_experts_twitter_stream_settings['cluster_analysis_method'] = clusterAnalysis
    default_experts_twitter_stream_settings['cluster_analysis_frequency_in_seconds'] = 30
    clustering = HDSkipStreamClustering(**default_experts_twitter_stream_settings)
    previousTime = time.time()
    clustering.cluster(TweetFiles.iterateTweetsFromGzip('/mnt/chevron/kykamath/data/twitter/lsh_clustering/clustering_quality_experts_folder/data/1000000.gz'))

Beispiel #2

Datei anzeigen

def generateData():
    i = 0
    for line in TweetFiles.iterateTweetsFromGzip(
            '/mnt/chevron/kykamath/data/twitter/lsh_clustering/clustering_quality_experts_folder/data/1000000.gz'
    ):
        FileIO.writeToFileAsJson(
            line, time_to_process_points + '10000/%s' % (i / 10000))
        i += 1

Beispiel #3

Datei anzeigen

Datei: performance_with_cda.py Projekt: greeness/hd_streams_clustering

def iterateTweetUsersAfterCombiningTweets(fileName, **stream_settings):
        dataForAggregation = defaultdict(Vector)
        textToIdMap = defaultdict(int)
        for tweet in TweetFiles.iterateTweetsFromGzip(fileName):
            textVector = TwitterCrowdsSpecificMethods.convertTweetJSONToMessage(tweet, **stream_settings).vector
            textIdVector = Vector()
            for phrase in textVector: 
                if phrase not in textToIdMap: textToIdMap[phrase]=str(len(textToIdMap))
                textIdVector[textToIdMap[phrase]]=textVector[phrase]
            dataForAggregation[tweet['user']['screen_name'].lower()]+=textIdVector
        for k, v in dataForAggregation.iteritems(): yield k, v

Beispiel #4

Datei anzeigen

def getStatsForCDA():
    global previousTime
    default_experts_twitter_stream_settings[
        'cluster_analysis_method'] = clusterAnalysis
    default_experts_twitter_stream_settings[
        'cluster_analysis_frequency_in_seconds'] = 30
    clustering = HDSkipStreamClustering(
        **default_experts_twitter_stream_settings)
    previousTime = time.time()
    clustering.cluster(
        TweetFiles.iterateTweetsFromGzip(
            '/mnt/chevron/kykamath/data/twitter/lsh_clustering/clustering_quality_experts_folder/data/1000000.gz'
        ))

Beispiel #5

Datei anzeigen

Datei: quality_comparison_with_ssa.py Projekt: kykamath/hd_streams_clustering

 def _iterateUserDocuments(self):
     dataForAggregation = defaultdict(Vector)
     textToIdMap = defaultdict(int)
     for tweet in TweetFiles.iterateTweetsFromGzip(self.rawDataFileName):
         textVector = TwitterCrowdsSpecificMethods.convertTweetJSONToMessage(tweet, **self.stream_settings).vector
         textIdVector = Vector()
         for phrase in textVector:
             if phrase not in textToIdMap:
                 textToIdMap[phrase] = str(len(textToIdMap))
             textIdVector[textToIdMap[phrase]] = textVector[phrase]
         dataForAggregation[tweet["user"]["screen_name"].lower()] += textIdVector
     for k, v in dataForAggregation.iteritems():
         yield k, v

Beispiel #6

Datei anzeigen

def iterateTweetUsersAfterCombiningTweets(fileName, **stream_settings):
    dataForAggregation = defaultdict(Vector)
    textToIdMap = defaultdict(int)
    for tweet in TweetFiles.iterateTweetsFromGzip(fileName):
        textVector = TwitterCrowdsSpecificMethods.convertTweetJSONToMessage(
            tweet, **stream_settings).vector
        textIdVector = Vector()
        for phrase in textVector:
            if phrase not in textToIdMap:
                textToIdMap[phrase] = str(len(textToIdMap))
            textIdVector[textToIdMap[phrase]] = textVector[phrase]
        dataForAggregation[tweet['user']
                           ['screen_name'].lower()] += textIdVector
    for k, v in dataForAggregation.iteritems():
        yield k, v

Beispiel #7

Datei anzeigen

Datei: stream_phrases.py Projekt: ylaron/hd_streams_clustering

def iteratePhrases():
    for tweet in TweetFiles.iterateTweetsFromGzip('/mnt/chevron/kykamath/data/twitter/tweets_by_trends/2011_2_6.gz'):
        message = TwitterCrowdsSpecificMethods.convertTweetJSONToMessage(tweet, **settings)
        if message.vector:
            for phrase in message.vector: 
                if phrase!='': yield (phrase, GeneralMethods.approximateEpoch(GeneralMethods.getEpochFromDateTimeObject(message.timeStamp), 60))

Beispiel #8

Datei anzeigen

 def iterateFromFile(file):
     for tweet in TweetFiles.iterateTweetsFromGzip(file):
         yield tweet

Beispiel #9

Datei anzeigen

Datei: time_to_process_points.py Projekt: kykamath/hd_streams_clustering

def generateData():
    i = 0
    for line in TweetFiles.iterateTweetsFromGzip('/mnt/chevron/kykamath/data/twitter/lsh_clustering/clustering_quality_experts_folder/data/1000000.gz'):
        FileIO.writeToFileAsJson(line, time_to_process_points+'10000/%s'%(i/10000))
        i+=1

Beispiel #10

Datei anzeigen

Datei: twitter_streams_clustering.py Projekt: greeness/hd_streams_clustering

 def iterateFromFile(file):
     for tweet in TweetFiles.iterateTweetsFromGzip(file): yield tweet