Ejemplos de SimilarStreamAggregation en Python

Lenguaje de programación: Python

Namespace/Package Name: experiments.ssa.ssa

Ejemplos en hotexamples.com: 7

Python SimilarStreamAggregation - 7 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de experiments.ssa.ssa.SimilarStreamAggregation extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

SimilarStreamAggregation(4)

estimate(4)

iterateClusters(3)

Ejemplo n.º 1

Mostrar archivo

Archivo: performance_with_cda.py Proyecto: greeness/hd_streams_clustering

 def performanceForCDAITAt(noOfTweets, fileName, **stream_settings):
     ts = time.time()
     sstObject = SimilarStreamAggregation(dict(iterateTweetUsersAfterCombiningTweets(fileName, **stream_settings)), stream_settings['ssa_threshold'])
     sstObject.estimate()
     documentClusters = list(sstObject.iterateClusters())
     te = time.time()
     return Evaluation.getEvaluationMetrics(noOfTweets, documentClusters, te-ts)

Ejemplo n.º 2

Mostrar archivo

Archivo: quality_comparison_with_ssa.py Proyecto: kykamath/hd_streams_clustering

 def getStatsForSSA(self):
     print "SSA"
     ts = time.time()
     sstObject = SimilarStreamAggregation(dict(self._iterateUserDocuments()), self.stream_settings["ssa_threshold"])
     sstObject.estimate()
     documentClusters = list(sstObject.iterateClusters())
     te = time.time()
     return self.getEvaluationMetrics(documentClusters, te - ts)

Ejemplo n.º 3

Mostrar archivo

Archivo: quality_comparison_with_ssa.py Proyecto: ylaron/hd_streams_clustering

 def getStatsForSSA(self):
     print 'SSA'
     ts = time.time()
     sstObject = SimilarStreamAggregation(
         dict(self._iterateUserDocuments()),
         self.stream_settings['ssa_threshold'])
     sstObject.estimate()
     documentClusters = list(sstObject.iterateClusters())
     te = time.time()
     return self.getEvaluationMetrics(documentClusters, te - ts)

Ejemplo n.º 4

Mostrar archivo

Archivo: time_to_process_points.py Proyecto: kykamath/hd_streams_clustering

def getStatsForSSA():
    batchSize = 10000
    default_experts_twitter_stream_settings['ssa_threshold']=0.75
    for id in range(21, 50):
        fileName = time_to_process_points+'%s/%s'%(batchSize,id)
        ts = time.time()
        sstObject = SimilarStreamAggregation(dict(iterateUserDocuments(fileName)), default_experts_twitter_stream_settings['ssa_threshold'])
        sstObject.estimate()
    #    documentClusters = list(sstObject.iterateClusters())
        iteration_data = {'iteration_time': time.time()-ts, 'type': 'ssa', 'number_of_messages': batchSize*(id+1), 'batch_size': batchSize}
        FileIO.writeToFileAsJson(iteration_data, ssa_stats_file)

Ejemplo n.º 5

Mostrar archivo

 def performanceForCDAITAt(noOfTweets, fileName, **stream_settings):
     ts = time.time()
     sstObject = SimilarStreamAggregation(
         dict(
             iterateTweetUsersAfterCombiningTweets(fileName,
                                                   **stream_settings)),
         stream_settings['ssa_threshold'])
     sstObject.estimate()
     documentClusters = list(sstObject.iterateClusters())
     te = time.time()
     return Evaluation.getEvaluationMetrics(noOfTweets, documentClusters,
                                            te - ts)

Ejemplo n.º 6

Mostrar archivo

def getStatsForSSA():
    batchSize = 10000
    default_experts_twitter_stream_settings['ssa_threshold'] = 0.75
    for id in range(21, 50):
        fileName = time_to_process_points + '%s/%s' % (batchSize, id)
        ts = time.time()
        sstObject = SimilarStreamAggregation(
            dict(iterateUserDocuments(fileName)),
            default_experts_twitter_stream_settings['ssa_threshold'])
        sstObject.estimate()
        #    documentClusters = list(sstObject.iterateClusters())
        iteration_data = {
            'iteration_time': time.time() - ts,
            'type': 'ssa',
            'number_of_messages': batchSize * (id + 1),
            'batch_size': batchSize
        }
        FileIO.writeToFileAsJson(iteration_data, ssa_stats_file)

Ejemplo n.º 7

Mostrar archivo

Archivo: ssa_tests.py Proyecto: ylaron/hd_streams_clustering

 def test_estimate(self):
     nn = SimilarStreamAggregation(vectors, 0.99)
     nn.estimate()
     self.assertEqual([['1', '3', '2'], ['5', '7']], list(nn.iterateClusters()))