Python DocSim.similarity示例

编程语言: Python

命名空间/包名称: docsim

类/类型: DocSim

方法/功能: similarity

hotexamples.com的示例: 3

Python DocSim.similarity - 已找到3个示例。这些是从开源项目中提取的最受好评的docsim.DocSim.similarity现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

DocSim(8)

similarity(3)

query(1)

set_doc(1)

set_model(1)

sim(1)

similarity_new_doc(1)

vectorized(1)

示例#1

显示文件

文件： tester.py 项目： sarvesh-ranjan/perceptualhashing

    def compare_algs_tfidf_simhashtfidf(self):
        token_length = 1
        test_set = self.generate_random_triples()

        ds = DocSim(self.document_set)
        sh = SimHashTfIdf(self.document_set)

        total = float(len(test_set))
        correct = 0.
        for t1, t2, t3 in test_set:
            dsim1 = ds.similarity(t1, t2)
            dsim2 = ds.similarity(t1, t3)
            ssim1 = sh.similarity(t1, t2)
            ssim2 = sh.similarity(t1, t3)

            if ((abs(dsim1 - 0) < 0.000001 and abs(dsim2 - 0) < 0.000001)):
                total -= 1.
                continue
            db = dsim1 < dsim2
            sb = ssim1 < ssim2

            if db == sb:
                correct += 1.
        # print len(test_set)
        # print total
        return correct / total

示例#2

显示文件

文件： tester.py 项目： sarvesh-ranjan/perceptualhashing

    def benchmark_memory_tfidf(self, iterations):
        ds = DocSim(self.document_set)
        for i in range(iterations):
            title1 = self.select_random_document()
            title2 = self.select_random_document()
            sim = ds.similarity(title1, title2)

        return resource.getrusage(resource.RUSAGE_SELF).ru_maxrss / 1000

示例#3

显示文件

文件： tester.py 项目： sarvesh-ranjan/perceptualhashing

    def benchmark_tfidf(self, iterations):
        t0 = time.clock()
        ds = DocSim(self.document_set)
        for i in range(iterations):
            title1 = self.select_random_document()
            title2 = self.select_random_document()
            sim = ds.similarity(title1, title2)

        t1 = time.clock()
        span = t1 - t0
        return span