Python Corpus.Corpus 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: textcluster.cluster

클래스/타입: Corpus

메소드/함수: Corpus

hotexamples.com에서의 예제들: 1

Python Corpus.Corpus - 1개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 textcluster.cluster.Corpus.Corpus에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Corpus(1)

add(1)

cluster(1)

자주 사용되는 메소드들

Corpus (1)

add (1)

cluster (1)

예제 #1

파일 보기

    def __call__(self, key, values_gen):
        values = list(values_gen)
        version, site, platform, type = key

        def result(s_type, c_index, c_size, m_id, message, score):
            sortkey = MAX_SIZE - c_size
            self.cluster_count += 1
            return \
                (sortkey, version, site, platform, s_type, c_index, type, c_size), \
                (m_id, message, score)

        c_index = 1
        if len(values) == 1:
            m_id, message = values[0]
            for s_type in (type, None):
                yield result(s_type, c_index, 1, m_id, message, 1.0)
        else:
            corpus = Corpus()
            unclustered_opinions = {}
            for m_id, message in values:
                unclustered_opinions[m_id] = (m_id, message)
                corpus.add((m_id, message), str=message, key=m_id)

            clusters = corpus.cluster()
            for c in clusters:
                c_index += 1
                rest = [(s["object"], s["similarity"]) for s in c.similars]
                c_size = len(rest) + 1
                for (m_id, message), score in [(c.primary, 1.0)] + rest:
                    del unclustered_opinions[m_id]
                    for s_type in (type, None):
                        yield result(s_type, c_index, c_size, m_id, message,
                                     score)

            for m_id, message in unclustered_opinions.values():
                c_index += 1
                for s_type in (type, None):
                    yield result(s_type, c_index, 1, m_id, message, 1.0)