Python TextCluster.TextCluster 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: asrt.common.TextCluster

클래스/타입: TextCluster

메소드/함수: TextCluster

hotexamples.com에서의 예제들: 2

Python TextCluster.TextCluster - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 asrt.common.TextCluster.TextCluster.TextCluster에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

TextCluster(2)

setLanguage(2)

자주 사용되는 메소드들

TextCluster (2)

setLanguage (2)

예제 #1

파일 보기

파일: TextDocument.py 프로젝트: ondrejklejch/asrt

    def _addClusterText(self, utterance, languageId):
        """Add 'utterance' as a text cluster.

           param utterance: an utf-8 encoded string
        """
        utterance = utterance.strip()
        if len(utterance) > 0:
            c = TextCluster(self, utterance)
            c.setLanguage(languageId)
            self.addDocumentLine(c)

예제 #2

파일 보기

           param 'sentencesList': a list of text sentences
           param 'languageId'   : the language id for the sentences list
           param 'bEmpty'       : empty current document is set otherwise
                                  add to existing clusters 
        """
        if bEmpty:
            self.reset()

        #Add sentences as clusters
        for line in sentencesList:
            #Further sentence split to avoid long paragraphes
            for utterance in re.split(ur"\t|;|:|!|\?", line, flags=re.UNICODE):
                utterance = utterance.strip()
                if len(utterance) > 0:
                    c = TextCluster(self, utterance)
                    c.setLanguage(languageId)
                    self.addDocumentLine(c)

    def _getLanguage2ClustersDict(self):
        """Map languages with a list of clusters.

           return a dictionary with one entry per
                  language.
        """
        languageDict = {}
        for textCluster in self.listContent:
            clusterLanguageId = textCluster.getLanguageId()
            #First cluster
            if clusterLanguageId not in languageDict:
                languageDict[clusterLanguageId] = []