Python ExternalResource 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: sparknlp.common

클래스/타입: ExternalResource

hotexamples.com에서의 예제들: 16

Python ExternalResource - 16개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 sparknlp.common.ExternalResource에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

ExternalResource(19)

자주 사용되는 메소드들

ExternalResource (19)

예제 #1

파일 보기

파일: annotator.py 프로젝트: wxrui/spark-nlp

 def setCorpus(self,
               path,
               token_pattern="\S+",
               read_as=ReadAs.LINE_BY_LINE,
               options={"format": "text"}):
     opts = options.copy()
     if "tokenPattern" not in opts:
         opts["tokenPattern"] = token_pattern
     return self._set(corpus=ExternalResource(path, read_as, opts))

예제 #2

파일 보기

파일: annotator.py 프로젝트: wxrui/spark-nlp

 def setExternalRules(self,
                      path,
                      delimiter,
                      read_as=ReadAs.LINE_BY_LINE,
                      options={"format": "text"}):
     opts = options.copy()
     if "delimiter" not in opts:
         opts["delimiter"] = delimiter
     return self._set(externalRules=ExternalResource(path, read_as, opts))

예제 #3

파일 보기

파일: annotator.py 프로젝트: wxrui/spark-nlp

 def setDictionary(self,
                   path,
                   delimiter,
                   read_as=ReadAs.LINE_BY_LINE,
                   options={'format': 'text'}):
     opts = options.copy()
     if "delimiter" not in opts:
         opts["delimiter"] = delimiter
     return self._set(dictionary=ExternalResource(path, read_as, opts))

예제 #4

파일 보기

    def readDataset(self, path, read_as=ReadAs.LINE_BY_LINE, opts={}):
        resource = ExternalResource(path, read_as, opts)

        # ToDo Replace with std pyspark
        session = SparkSession(self.sc)
        jSession = session._jsparkSession

        jdf = self._java_obj.readDataset(resource, jSession)
        return DataFrame(jdf, session._wrapped)

예제 #5

파일 보기

파일: annotator.py 프로젝트: wxrui/spark-nlp

 def setCorpus(self,
               path,
               delimiter,
               read_as=ReadAs.SPARK_DATASET,
               options={
                   "format": "text",
                   "repartition": "8"
               }):
     opts = options.copy()
     opts["delimiter"] = delimiter
     return self._set(corpus=ExternalResource(path, read_as, opts))

예제 #6

파일 보기

파일: annotator.py 프로젝트: kotobot/spark-nlp

 def __init__(self):
     super(NorvigSweetingApproach, self).__init__(
         classname=
         "com.johnsnowlabs.nlp.annotators.spell.norvig.NorvigSweetingApproach"
     )
     self._setDefault(dictionary=ExternalResource(
         "/spell/words.txt", ReadAs.LINE_BY_LINE,
         {"tokenPattern": "[a-zA-Z]+"}),
                      caseSensitive=False,
                      doubleVariants=False,
                      shortCircuit=False)

예제 #7

파일 보기

파일: annotator.py 프로젝트: kotobot/spark-nlp

 def __init__(self):
     super(PerceptronApproach, self).__init__(
         classname=
         "com.johnsnowlabs.nlp.annotators.pos.perceptron.PerceptronApproach"
     )
     self._setDefault(corpus=ExternalResource("/anc-pos-corpus/",
                                              ReadAs.LINE_BY_LINE, {
                                                  "delimiter": "|",
                                                  "format": "text"
                                              }),
                      nIterations=5)

예제 #8

파일 보기

파일: annotator.py 프로젝트: kristiankaufmann/spark-nlp

 def setDictionary(self,
                   path,
                   key_delimiter,
                   value_delimiter,
                   read_as=ReadAs.LINE_BY_LINE,
                   options={"format": "text"}):
     opts = options.copy()
     if "keyDelimiter" not in opts:
         opts["keyDelimiter"] = key_delimiter
     if "valueDelimiter" not in opts:
         opts["valueDelimiter"] = value_delimiter
     return self._set(dictionary=ExternalResource(path, read_as, opts))

예제 #9

파일 보기

파일: annotator.py 프로젝트: kristiankaufmann/spark-nlp

 def setExternalDataset(self,
                        path,
                        read_as=ReadAs.LINE_BY_LINE,
                        options={"format": "text"}):
     return self._set(
         externalDataset=ExternalResource(path, read_as, options.copy()))

예제 #10

파일 보기

 def setExternalDataset(self, path=None, read_as="LINE_BY_LINE", options={"format": "text", "delimiter": ":"}.copy()):
     return self._set(externalDataset=ExternalResource(path, read_as, options))

예제 #11

파일 보기

 def setSlangDictionary(self, path=None, read_as="LINE_BY_LINE", options={"format": "text", "tokenPattern": "\S+"}.copy()):
     return self._set(slangDictionary=ExternalResource(path, read_as, options))

예제 #12

파일 보기

 def setCorpus(self, path=None, read_as="LINE_BY_LINE", options={"format": "text", "tokenPattern": "\S+"}.copy()):
     return self._set(corpus=ExternalResource(path, read_as, options))

예제 #13

파일 보기

 def setDictionary(self, path=None, read_as="LINE_BY_LINE", options={'format':'text', 'delimiter':','}.copy()):
     return self._set(dictionary=ExternalResource(path, read_as, options))

예제 #14

파일 보기

 def setEntities(self, path=None, read_as="LINE_BY_LINE", options={"format": "text"}.copy()):
     return self._set(entities=ExternalResource(path, read_as, options))

예제 #15

파일 보기

 def setDictionary(self, path=None, read_as="LINE_BY_LINE", options={"format": "text",
                                                                     "keyDelimiter": "->",
                                                                     "valueDelimiter": "\t"}.copy()):
     return self._set(dictionary=ExternalResource(path, read_as, options))

예제 #16

파일 보기

 def setCorpus(self, path, delimiter, read_as=ReadAs.LINE_BY_LINE, options={"format": "text"}):
     opts = options.copy()
     opts["delimiter"] = delimiter
     return self._set(corpus=ExternalResource(path, read_as, opts))