Python NGram.getN 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: pyspark.ml.feature

클래스/타입: NGram

메소드/함수: getN

hotexamples.com에서의 예제들: 3

Python NGram.getN - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 pyspark.ml.feature.NGram.getN에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

NGram(30)

transform(30)

getOutputCol(6)

getN(2)

select(2)

getInputCol(1)

groupBy(1)

setInputCol(1)

setOutputCol(1)

show(1)

예제 #1

파일 보기

파일: test_feature.py 프로젝트: zoelin7/spark

 def test_ngram(self):
     dataset = self.spark.createDataFrame([Row(input=["a", "b", "c", "d", "e"])])
     ngram0 = NGram(n=4, inputCol="input", outputCol="output")
     self.assertEqual(ngram0.getN(), 4)
     self.assertEqual(ngram0.getInputCol(), "input")
     self.assertEqual(ngram0.getOutputCol(), "output")
     transformedDF = ngram0.transform(dataset)
     self.assertEqual(transformedDF.head().output, ["a b c d", "b c d e"])

예제 #2

파일 보기

파일: test_feature.py 프로젝트: Brett-A/spark

 def test_ngram(self):
     dataset = self.spark.createDataFrame([
         Row(input=["a", "b", "c", "d", "e"])])
     ngram0 = NGram(n=4, inputCol="input", outputCol="output")
     self.assertEqual(ngram0.getN(), 4)
     self.assertEqual(ngram0.getInputCol(), "input")
     self.assertEqual(ngram0.getOutputCol(), "output")
     transformedDF = ngram0.transform(dataset)
     self.assertEqual(transformedDF.head().output, ["a b c d", "b c d e"])

예제 #3

파일 보기

파일: ngram.py 프로젝트: KoferaDS/PySpark_ML

def transformData(df, parameter):
    '''
    Transformed dataframe based on the parameter
        Input : - parameter
        Output : - transformed dataframe
    '''

    ngram = NGram(n=parameter["n"],
                  inputCol=parameter["inputCol"],
                  outputCol=parameter["outputCol"])

    temp = ''

    if len(ngram.transform(df).head().inputTokens) < ngram.getN():
        print('No element in ' + parameter["outputCol"])
    else:
        temp = ngram.transform(df).show()

    return temp