Python TypeConverters примеры использования

Язык программирования: Python

Пространство имен/Пакет: pyspark.ml.param

Класс/Тип: TypeConverters

Примеров на hotexamples.com: 15

Python TypeConverters - 15 примеров найдено. Это лучшие примеры Python кода для pyspark.ml.param.TypeConverters, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

toString(5)

toList(4)

toFloat(3)

toInt(3)

toBoolean(2)

toListString(2)

toListFloat(1)

toListInt(1)

Пример #1

Показать файл

 def convert(value):
     if value is None:
         raise TypeError("None is not allowed.")
     elif isinstance(value, JavaObject):
         return {k: TypeConverters.toFloat(value[k]) for k in value.keySet().toArray()}
     elif isinstance(value, dict):
         return {k: TypeConverters.toFloat(v) for k, v in value.items()}
     else:
         raise TypeError("Invalid type.")

Пример #2

Показать файл

Файл: tests.py Проект: Bella-Lin/spark

 def test_list(self):
     l = [0, 1]
     for lst_like in [l, np.array(l), DenseVector(l), SparseVector(len(l), range(len(l)), l),
                      array.array('l', l), xrange(2), tuple(l)]:
         converted = TypeConverters.toList(lst_like)
         self.assertEqual(type(converted), list)
         self.assertListEqual(converted, l)

Пример #3

Показать файл

Файл: test_param.py Проект: zwxhnu/spark

 def test_list(self):
     l = [0, 1]
     for lst_like in [l, np.array(l), DenseVector(l), SparseVector(len(l), range(len(l)), l),
                      pyarray.array('l', l), xrange(2), tuple(l)]:
         converted = TypeConverters.toList(lst_like)
         self.assertEqual(type(converted), list)
         self.assertListEqual(converted, l)

Пример #4

Показать файл

 def convert(value):
     if value is None:
         return None
     else:
         return [
             H2OTypeConverters.toDenseVector()(v)
             for v in TypeConverters.toList(value)
         ]

Пример #5

Показать файл

 def convert(value):
     if value is None:
         raise TypeError("None is not allowed.")
     else:
         return [
             H2OTypeConverters.toPairString()(v)
             for v in TypeConverters.toList(value)
         ]

Пример #6

Показать файл

Файл: param.py Проект: mateiz/spark-deep-learning

 def toStringOrTFTensor(value):
     if isinstance(value, tf.Tensor):
         return value
     else:
         try:
             return TypeConverters.toString(value)
         except TypeError:
             raise TypeError("Could not convert %s to tensorflow.Tensor or str" % type(value))

Пример #7

Показать файл

        def convert(value):
            if value is None:
                raise TypeError("None is not allowed.")
            else:
                valueForConversion = value
                if isinstance(value, JavaObject):
                    valueForConversion = list(value)

                return TypeConverters.toListString(valueForConversion)

Пример #8

Показать файл

 def toStringOrTFTensor(value):
     if isinstance(value, tf.Tensor):
         return value
     else:
         try:
             return TypeConverters.toString(value)
         except TypeError:
             raise TypeError(
                 "Could not convert %s to tensorflow.Tensor or str" %
                 type(value))

Пример #9

Показать файл

 def convert(value):
     if value is None:
         raise TypeError("None is not allowed.")
     else:
         return TypeConverters.toBoolean(value)

Пример #10

Показать файл

 def convert(value):
     if value is None:
         return None
     else:
         return TypeConverters.toBoolean(value)

Пример #11

Показать файл

 def convert(value):
     if value is None:
         return None
     else:
         return TypeConverters.toFloat(value)

Пример #12

Показать файл

 def convert(value):
     if value is None:
         return None
     else:
         return TypeConverters.toString(value)

Пример #13

Показать файл

 def convert(value):
     package = getattr(_jvm().ai.h2o.sparkling.ml.params, "H2OAlgoParamsHelper$")
     return package.__getattr__("MODULE$").getValidatedEnumValue(enumClass, TypeConverters.toString(value))

Пример #14

Показать файл

def train():
    sparkUrl = 'spark://ubuntu02:7077'

    file_path = 'hdfs://ubuntu02:9000/vectors/sentences_vector.csv'
    hdfs_url = 'http://ubuntu02:50070'
    user = '******'

    # 用來分桶的參數(愈小桶越多)
    r = 0.002

    # 所有句向量集合
    sc = get_conf(sparkUrl, 'LSH_train', "8g")
    df = load_sentence_data_frame(sc, file_path)

    # 隨機抽取一個向量v
    v = df.sample(False, 0.1, seed=0).rdd.first()['_vector']

    # 對每一個值算一個hash code: floor(dot(u,v) / r)
    tmp = df.rdd.flatMap(
        lambda x: {
            Row(x['id'], x['sentence'], x['vector'],
                TypeConverters.toInt(np.floor(x['_vector'].dot(v) / r)))
        })

    # 重新命名
    df = SQLContext(sc).createDataFrame(tmp) \
        .selectExpr("_1 as id",
                    "_2 as sentence",
                    "_3 as vector",
                    "_4 as hash_code")

    # 保存dataframe以加快速度
    df.persist()

    # 顯示各組分類情況
    summary = df.groupby("hash_code").count()
    summary.persist()

    # 取得所有桶的名稱
    names = summary.rdd.map(lambda x: x.hash_code).collect()

    # 歷遍每個分組
    for name in names:
        print('save to ' + str(name))

        tmp = df.filter(df['hash_code'] == name)

        # 刪除hash_code欄位以節省空間
        tmp = tmp.drop('hash_code')

        # 寫入hdfs(這個操作巨慢)
        tmp.toPandas().to_csv('/home/hadoop/new/' + str(name) + '.csv',
                              sep=',',
                              index=False,
                              encoding='utf-8')

    with open('/home/hadoop/new/meta.txt', 'w') as f:
        f.write('vector(v):\n')
        for e in v:
            f.write(str(e) + ',')

        f.write('\nnames:\n')
        for name in names:
            f.write(str(name) + ',')

    print('all done!!')
    return

Пример #15

Показать файл

Файл: utils.py Проект: thunterdb/spark-deep-learning-1

def _tensor_name(tensor):
    if isinstance(tensor, tf.Tensor):
        return _tensor_name(tensor.name)
    return TypeConverters.toString(tensor)