Python fillnaDict 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: analysis

메소드/함수: fillnaDict

hotexamples.com에서의 예제들: 4

Python fillnaDict - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 analysis.fillnaDict에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: utilities.py 프로젝트: hiransuvrat/utilies

def prepDataTest(data, fields, fillna = True, fillVal = {}, dump = False, dumpPrefix = 'set'):
  data = data[fields]
  if fillna:
    data = analysis.fillnaDict(data, fillVal)

  if dump:
    np.savetxt("%s_testActual.csv" % (dumpPrefix), data, delimiter=",")

  return data

예제 #2

파일 보기

def prepDataTrain(data,
                  label='Label',
                  fields=[],
                  split=True,
                  splitPercent=10,
                  shuffle=False,
                  fillna=True,
                  typeSub='mean',
                  dump=True,
                  dumpPrefix='set'):

    if len(fields) == 0:
        fields = data.dtype.names
    if shuffle:
        np.random.shuffle(data)
        print 'Shuffled'

    if split:
        test = data[(len(data) - int(len(data) * (splitPercent / 100.0))):]
        data = data[:(len(data) - int(len(data) * (splitPercent / 100.0)))]
        print 'Split'

    fillVal = {}
    if fillna:
        data, fillVal = analysis.fillna(data, typeSub, fields, -1)
        if split:
            test = analysis.fillnaDict(test, fillVal)
        print 'Filled NaN'

    if dump:
        np.savetxt("%s_train.csv" % (dumpPrefix), data, delimiter=",")
        if split:
            np.savetxt("%s_test.csv" % (dumpPrefix), test, delimiter=",")
        print 'Data dumped'

    index = 0
    features = []
    features = fields
    for feature in fields:
        if feature == label:
            features = np.delete(fields, index, 0)
        index += 1

    if split:
        if fillna:
            return data, test, features, fillVal
        else:
            return data, test, features, {}
    else:
        if fillna:
            return data, [], features, fillVal
        else:
            return data, [], features, {}

예제 #3

파일 보기

def prepDataTest(data,
                 fields,
                 fillna=True,
                 fillVal={},
                 dump=False,
                 dumpPrefix='set'):
    data = data[fields]
    if fillna:
        data = analysis.fillnaDict(data, fillVal)

    if dump:
        np.savetxt("%s_testActual.csv" % (dumpPrefix), data, delimiter=",")

    return data

예제 #4

파일 보기

파일: utilities.py 프로젝트: hiransuvrat/utilies

def prepDataTrain(data, label = 'Label', fields = [], split = True, splitPercent = 10, shuffle = False, fillna = True, typeSub = 'mean', dump = True, dumpPrefix = 'set'):

  if len(fields) == 0:
    fields = data.dtype.names
  if shuffle:
    np.random.shuffle(data)
    print 'Shuffled'

  if split:
    test = data[(len(data) - int(len(data)*(splitPercent/100.0))):]
    data = data[:(len(data) - int(len(data)*(splitPercent/100.0)))]
    print 'Split'

  fillVal = {}
  if fillna:
    data, fillVal = analysis.fillna(data, typeSub, fields, -1)
    if split:
      test = analysis.fillnaDict(test, fillVal)
    print 'Filled NaN'

  if dump:
    np.savetxt("%s_train.csv" % (dumpPrefix), data, delimiter=",")
    if split:
      np.savetxt("%s_test.csv" % (dumpPrefix), test, delimiter=",")
    print 'Data dumped'

  index = 0
  features = []
  features = fields
  for feature in fields:
    if feature == label:
      features = np.delete(fields, index, 0)      
    index += 1

  if split:
    if fillna:
      return data, test, features, fillVal
    else:
      return data, test, features, {}
  else:
    if fillna:
      return data, [], features, fillVal
    else:
      return data, [], features, {}