Python Dataset.ReadData Examples

Programming Language: Python

Namespace/Package Name: dataset

Class/Type: Dataset

Method/Function: ReadData

Examples at hotexamples.com: 2

Python Dataset.ReadData - 2 examples found. These are the top rated real world Python examples of dataset.Dataset.ReadData extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

Dataset(30)

Save(4)

BATCH_SIZE(3)

getChannelObj(2)

Builder(2)

import_from_path(2)

ReadData(2)

GetFeedDict(2)

DictReader(2)

DataSet(2)

init_slot(1)

discretize(1)

loadFromFile(1)

get_train_y(1)

get_train_x(1)

get_resampled_train_X_y(1)

removeDataset(1)

entryList(1)

Y_r(1)

defineGrid(1)

configure_traits(1)

addVariable(1)

addDictData(1)

X(1)

WData(1)

VOC_SIZE(1)

TTA(1)

Prepare(1)

GetColumn(1)

DataGenerator(1)

start(1)

Example #1

Show file

File: rnnlm.py Project: codeaudit/calm

  params.batch_size = 20

SEPERATOR = ' '
if params.splitter == 'char':
  SEPERATOR = ''

if args.mode in ('train', 'eval', 'classify'):
  mode = args.mode
  if args.partition_override:
    mode = 'all'

  dataset = Dataset(max_len=params.max_len + 1, 
                    preshuffle=args.mode=='train',
                    batch_size=params.batch_size)
  print 'reading data'
  dataset.ReadData(args.data, params.context_vars + ['text'],
                   mode=mode, splitter=params.splitter)

if args.mode == 'train':
  if args.vocab is not None:
    vocab = Vocab.Load(args.vocab)
  else:
    min_count = 20
    if hasattr(params, 'min_vocab_count'):
      min_count = params.min_vocab_count
    vocab = Vocab.MakeFromData(dataset.GetColumn('text'), min_count=min_count)
  context_vocabs = {}
  for context_var in params.context_vars:
    v = Vocab.MakeFromData([[u] for u in dataset.GetColumn(context_var)],
                           min_count=50, no_special_syms=True)
    context_vocabs[context_var] = v
    print 'num {0}: {1}'.format(context_var, len(v))

Example #2

Show file

File: rnnlm.py Project: frankfan007/calm

    params.batch_size = 1

SEPERATOR = ' '
if params.splitter == 'char':
    SEPERATOR = ''

if args.mode in ('train', 'eval', 'classify', 'uniclass', 'geoclass'):
    mode = args.mode

    dataset = Dataset(max_len=params.max_len + 1,
                      preshuffle=args.mode == 'train',
                      batch_size=params.batch_size)
    print 'reading data'
    dataset.ReadData(args.data,
                     params.context_vars + ['text'],
                     splitter=params.splitter,
                     valdata=args.valdata,
                     types=params.context_var_types)

if args.mode == 'train':
    # do the word vocab
    if args.vocab is not None:
        vocab = Vocab.Load(args.vocab)
    else:
        vocab = Vocab.MakeFromData(dataset.GetColumn('text'),
                                   min_count=params.min_vocab_count)

    if params.splitter == 'word':  # do the character vocab
        graphemes = [['{'] + Vocab.Graphemes(x) + ['}']
                     for x in vocab.GetWords()]
        char_vocab = Vocab.MakeFromData(graphemes, min_count=1)