Python LongHighOrderDataset Examples

Programming Language: Python

Namespace/Package Name: htmresearch.support.sequence_prediction_dataset

Examples at hotexamples.com: 5

Python LongHighOrderDataset - 5 examples found. These are the top rated real world Python examples of htmresearch.support.sequence_prediction_dataset.LongHighOrderDataset extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

LongHighOrderDataset(2)

generateSequence(1)

Example #1

Show file

File: tm_suite.py Project: Starcounter-Jack/nupic.research

  def reset(self, params, repetition):
    random.seed(params['seed'])

    if params['dataset'] == 'simple':
      self.dataset = SimpleDataset()
    elif params['dataset'] == 'reber':
      self.dataset = ReberDataset(maxLength=params['max_length'])
    elif params['dataset'] == 'high-order':
      self.dataset = HighOrderDataset(numPredictions=params['num_predictions'],
                                      seed=params['seed'])
      print "Sequence dataset: "
      print " Symbol Number {}".format(self.dataset.numSymbols)
      for seq in self.dataset.sequences:
        print seq

    elif params['dataset'] == 'high-order-long':
      self.dataset = LongHighOrderDataset(params['sequence_length'],
                                          seed=params['seed'])
      print "Sequence dataset: "
      print " Symbol Number {}".format(self.dataset.numSymbols)
      for seq in self.dataset.sequences:
        print seq
    else:
      raise Exception("Dataset not found")

    self.randomStart = self.dataset.numSymbols + 1
    self.randomEnd = self.randomStart + 5000

    MODEL_PARAMS['modelParams']['sensorParams']['encoders']['element']\
      ['categoryList'] = range(self.randomEnd)

    # if not os.path.exists(resultsDir):
    #   os.makedirs(resultsDir)
    # self.resultsFile = open(os.path.join(resultsDir, "0.log"), 'w')
    if params['verbosity'] > 0:
      print " initializing HTM model..."
    self.model = ModelFactory.create(MODEL_PARAMS)
    self.model.enableInference({"predictedField": "element"})
    # self.classifier = SDRClassifier(steps=[1], alpha=0.001)

    self.mapping = getEncoderMapping(self.model, self.dataset.numSymbols)

    self.numPredictedActiveCells = []
    self.numPredictedInactiveCells = []
    self.numUnpredictedActiveColumns = []

    self.currentSequence = []
    self.targetPrediction = []
    self.replenish_sequence(params, iteration=0)

    self.resets = []
    self.randoms = []
    self.verbosity = 1
    self.sequenceCounter = 0

Example #2

Show file

    def reset(self, params, repetition):
        random.seed(params['seed'])

        if params['dataset'] == 'simple':
            self.dataset = SimpleDataset()
        elif params['dataset'] == 'reber':
            self.dataset = ReberDataset(maxLength=params['max_length'])
        elif params['dataset'] == 'high-order':
            self.dataset = HighOrderDataset(
                numPredictions=params['num_predictions'],
                seed=params['seed'],
                smallAlphabet=params['use_small_alphabet'])
            print "Sequence dataset: "
            print " Symbol Number {}".format(self.dataset.numSymbols)
            for seq in self.dataset.sequences:
                print seq

        elif params['dataset'] == 'high-order-long':
            self.dataset = LongHighOrderDataset(params['sequence_length'],
                                                seed=params['seed'])
            print "Sequence dataset: "
            print " Symbol Number {}".format(self.dataset.numSymbols)
            for seq in self.dataset.sequences:
                print seq
        else:
            raise Exception("Dataset not found")

        self.randomStart = self.dataset.numSymbols + 1
        self.randomEnd = self.randomStart + 5000

        MODEL_PARAMS['modelParams']['sensorParams']['encoders']['element']\
          ['categoryList'] = range(self.randomEnd)

        # if not os.path.exists(resultsDir):
        #   os.makedirs(resultsDir)
        # self.resultsFile = open(os.path.join(resultsDir, "0.log"), 'w')
        if params['verbosity'] > 0:
            print " initializing HTM model..."
            # print MODEL_PARAMS
        self.model = ModelFactory.create(MODEL_PARAMS)
        self.model.enableInference({"predictedField": "element"})
        # self.classifier = SDRClassifier(steps=[1], alpha=0.001)
        print "finish initializing HTM model "

        if params['kill_cell_percent'] > 0:
            # a hack to use faulty temporal memory instead
            self.model._getTPRegion().getSelf()._tfdr = MonitoredFaultyTPShim(
                numberOfCols=2048,
                cellsPerColumn=32,
                newSynapseCount=32,
                maxSynapsesPerSegment=128,
                maxSegmentsPerCell=128,
                initialPerm=0.21,
                connectedPerm=0.50,
                permanenceInc=0.10,
                permanenceDec=0.10,
                predictedSegmentDecrement=0.01,
                minThreshold=15,
                activationThreshold=15,
                seed=1960,
            )

        self.mapping = getEncoderMapping(self.model, self.dataset.numSymbols)

        self.numPredictedActiveCells = []
        self.numPredictedInactiveCells = []
        self.numUnpredictedActiveColumns = []

        self.currentSequence = []
        self.targetPrediction = []
        self.replenish_sequence(params, iteration=0)

        self.resets = []
        self.randoms = []
        self.verbosity = 1
        self.sequenceCounter = 0

Example #3

Show file

class Suite(PyExperimentSuite):
    def reset(self, params, repetition):
        random.seed(params['seed'])

        if params['dataset'] == 'simple':
            self.dataset = SimpleDataset()
        elif params['dataset'] == 'reber':
            self.dataset = ReberDataset(maxLength=params['max_length'])
        elif params['dataset'] == 'high-order':
            self.dataset = HighOrderDataset(
                numPredictions=params['num_predictions'],
                seed=params['seed'],
                smallAlphabet=params['use_small_alphabet'])
            print "Sequence dataset: "
            print " Symbol Number {}".format(self.dataset.numSymbols)
            for seq in self.dataset.sequences:
                print seq

        elif params['dataset'] == 'high-order-long':
            self.dataset = LongHighOrderDataset(params['sequence_length'],
                                                seed=params['seed'])
            print "Sequence dataset: "
            print " Symbol Number {}".format(self.dataset.numSymbols)
            for seq in self.dataset.sequences:
                print seq
        else:
            raise Exception("Dataset not found")

        self.randomStart = self.dataset.numSymbols + 1
        self.randomEnd = self.randomStart + 5000

        MODEL_PARAMS['modelParams']['sensorParams']['encoders']['element']\
          ['categoryList'] = range(self.randomEnd)

        # if not os.path.exists(resultsDir):
        #   os.makedirs(resultsDir)
        # self.resultsFile = open(os.path.join(resultsDir, "0.log"), 'w')
        if params['verbosity'] > 0:
            print " initializing HTM model..."
            # print MODEL_PARAMS
        self.model = ModelFactory.create(MODEL_PARAMS)
        self.model.enableInference({"predictedField": "element"})
        # self.classifier = SDRClassifier(steps=[1], alpha=0.001)
        print "finish initializing HTM model "

        if params['kill_cell_percent'] > 0:
            # a hack to use faulty temporal memory instead
            self.model._getTPRegion().getSelf()._tfdr = MonitoredFaultyTPShim(
                numberOfCols=2048,
                cellsPerColumn=32,
                newSynapseCount=32,
                maxSynapsesPerSegment=128,
                maxSegmentsPerCell=128,
                initialPerm=0.21,
                connectedPerm=0.50,
                permanenceInc=0.10,
                permanenceDec=0.10,
                predictedSegmentDecrement=0.01,
                minThreshold=15,
                activationThreshold=15,
                seed=1960,
            )

        self.mapping = getEncoderMapping(self.model, self.dataset.numSymbols)

        self.numPredictedActiveCells = []
        self.numPredictedInactiveCells = []
        self.numUnpredictedActiveColumns = []

        self.currentSequence = []
        self.targetPrediction = []
        self.replenish_sequence(params, iteration=0)

        self.resets = []
        self.randoms = []
        self.verbosity = 1
        self.sequenceCounter = 0

    def replenish_sequence(self, params, iteration):
        if iteration > params['perturb_after']:
            print "PERTURBING"
            sequence, target = self.dataset.generateSequence(params['seed'] +
                                                             iteration,
                                                             perturbed=True)
        else:
            sequence, target = self.dataset.generateSequence(params['seed'] +
                                                             iteration)

        if (iteration > params['inject_noise_after']
                and iteration < params['stop_inject_noise_after']):
            injectNoiseAt = random.randint(1, 3)
            sequence[injectNoiseAt] = random.randrange(self.randomStart,
                                                       self.randomEnd)

            if params['verbosity'] > 0:
                print "injectNoise ", sequence[
                    injectNoiseAt], " at: ", injectNoiseAt

        # separate sequences with random elements
        if params['separate_sequences_with'] == 'random':
            random.seed(params['seed'] + iteration)
            sequence.append(random.randrange(self.randomStart, self.randomEnd))
            target.append(None)

        if params['verbosity'] > 0:
            print "Add sequence to buffer"
            print "sequence: ", sequence
            print "target: ", target

        self.currentSequence += sequence
        self.targetPrediction += target

    def check_prediction(self, topPredictions, targets):
        if targets is None:
            correct = None
        else:
            if isinstance(targets, numbers.Number):
                # single target, multiple predictions
                correct = targets in topPredictions
            else:
                # multiple targets, multiple predictions
                correct = True
                for prediction in topPredictions:
                    correct = correct and (prediction in targets)
        return correct

    def iterate(self, params, repetition, iteration):
        currentElement = self.currentSequence.pop(0)
        target = self.targetPrediction.pop(0)

        # whether there will be a reset signal after the current record
        resetFlag = (len(self.currentSequence) == 0
                     and params['separate_sequences_with'] == 'reset')
        self.resets.append(resetFlag)

        # whether there will be a random symbol after the current record
        randomFlag = (len(self.currentSequence) == 1
                      and params['separate_sequences_with'] == 'random')

        self.randoms.append(randomFlag)

        killCell = False
        if iteration == params[
                'kill_cell_after'] and params['kill_cell_percent'] > 0:
            killCell = True
            tm = self.model._getTPRegion().getSelf()._tfdr
            tm.killCells(percent=params['kill_cell_percent'])
            self.model.disableLearning()

        result = self.model.run({"element": currentElement})
        tm = self.model._getTPRegion().getSelf()._tfdr

        tm.mmClearHistory()

        # Try use SDR classifier to classify active (not predicted) cells
        # The results is similar as classifying the predicted cells
        # classLabel = min(currentElement, self.dataset.numSymbols)
        # classification = {'bucketIdx': classLabel, 'actValue': classLabel}
        # result = self.classifier.compute(iteration, list(tm.activeCells),
        #                                  classification,
        #                                  learn=True, infer=True)
        # topPredictionsSDRClassifier = sorted(zip(result[1], result["actualValues"]),
        #                                      reverse=True)[0]
        # topPredictionsSDRClassifier = [topPredictionsSDRClassifier[1]]
        topPredictionsSDRClassifier = None

        # activeColumns = set([tm.columnForCell(cell) for cell in tm.activeCells])
        # print "active columns: "
        # print activeColumns
        # print "sdr mapping current: "
        # print self.mapping[element]
        # print "sdr mapping next: "
        # print self.mapping[target]
        # Use custom classifier (uses predicted cells to make predictions)
        predictiveColumns = set(
            [tm.columnForCell(cell) for cell in tm.getPredictiveCells()])
        topPredictions = classify(self.mapping, predictiveColumns,
                                  params['num_predictions'])

        # correct = self.check_prediction(topPredictions, target)
        truth = target
        if params['separate_sequences_with'] == 'random':
            if (self.randoms[-1]
                    or len(self.randoms) >= 2 and self.randoms[-2]):
                truth = None

        correct = None if truth is None else (truth in topPredictions)

        data = {
            "iteration": iteration,
            "current": currentElement,
            "reset": resetFlag,
            "random": randomFlag,
            "train": True,
            "predictions": topPredictions,
            "predictionsSDR": topPredictionsSDRClassifier,
            "truth": target,
            "sequenceCounter": self.sequenceCounter
        }

        if params['verbosity'] > 0:
            print("iteration: {0} \t"
                  "current: {1} \t"
                  "predictions: {2} \t"
                  "predictions SDR: {3} \t"
                  "truth: {4} \t"
                  "correct: {5} \t"
                  "predict column: {6}").format(iteration, currentElement,
                                                topPredictions,
                                                topPredictionsSDRClassifier,
                                                target, correct,
                                                len(predictiveColumns))

        if len(self.currentSequence) == 0:
            self.replenish_sequence(params, iteration)
            self.sequenceCounter += 1

        if self.resets[-1]:
            if params['verbosity'] > 0:
                print "Reset TM at iteration {}".format(iteration)
            tm.reset()

        return data

Example #4

Show file

File: tm_suite.py Project: Starcounter-Jack/nupic.research

class Suite(PyExperimentSuite):

  def reset(self, params, repetition):
    random.seed(params['seed'])

    if params['dataset'] == 'simple':
      self.dataset = SimpleDataset()
    elif params['dataset'] == 'reber':
      self.dataset = ReberDataset(maxLength=params['max_length'])
    elif params['dataset'] == 'high-order':
      self.dataset = HighOrderDataset(numPredictions=params['num_predictions'],
                                      seed=params['seed'])
      print "Sequence dataset: "
      print " Symbol Number {}".format(self.dataset.numSymbols)
      for seq in self.dataset.sequences:
        print seq

    elif params['dataset'] == 'high-order-long':
      self.dataset = LongHighOrderDataset(params['sequence_length'],
                                          seed=params['seed'])
      print "Sequence dataset: "
      print " Symbol Number {}".format(self.dataset.numSymbols)
      for seq in self.dataset.sequences:
        print seq
    else:
      raise Exception("Dataset not found")

    self.randomStart = self.dataset.numSymbols + 1
    self.randomEnd = self.randomStart + 5000

    MODEL_PARAMS['modelParams']['sensorParams']['encoders']['element']\
      ['categoryList'] = range(self.randomEnd)

    # if not os.path.exists(resultsDir):
    #   os.makedirs(resultsDir)
    # self.resultsFile = open(os.path.join(resultsDir, "0.log"), 'w')
    if params['verbosity'] > 0:
      print " initializing HTM model..."
    self.model = ModelFactory.create(MODEL_PARAMS)
    self.model.enableInference({"predictedField": "element"})
    # self.classifier = SDRClassifier(steps=[1], alpha=0.001)

    self.mapping = getEncoderMapping(self.model, self.dataset.numSymbols)

    self.numPredictedActiveCells = []
    self.numPredictedInactiveCells = []
    self.numUnpredictedActiveColumns = []

    self.currentSequence = []
    self.targetPrediction = []
    self.replenish_sequence(params, iteration=0)

    self.resets = []
    self.randoms = []
    self.verbosity = 1
    self.sequenceCounter = 0


  def replenish_sequence(self, params, iteration):
    if iteration > params['perturb_after']:
      print "PERTURBING"
      sequence, target = self.dataset.generateSequence(params['seed']+iteration,
                                                       perturbed=True)
    else:
      sequence, target = self.dataset.generateSequence(params['seed']+iteration)

    if (iteration > params['inject_noise_after'] and
        iteration < params['stop_inject_noise_after']):
      injectNoiseAt = random.randint(1, 3)
      sequence[injectNoiseAt] = random.randrange(self.randomStart, self.randomEnd)

      if params['verbosity'] > 0:
        print "injectNoise ", sequence[injectNoiseAt],  " at: ", injectNoiseAt

    # separate sequences with random elements
    if params['separate_sequences_with'] == 'random':
      random.seed(params['seed']+iteration)
      sequence.append(random.randrange(self.randomStart, self.randomEnd))
      target.append(None)

    if params['verbosity'] > 0:
      print "Add sequence to buffer"
      print "sequence: ", sequence
      print "target: ", target

    self.currentSequence += sequence
    self.targetPrediction += target


  def check_prediction(self, topPredictions, targets):
    if targets is None:
      correct = None
    else:
      if isinstance(targets, numbers.Number):
        # single target, multiple predictions
        correct = targets in topPredictions
      else:
        # multiple targets, multiple predictions
        correct = True
        for prediction in topPredictions:
           correct = correct and (prediction in targets)
    return correct


  def iterate(self, params, repetition, iteration):
    currentElement = self.currentSequence.pop(0)
    target = self.targetPrediction.pop(0)

    # whether there will be a reset signal after the current record
    resetFlag = (len(self.currentSequence) == 0 and
                 params['separate_sequences_with'] == 'reset')
    self.resets.append(resetFlag)

    # whether there will be a random symbol after the current record
    randomFlag = (len(self.currentSequence) == 1 and
                  params['separate_sequences_with'] == 'random')

    self.randoms.append(randomFlag)

    result = self.model.run({"element": currentElement})
    tm = self.model._getTPRegion().getSelf()._tfdr

    tm.mmClearHistory()

    # Try use SDR classifier to classify active (not predicted) cells
    # The results is similar as classifying the predicted cells
    # classLabel = min(currentElement, self.dataset.numSymbols)
    # classification = {'bucketIdx': classLabel, 'actValue': classLabel}
    # result = self.classifier.compute(iteration, list(tm.activeCells),
    #                                  classification,
    #                                  learn=True, infer=True)
    # topPredictionsSDRClassifier = sorted(zip(result[1], result["actualValues"]),
    #                                      reverse=True)[0]
    # topPredictionsSDRClassifier = [topPredictionsSDRClassifier[1]]
    topPredictionsSDRClassifier = None

    # activeColumns = set([tm.columnForCell(cell) for cell in tm.activeCells])
    # print "active columns: "
    # print activeColumns
    # print "sdr mapping current: "
    # print self.mapping[element]
    # print "sdr mapping next: "
    # print self.mapping[target]
    # Use custom classifier (uses predicted cells to make predictions)
    predictiveColumns = set([tm.columnForCell(cell) for cell in tm.predictiveCells])
    topPredictions = classify(
      self.mapping, predictiveColumns, params['num_predictions'])

    # correct = self.check_prediction(topPredictions, target)
    truth = target
    if params['separate_sequences_with'] == 'random':
      if (self.randoms[-1] or
                len(self.randoms) >= 2 and self.randoms[-2]):
        truth = None

    correct = None if truth is None else (truth in topPredictions)

    data = {"iteration": iteration,
            "current": currentElement,
            "reset": resetFlag,
            "random": randomFlag,
            "train": True,
            "predictions": topPredictions,
            "predictionsSDR": topPredictionsSDRClassifier,
            "truth": target,
            "sequenceCounter": self.sequenceCounter}

    if params['verbosity'] > 0:
      print ("iteration: {0} \t"
             "current: {1} \t"
             "predictions: {2} \t"
             "predictions SDR: {3} \t"
             "truth: {4} \t"
             "correct: {5} \t"
             "predict column: {6}").format(
        iteration, currentElement, topPredictions, topPredictionsSDRClassifier,
        target, correct, len(predictiveColumns))

    if len(self.currentSequence) == 0:
      self.replenish_sequence(params, iteration)
      self.sequenceCounter += 1

    if self.resets[-1]:
      if params['verbosity'] > 0:
        print "Reset TM at iteration {}".format(iteration)
      tm.reset()

    return data

Example #5

Show file

File: suite.py Project: andrewmalta13/nupic.research

  def reset(self, params, repetition):
    random.seed(params['seed'])

    if params['dataset'] == 'simple':
      self.dataset = SimpleDataset()
    elif params['dataset'] == 'reber':
      self.dataset = ReberDataset(maxLength=params['max_length'])
    elif params['dataset'] == 'high-order':
      self.dataset = HighOrderDataset(numPredictions=params['num_predictions'],
                                      seed=params['seed'],
                                      smallAlphabet=params['use_small_alphabet'])
      print "Sequence dataset: "
      print " Symbol Number {}".format(self.dataset.numSymbols)
      for seq in self.dataset.sequences:
        print seq

    elif params['dataset'] == 'high-order-long':
      self.dataset = LongHighOrderDataset(params['sequence_length'],
                                          seed=params['seed'])
      print "Sequence dataset: "
      print " Symbol Number {}".format(self.dataset.numSymbols)
      for seq in self.dataset.sequences:
        print seq
    else:
      raise Exception("Dataset not found")

    self.randomStart = self.dataset.numSymbols + 1
    self.randomEnd = self.randomStart + 5000

    MODEL_PARAMS['modelParams']['sensorParams']['encoders']['element']\
      ['categoryList'] = range(self.randomEnd)

    # if not os.path.exists(resultsDir):
    #   os.makedirs(resultsDir)
    # self.resultsFile = open(os.path.join(resultsDir, "0.log"), 'w')
    if params['verbosity'] > 0:
      print " initializing HTM model..."
    self.model = ModelFactory.create(MODEL_PARAMS)
    self.model.enableInference({"predictedField": "element"})
    # self.classifier = SDRClassifier(steps=[1], alpha=0.001)

    if params['kill_cell_percent'] > 0:
      # a hack to use faulty temporal memory instead
      self.model._getTPRegion().getSelf()._tfdr = MonitoredFaultyTPShim(
        numberOfCols=2048,
        cellsPerColumn=32,
        newSynapseCount=32,
        maxSynapsesPerSegment=128,
        maxSegmentsPerCell=128,
        initialPerm=0.21,
        connectedPerm=0.50,
        permanenceInc=0.10,
        permanenceDec=0.10,
        predictedSegmentDecrement=0.01,
        minThreshold=15,
        activationThreshold=15,
        seed=1960,
      )

    self.mapping = getEncoderMapping(self.model, self.dataset.numSymbols)

    self.numPredictedActiveCells = []
    self.numPredictedInactiveCells = []
    self.numUnpredictedActiveColumns = []

    self.currentSequence = []
    self.targetPrediction = []
    self.replenish_sequence(params, iteration=0)

    self.resets = []
    self.randoms = []
    self.verbosity = 1
    self.sequenceCounter = 0