Python Dataの例、vfl.Data Pythonの例

コード例 #1

0

ファイルを表示

    def test_augment_from_file(self):
        # write a few temporary files.
        files = ['data.py.tmp.1', 'data.py.tmp.2', 'data.py.tmp.3']
        with open(files[0], 'w') as f:
            f.write('\n'.join(
                ['# 3 1', '0 1.5 -0.1', '0 2.5 -0.01', '0 3.5 -0.001']))
        with open(files[1], 'w') as f:
            f.write('\n'.join(['# 2 1', '0 1.25 1', '1 2.25 0.1']))
        with open(files[2], 'w') as f:
            f.write('\n'.join(['# 2 2', '0 1.25 5.5 1', '0 2.25 7.3 0']))

        # Data accept files at creation.
        dat = vfl.Data(file=files[0])
        self.assertEqual(len(dat), 3)
        self.assertEqual(dat.dims, 1)
        self.assertEqual([d.output for d in dat], [0, 0, 0])
        self.assertEqual([d.x[0] for d in dat], [1.5, 2.5, 3.5])
        self.assertEqual([d.y for d in dat], [-0.1, -0.01, -0.001])

        # Data accept files through augment().
        dat.augment(file=files[1])
        self.assertEqual(len(dat), 5)
        self.assertEqual(dat.dims, 1)
        self.assertEqual([d.output for d in dat], [0, 0, 0, 0, 1])
        self.assertEqual([d.x[0] for d in dat], [1.25, 1.5, 2.5, 3.5, 2.25])
        self.assertEqual([d.y for d in dat], [1, -0.1, -0.01, -0.001, 0.1])

        # dimensionalities of new files must match the Data.
        with self.assertRaises(IOError):
            dat.augment(file=files[2])

        # remove the temporary files.
        for f in files:
            os.remove(f)

コード例 #2

0

ファイルを表示

    def test_dims(self):
        # dimensionalities should track the contained data.
        dat = vfl.Data(grid=[[2, 1, 5]])
        self.assertEqual(dat.dims, 1)

        # dimensionalities are immutable.
        with self.assertRaises(AttributeError):
            dat.dims = 2

コード例 #3

0

ファイルを表示

    def test_write(self):
        # build a dataset.
        datA = vfl.Data(grid=[[1, 1, 2], [1, 1, 3], [1, 1, 5]], outputs=[0, 1])

        # write the dataset to a file and read that file back.
        filename = 'data.py.tmp'
        datA.write(file=filename)
        datB = vfl.Data(file=filename)
        os.remove(filename)

        # check that the data are identical.
        self.assertEqual(len(datA), len(datB))
        self.assertEqual(datA.dims, datB.dims)
        for i in range(len(datA)):
            self.assertEqual(datA[i].output, datB[i].output)
            self.assertEqual(datA[i].x, datB[i].x)
            self.assertEqual(datA[i].y, datB[i].y)

コード例 #4

0

ファイルを表示

    def test_augment_from_data(self):
        # Data accept datasets at creation.
        datA = vfl.Data(grid=[[1, 1, 3]])
        dat = vfl.Data(data=datA)
        self.assertEqual(len(dat), 3)
        self.assertEqual(dat.dims, 1)
        self.assertEqual([d.output for d in dat], [0, 0, 0])
        self.assertEqual([d.x[0] for d in dat], [1, 2, 3])

        # Data accept datasets through augment().
        datB = vfl.Data(grid=[[2, 1, 4]], output=1)
        dat.augment(data=datB)
        self.assertEqual(len(dat), 6)
        self.assertEqual(dat.dims, 1)
        self.assertEqual([d.output for d in dat], [0, 0, 0, 1, 1, 1])
        self.assertEqual([d.x[0] for d in dat], [1, 2, 3, 2, 3, 4])

        # dimensionalities of new datasets must match the Data.
        with self.assertRaises(RuntimeError):
            datC = vfl.Data(grid=[[1, 1, 3], [1, 1, 3]])
            dat.augment(data=datC)

コード例 #5

0

ファイルを表示

    def test_augment_from_grid(self):
        # Data accept grids at creation.
        dat = vfl.Data(grid=[[1, 2, 5]])
        self.assertEqual(len(dat), 3)
        self.assertEqual(dat.dims, 1)
        self.assertEqual([d.x[0] for d in dat], [1, 3, 5])

        # Data accept grids through augment().
        dat.augment(grid=[[2, 2, 6]])
        self.assertEqual(len(dat), 6)
        self.assertEqual(dat.dims, 1)
        self.assertEqual([d.x[0] for d in dat], [1, 2, 3, 4, 5, 6])

        # grids must be matrices.
        with self.assertRaises(TypeError):
            dat = vfl.Data(grid='foo')

        # grids must have equal row counts.
        with self.assertRaises(TypeError):
            dat = vfl.Data(grid=[[1, 1, 3], [1, 2]])

        # dimensionalities of new grids must match the Data.
        with self.assertRaises(RuntimeError):
            dat.augment(grid=[[1, 1, 3], [1, 1, 3]])

コード例 #6

0

ファイルを表示

    def test_sequence(self):
        # Data is a sequence.
        dat = vfl.Data(grid=[[1, 1, 3]], outputs=[0, 1])
        self.assertEqual(len(dat), 6)
        self.assertEqual([d.output for d in dat], [0, 0, 0, 1, 1, 1])
        self.assertEqual([d.x[0] for d in dat], [1, 2, 3, 1, 2, 3])

        # sequence elements are mutable, but data are re-sorted.
        dat[2] = vfl.Datum(output=2, x=[5], y=0)
        self.assertEqual([d.output for d in dat], [0, 0, 1, 1, 1, 2])
        self.assertEqual([d.x[0] for d in dat], [1, 2, 1, 2, 3, 5])

        # sequence elements must be Datum objects.
        with self.assertRaises(TypeError):
            dat[2] = 'baz'

コード例 #7

0

ファイルを表示

    def test_augment_from_datum(self):
        # Data accept single observations at creation.
        dat = vfl.Data(datum=vfl.Datum(x=[1, 0], y=-2, output=1))
        self.assertEqual(len(dat), 1)
        self.assertEqual(dat.dims, 2)
        self.assertEqual([d.y for d in dat], [-2])

        # Data accept single observations through augment().
        dat.augment(datum=vfl.Datum(x=[-1, 0], y=-3, output=2))
        self.assertEqual(len(dat), 2)
        self.assertEqual(dat.dims, 2)
        self.assertEqual([d.y for d in dat], [-2, -3])

        # dimensionalities of new observations must match the Data
        with self.assertRaises(RuntimeError):
            dat.augment(datum=vfl.Datum(x=[3]))

コード例 #8

0

ファイルを表示

# import the required modules.
import vfl

# load the input dataset.
dat = vfl.Data(file='co2.dat')

# shift the data locations for simpler inference.
for d in dat:
    d[0] -= 1995

# create a model without an explicit linear trend.
mdl = {}
mdl[False] = vfl.model.VFR(alpha0=100,
                           beta0=1,
                           nu=1e-6,
                           data=dat,
                           factors=[
                               vfl.factor.Cosine(mu=0, tau=1e5),
                               vfl.factor.Cosine(mu=1e-3, tau=1e4),
                               vfl.factor.Cosine(mu=1e-2, tau=100),
                               vfl.factor.Cosine(mu=1e-1, tau=100),
                               vfl.factor.Cosine(mu=5, tau=1),
                               vfl.factor.Cosine(mu=10, tau=1)
                           ])

# create a model with an explicit linear trend.
mdl[True] = vfl.model.VFR(alpha0=100,
                          beta0=1,
                          nu=1e-6,
                          data=dat,
                          factors=[

コード例 #9

0

ファイルを表示

# import the required modules.
import vfl

# create a model.
mdl = vfl.model.VFR(alpha0=10,
                    beta0=40,
                    nu=1e-3,
                    data=vfl.Data(file='multexp.dat'),
                    factors=[
                        vfl.factor.Decay(alpha=10, beta=1),
                        vfl.factor.Decay(alpha=10, beta=10),
                        vfl.factor.Decay(alpha=10, beta=100),
                        vfl.factor.Decay(alpha=10, beta=1000),
                        vfl.factor.Decay(alpha=10, beta=10000)
                    ])

# create an optimizer.
opt = vfl.optim.FullGradient(model=mdl, lipschitz_init=0.001)

# optimize.
opt.execute()

# build gridded datasets for prediction.
G = [[0, 0.1, 150]]
mean = vfl.Data(grid=G)
var = vfl.Data(grid=G)

# compute the model prediction.
mdl.predict(mean=mean, var=var)

# write the prediction results.

コード例 #10

0

ファイルを表示

# import the required modules.
import vfl

# create a model.
mdl = vfl.model.VFR(alpha0=1000,
                    beta0=10,
                    nu=1e-3,
                    data=vfl.Data(file='sinc.dat'))

# add a fixed impulse factor at each data point.
mdl.factors = [vfl.factor.FixedImpulse(mu=d[0], tau=0.001) for d in mdl.data]

# fix the factor precisions.
for f in mdl:
    f.tau = 1

# create an optimizer.
opt = vfl.optim.FullGradient(model=mdl, lipschitz_init=0.001)

# optimize.
opt.execute()

# build gridded datasets for prediction.
G = [[-10, 1e-3, 10]]
mean = vfl.Data(grid=G)
var = vfl.Data(grid=G)

# compute the model prediction.
mdl.predict(mean=mean, var=var)

# write the prediction results.

コード例 #11

0

ファイルを表示

# import the required modules.
from random import normalvariate
from math import sqrt
import vfl

# create a model.
mdl = vfl.model.VFR(
  alpha0 = 100,
  beta0 = 100,
  nu = 1e-6,
  data = vfl.Data(file = 'ping.dat'),
  factors = vfl.factor.Decay(alpha = 200, beta = 1000) *
            vfl.factor.Cosine(mu = 0, tau = 0.1)
)

# randomize the frequency mean.
mdl.factors[0][1].mu = normalvariate(0, 1/sqrt(0.1))
mdl.factors[0].update()

# optimize.
opt = vfl.optim.FullGradient(model = mdl)
opt.execute()

# build gridded datasets for prediction.
G = [[0, 1e-3, 10]]
mean = vfl.Data(grid = G)
var = vfl.Data(grid = G)

# compute the model prediction.
mdl.predict(mean = mean, var = var)

コード例 #12

0

ファイルを表示

# import the required modules.
import vfl

# create a model.
mdl = vfl.model.VFR(
  alpha0 = 1000,
  beta0 = 2.5,
  nu = 1e-3,
  data = vfl.Data(file = '../sinc/sinc.dat'),
  factors = vfl.factor.Polynomial(order = 10)
)

# infer the weight parameters.
mdl.infer()

# build gridded datasets for prediction.
G = [[-10, 1e-3, 10]]
mean = vfl.Data(grid = G)
var = vfl.Data(grid = G)

# compute the model prediction.
mdl.predict(mean = mean, var = var)

# write the prediction results.
mean.write(file = 'mean.out')
var.write(file = 'var.out')

コード例 #13

0

ファイルを表示

 def test_defaults(self):
     # Data should initialize its properties to sane values.
     dat = vfl.Data()
     self.assertEqual(len(dat), 0)
     self.assertEqual(dat.dims, 0)

コード例 #14

0

ファイルを表示

 def test_empty_sequence(self):
     # Data sequences default to empty.
     dat = vfl.Data()
     self.assertEqual(len(dat), 0)
     with self.assertRaises(IndexError):
         z = dat[0]

コード例 #15

0

ファイルを表示

 def test_len(self):
     # counts should track the number of observations.
     dat = vfl.Data(grid=[[2, 1, 5]])
     self.assertEqual(len(dat), 4)

コード例 #16

0

ファイルを表示

# import the required modules.
from random import normalvariate
import vfl

# create a model.
mdl = vfl.model.TauVFR(
  tau = 1,
  nu = 1e-6,
  data = vfl.Data(file = 'cosines.dat'),
  factors = [vfl.factor.Cosine(mu = 0, tau = 1e-5)
             for i in range(4)]
)

# randomize the factor means.
for f in mdl:
  f.mu = normalvariate(0, 300)

# create an optimizer.
opt = vfl.optim.FullGradient(
  model = mdl,
  lipschitz_init = 0.001
)

# optimize.
opt.execute()

# build gridded datasets for prediction.
G = [[0, 1e-3, 0.5]]
mean = vfl.Data(grid = G)
var = vfl.Data(grid = G)

コード例 #17

0

ファイルを表示

# import the required modules.
from math import sqrt
import vfl

# create a model.
mdl = vfl.model.VFC(
    nu=1e-6,
    data=vfl.Data(file='ripley.dat'),
)

# add a fixed impulse factor at every tenth data point.
mdl.factors = [
    vfl.factor.Impulse(dim=0, mu=mdl.data[i][0], tau=10) *
    vfl.factor.Impulse(dim=1, mu=mdl.data[i][1], tau=10)
    for i in range(0, len(mdl.data), 10)
]

# initialize the factor precisions.
for f in mdl:
    f[0].tau = 10
    f[1].tau = 10
    f.update()

# create an optimizer.
opt = vfl.optim.FullGradient(model=mdl, lipschitz_init=0.001)

# optimize.
opt.execute()

# build gridded datasets for prediction.
G = [[-1.5, 0.01, 1.0], [-0.3, 0.02, 1.2]]

コード例 #18

0

ファイルを表示

# import the required modules.
import vfl

# create a model.
mdl = vfl.model.VFR(alpha0=100,
                    beta0=100,
                    nu=1e-2,
                    data=vfl.Data(file='gauss.dat'),
                    factors=[
                        vfl.factor.Decay(alpha=10, beta=1000),
                        vfl.factor.Impulse(mu=60, tau=0.01),
                        vfl.factor.Impulse(mu=180, tau=0.01)
                    ])

# optimize.
opt = vfl.optim.FullGradient(model=mdl)
opt.execute()

# build gridded datasets for prediction.
G = [[0, 1, 300]]
mean = vfl.Data(grid=G)
var = vfl.Data(grid=G)

# compute the model prediction.
mdl.predict(mean=mean, var=var)

# write the prediction results.
mean.write(file='mean.out')
var.write(file='var.out')