Python ParamBag.setField示例，bnpy.suffstats.ParamBag.ParamBag.setField Python示例

示例#1

0

显示文件

文件： TestParamBag.py 项目： agile-innovations/refinery

 def test_sub_K3_D2(self, K=3, D=2):
   A = ParamBag(K=K,D=D)
   A.setField('xxT', np.random.randn(K,D,D), dims=('K','D','D'))
   B = ParamBag(K=K,D=D)
   B.setField('xxT', np.random.randn(K,D,D), dims=('K','D','D'))
   C = A - B
   assert np.allclose(C.xxT, A.xxT - B.xxT)

示例#2

0

显示文件

 def test_sub_K3_D2(self, K=3, D=2):
     A = ParamBag(K=K, D=D)
     A.setField('xxT', np.random.randn(K, D, D), dims=('K', 'D', 'D'))
     B = ParamBag(K=K, D=D)
     B.setField('xxT', np.random.randn(K, D, D), dims=('K', 'D', 'D'))
     C = A - B
     assert np.allclose(C.xxT, A.xxT - B.xxT)

示例#3

0

显示文件

 def test_add_K1_D1(self):
     A = ParamBag(K=1, D=1)
     B = ParamBag(K=1, D=1)
     C = A + B
     assert C.K == A.K and C.D == A.D
     A.setField('N', [1], dims='K')
     B.setField('N', [10], dims='K')
     C = A + B
     assert C.N[0] == 11.0

示例#4

0

显示文件

文件： TestParamBag.py 项目： agile-innovations/refinery

 def test_add_K1_D1(self):
   A = ParamBag(K=1,D=1)
   B = ParamBag(K=1,D=1)
   C = A + B
   assert C.K == A.K and C.D == A.D
   A.setField('N', [1], dims='K')
   B.setField('N', [10], dims='K')
   C = A + B
   assert C.N[0] == 11.0

示例#5

0

显示文件

文件： TestParamBag.py 项目： agile-innovations/refinery

 def test_getComp_K3_D1(self):
   A = ParamBag(K=3,D=1)
   A.setField('N', [1,2,3], dims='K')
   A.setField('x', [[4],[5],[6]], dims=('K','D'))
   c = A.getComp(0)
   assert c.K == 1
   assert c.N == A.N[0]
   assert c.x == A.x[0]
   assert id(c.N) != id(A.N)
   assert id(c.x) != id(A.x)

示例#6

0

显示文件

 def test_getComp_K3_D1(self):
     A = ParamBag(K=3, D=1)
     A.setField('N', [1, 2, 3], dims='K')
     A.setField('x', [[4], [5], [6]], dims=('K', 'D'))
     c = A.getComp(0)
     assert c.K == 1
     assert c.N == A.N[0]
     assert c.x == A.x[0]
     assert id(c.N) != id(A.N)
     assert id(c.x) != id(A.x)

示例#7

0

显示文件

 def test_removeComp_K3_D1(self):
     A = ParamBag(K=3, D=1)
     A.setField('N', [1, 2, 3], dims='K')
     A.setField('x', [[4], [5], [6]], dims=('K', 'D'))
     A.setField('W', np.ones((3, 3)), dims=('K', 'K'))
     Aorig = A.copy()
     A.removeComp(1)
     assert Aorig.K == A.K + 1
     assert A.N[0] == Aorig.N[0]
     assert A.N[1] == Aorig.N[2]
     assert np.allclose(A.x, [[4], [6]])
     assert np.allclose(A.W, np.ones((2, 2)))

示例#8

0

显示文件

    def test_insertComps_K1_D1(self):
        A = ParamBag(K=1, D=1)
        s = 123.456
        A.setField('scalar', s, dims=None)
        A.setField('N', [1], dims='K')
        A.setField('x', [[1]], dims=('K', 'D'))
        A.setField('xxT', [[[1]]], dims=('K', 'D', 'D'))

        Abig = A.copy()
        Abig.insertComps(A)
        assert Abig.K == 2
        assert np.allclose(Abig.N, np.hstack([A.N, A.N]))
        # Verify that after inserting
        # scalar field is unchanged
        assert Abig.scalar == s

        Abig.insertComps(A)
        assert Abig.K == 3
        assert np.allclose(Abig.N, np.hstack([A.N, A.N, A.N]))
        assert Abig.scalar == s

        A.insertComps(Abig)
        assert A.K == 4
        assert A.scalar == s
        assert np.allclose(A.N, np.hstack([1, 1, 1, 1]))

示例#9

0

显示文件

    def test_insertComps_K1_D3(self, K=1, D=3):
        A = ParamBag(K=K, D=D)
        s = 123.456
        A.setField('scalar', s, dims=None)
        A.setField('N', [1.0], dims='K')
        A.setField('x', np.random.rand(K, D), dims=('K', 'D'))
        A.setField('xxT', np.random.rand(K, D, D), dims=('K', 'D', 'D'))

        Abig = A.copy()
        Abig.insertComps(A)

        assert Abig.K == 2
        assert np.allclose(Abig.N, np.hstack([A.N, A.N]))
        assert Abig.scalar == s
        assert Abig.xxT.shape == (2, 3, 3)
        assert np.allclose(Abig.xxT[0], A.xxT)
        assert np.allclose(Abig.xxT[1], A.xxT)

        Abig.insertComps(A)
        assert Abig.K == 3
        assert np.allclose(Abig.N, np.hstack([A.N, A.N, A.N]))
        assert Abig.scalar == s

        assert Abig.xxT.shape == (3, 3, 3)
        assert np.allclose(Abig.xxT[0], A.xxT)
        assert np.allclose(Abig.xxT[1], A.xxT)

        A.insertComps(Abig)
        assert A.K == 4
        assert A.scalar == s
        assert np.allclose(A.N, np.hstack([1, 1, 1, 1]))

示例#10

0

显示文件

文件： TestParamBag.py 项目： agile-innovations/refinery

  def test_insertComps_K1_D3(self, K=1, D=3):
    A = ParamBag(K=K,D=D)
    s = 123.456
    A.setField('scalar', s, dims=None)
    A.setField('N', [1.0], dims='K')
    A.setField('x', np.random.rand(K,D), dims=('K','D'))
    A.setField('xxT', np.random.rand(K,D,D), dims=('K','D','D'))

    Abig = A.copy()

    Abig.insertComps(A)
    assert Abig.K == 2
    assert np.allclose(Abig.N, np.hstack([A.N, A.N]))
    assert Abig.scalar == 2*s
    assert Abig.xxT.shape == (2,3,3)
    assert np.allclose(Abig.xxT[0], A.xxT)
    assert np.allclose(Abig.xxT[1], A.xxT)

    Abig.insertComps(A)
    assert Abig.K == 3
    assert np.allclose(Abig.N, np.hstack([A.N, A.N, A.N]))
    assert Abig.scalar == 3*s

    assert Abig.xxT.shape == (3,3,3)
    assert np.allclose(Abig.xxT[0], A.xxT)
    assert np.allclose(Abig.xxT[1], A.xxT)

    A.insertComps(Abig)
    assert A.K == 4
    assert A.scalar == 4*s
    assert np.allclose(A.N, np.hstack([1,1,1,1]))

示例#11

0

显示文件

文件： TestParamBag.py 项目： agile-innovations/refinery

 def test_insertEmptyComps_K3_D3(self, K=3, D=3):
   A = ParamBag(K=K, D=D)
   s = 123
   N = np.zeros(K)
   x = np.zeros((K,D))
   xxT = np.zeros((K,D,D))
   W = np.zeros((K,K))
   A.setField('s', s)
   A.setField('N', N, dims='K')
   A.setField('x', x, dims=('K','D'))
   A.setField('xxT', xxT, dims=('K','D','D'))
   A.setField('W', W, dims=('K','K'))
   A.insertEmptyComps(2)
   assert np.allclose(A.s, 123)
   assert np.allclose(A.N, np.zeros(K+2))
   assert np.allclose(A.x, np.zeros((K+2,D)))
   assert np.allclose(A.xxT, np.zeros((K+2,D,D)))
   assert np.allclose(A.W, np.zeros((K+2,K+2)))

示例#12

0

显示文件

文件： TestParamBag.py 项目： agile-innovations/refinery

 def test_setAllFieldsToZero_K1_D1(self, K=1, D=1):
   A = ParamBag(K=K, D=D)
   s = 123
   N = np.ones(K)
   x = np.ones((K,D))
   xxT = np.ones((K,D,D))
   W = np.ones((K,K))
   A.setField('s', s)
   A.setField('N', N, dims='K')
   A.setField('x', x, dims=('K','D'))
   A.setField('xxT', xxT, dims=('K','D','D'))
   A.setField('W', W, dims=('K','K'))
   A.setAllFieldsToZero()
   assert np.allclose(A.s, 0.0)
   assert np.allclose(A.N, np.zeros(K))
   assert np.allclose(A.x, np.zeros(K))
   assert np.allclose(A.xxT, np.zeros(K))
   assert np.allclose(A.xxT, np.zeros((K,K)))

示例#13

0

显示文件

 def test_insertEmptyComps_K3_D3(self, K=3, D=3):
     A = ParamBag(K=K, D=D)
     s = 123
     N = np.zeros(K)
     x = np.zeros((K, D))
     xxT = np.zeros((K, D, D))
     W = np.zeros((K, K))
     A.setField('s', s)
     A.setField('N', N, dims='K')
     A.setField('x', x, dims=('K', 'D'))
     A.setField('xxT', xxT, dims=('K', 'D', 'D'))
     A.setField('W', W, dims=('K', 'K'))
     A.insertEmptyComps(2)
     assert np.allclose(A.s, 123)
     assert np.allclose(A.N, np.zeros(K + 2))
     assert np.allclose(A.x, np.zeros((K + 2, D)))
     assert np.allclose(A.xxT, np.zeros((K + 2, D, D)))
     assert np.allclose(A.W, np.zeros((K + 2, K + 2)))

示例#14

0

显示文件

 def test_setAllFieldsToZero_K1_D1(self, K=1, D=1):
     A = ParamBag(K=K, D=D)
     s = 123
     N = np.ones(K)
     x = np.ones((K, D))
     xxT = np.ones((K, D, D))
     W = np.ones((K, K))
     A.setField('s', s)
     A.setField('N', N, dims='K')
     A.setField('x', x, dims=('K', 'D'))
     A.setField('xxT', xxT, dims=('K', 'D', 'D'))
     A.setField('W', W, dims=('K', 'K'))
     A.setAllFieldsToZero()
     assert np.allclose(A.s, 0.0)
     assert np.allclose(A.N, np.zeros(K))
     assert np.allclose(A.x, np.zeros(K))
     assert np.allclose(A.xxT, np.zeros(K))
     assert np.allclose(A.xxT, np.zeros((K, K)))

示例#15

0

显示文件

文件： TestParamBag.py 项目： agile-innovations/refinery

 def test_isub_K3_D2(self, K=3, D=2):
   A = ParamBag(K=K,D=D)
   A.setField('xxT', np.random.randn(K,D,D), dims=('K','D','D'))
   A.setField('x', np.random.randn(K,D), dims=('K','D'))
   B = ParamBag(K=K,D=D)
   B.setField('x', np.random.randn(K,D), dims=('K','D'))
   B.setField('xxT', np.random.randn(K,D,D), dims=('K','D','D'))
   origID = hex(id(A))
   A -= B
   newID = hex(id(A))
   assert origID == newID
   A = A - B
   newnewID = hex(id(A))
   assert newnewID != origID

示例#16

0

显示文件

 def test_isub_K3_D2(self, K=3, D=2):
     A = ParamBag(K=K, D=D)
     A.setField('xxT', np.random.randn(K, D, D), dims=('K', 'D', 'D'))
     A.setField('x', np.random.randn(K, D), dims=('K', 'D'))
     B = ParamBag(K=K, D=D)
     B.setField('x', np.random.randn(K, D), dims=('K', 'D'))
     B.setField('xxT', np.random.randn(K, D, D), dims=('K', 'D', 'D'))
     origID = hex(id(A))
     A -= B
     newID = hex(id(A))
     assert origID == newID
     A = A - B
     newnewID = hex(id(A))
     assert newnewID != origID

示例#17

0

显示文件

 def test_remove_K3_D2(self, K=3, D=2):
     A = ParamBag(K=K, D=D)
     s = 123
     N = np.random.rand(K)
     x = np.random.rand(K, D)
     xxT = np.random.randn(K, D, D)
     A.setField('s', s)
     A.setField('N', N, dims='K')
     A.setField('x', x, dims=('K', 'D'))
     A.setField('xxT', xxT, dims=('K', 'D', 'D'))
     Abig = A.copy()
     # First remove a few fields
     for k in range(K - 1):
         A.removeComp(0)
         assert A.K == K - k - 1
         assert A.s == s
         assert np.allclose(A.getComp(0).x, x[k + 1])
         assert np.allclose(A.getComp(0).xxT, xxT[k + 1])

示例#18

0

显示文件

文件： TestParamBag.py 项目： agile-innovations/refinery

 def test_remove_K3_D2(self, K=3, D=2):
   A = ParamBag(K=K, D=D)
   s = 123
   N = np.random.rand(K)
   x = np.random.rand(K,D)
   xxT = np.random.randn(K,D,D)
   A.setField('s', s)
   A.setField('N', N, dims='K')
   A.setField('x', x, dims=('K','D'))
   A.setField('xxT', xxT, dims=('K','D','D'))
   Abig = A.copy()
   # First remove a few fields
   for k in range(K-1):
     A.removeComp(0)
     assert A.K == K - k - 1
     assert A.s == s
     assert np.allclose(A.getComp(0).x, x[k+1])
     assert np.allclose(A.getComp(0).xxT, xxT[k+1])

示例#19

0

显示文件

 def test_getComp_K1_D1(self):
     A = ParamBag(K=1, D=1)
     A.setField('scalar', 1, dims=None)
     A.setField('N', [1], dims='K')
     A.setField('x', [[1]], dims=('K', 'D'))
     c = A.getComp(0)
     assert c.K == 1
     assert c.N == A.N
     assert c.x == A.x
     assert id(c.scalar) != id(A.scalar)
     assert id(c.N) != id(A.N)
     assert id(c.x) != id(A.x)

示例#20

0

显示文件

文件： TestParamBag.py 项目： agile-innovations/refinery

 def test_removeComp_K3_D1(self):
   A = ParamBag(K=3,D=1)
   A.setField('N', [1,2,3], dims='K')
   A.setField('x', [[4],[5],[6]], dims=('K','D'))
   A.setField('W', np.ones((3,3)), dims=('K','K'))
   Aorig = A.copy()
   A.removeComp(1)
   assert Aorig.K == A.K + 1
   assert A.N[0] == Aorig.N[0]
   assert A.N[1] == Aorig.N[2]
   assert np.allclose( A.x, [[4],[6]])
   assert np.allclose(A.W, np.ones((2,2)))

示例#21

0

显示文件

文件： TestParamBag.py 项目： agile-innovations/refinery

 def test_getComp_K1_D1(self):
   A = ParamBag(K=1,D=1)
   A.setField('scalar', 1, dims=None)
   A.setField('N', [1], dims='K')
   A.setField('x', [[1]], dims=('K','D'))
   c = A.getComp(0)
   assert c.K == 1
   assert c.N == A.N
   assert c.x == A.x
   assert id(c.scalar) != id(A.scalar)
   assert id(c.N) != id(A.N)
   assert id(c.x) != id(A.x)

示例#22

0

显示文件

文件： TestParamBag.py 项目： agile-innovations/refinery

  def test_insertComps_K1_D1(self):
    A = ParamBag(K=1,D=1)
    s = 123.456
    A.setField('scalar', s, dims=None)
    A.setField('N', [1], dims='K')
    A.setField('x', [[1]], dims=('K','D'))
    A.setField('xxT', [[[1]]], dims=('K','D','D'))

    Abig = A.copy()
    Abig.insertComps(A)
    assert Abig.K == 2
    assert np.allclose(Abig.N, np.hstack([A.N, A.N]))
    assert Abig.scalar == 2*s

    Abig.insertComps(A)
    assert Abig.K == 3
    assert np.allclose(Abig.N, np.hstack([A.N, A.N, A.N]))
    assert Abig.scalar == 3*s

    A.insertComps(Abig)
    assert A.K == 4
    assert A.scalar == 4*s
    assert np.allclose(A.N, np.hstack([1,1,1,1]))

示例#23

0

显示文件

文件： TestParamBag.py 项目： agile-innovations/refinery

 def test_removeComp_K1_D1(self):
   A = ParamBag(K=1,D=1)
   A.setField('N', [1], dims='K')
   A.setField('x', [[1]], dims=('K','D'))
   with self.assertRaises(ValueError):
     A.removeComp(0)

示例#24

0

显示文件

文件： SuffStatBag.py 项目： vishalbelsare/bnpy

class SuffStatBag(object):

    """ Container object for additive sufficient statistics in bnpy.

    Uses ParamBag as internal representation.

    Attributes
    ----------
    * K : int
        number of components
    * uids : 1D array, size K
        unique ids of the components
    * _Fields : ParamBag
        track relevant values
    * _ELBOTerms : optional ParamBag, default does not exist
        precomputed ELBO terms
    * _MergeTerms : optional ParamBag, default does not exist
        precomputed terms for candidate merges
    * xSS : optional dict of SuffStatBags, default does not exist
        keys of the dict are uids
    """

    def __init__(self, K=0, uids=None, **kwargs):
        '''

        Post Condition
        ---------------
        Creates an empty SuffStatBag object,
        with valid values of uids and K.
        '''
        self._Fields = ParamBag(K=K, **kwargs)
        if uids is None:
            self.uids = np.arange(K, dtype=np.int32)
        else:
            self.uids = np.asarray(uids, dtype=np.int32).copy()
        self._kwargs = kwargs

    def setUIDs(self, uids):
        ''' Set the unique comp ids to new values.

        Post Condition
        --------------
        Attribute uids updated if provided array-like was valid.
        '''
        if len(uids) != self.K:
            emsg = 'Bad uids. Expected length %d, got %d.' % (
                self.K, len(uids))
            raise ValueError(emsg)
        self.uids = np.asarray(uids, dtype=np.int32)

    def setMergeUIDPairs(self, mUIDPairs):
        self.mUIDPairs = np.asarray(mUIDPairs, dtype=np.int32).copy()
        if self.mUIDPairs.ndim < 2:
            self.mUIDPairs = self.mUIDPairs[np.newaxis,:]
        assert self.mUIDPairs.ndim == 2
        assert self.mUIDPairs.shape[1] == 2
        M = self.mUIDPairs.shape[0]
        self._kwargs['M'] = M
        self._Fields.M = M
        if self.hasELBOTerms():
            self._ELBOTerms.M = M
        if self.hasMergeTerms():
            self._MergeTerms.M = M

    def uid2k(self, uid):
        ''' Indentify the position index of provided uid.

        Returns
        -------
        k : int
        '''
        k = np.flatnonzero(self.uids == uid)
        if k.size < 1:
            raise ValueError('Cannot find uid %d' % (uid))
        elif k.size > 1:
            raise ValueError('Badness. Multiple copies of uid %d' % (uid))
        return int(k[0])

    def getCountVec(self):
        ''' Return vector of counts for each active topic/component
        '''
        if 'N' in self._Fields._FieldDims:
            if self._Fields._FieldDims['N'] == ('K','K'):
                return self.N.sum(axis=0) # relational models
            else:
                return self.N
        elif 'SumWordCounts' in self._Fields._FieldDims:
            return self.SumWordCounts
        raise ValueError('Counts not available')

    def getCountForUID(self, uid=None):
        ''' Return count for specified unique cluster id.

        Returns
        -------
        Count : scalar real value. Non-negative.
        '''
        k = self.uid2k(uid)
        if 'N' in self._Fields._FieldDims:
            return self.N[k]
        elif 'SumWordCounts' in self._Fields._FieldDims:
            return self.SumWordCounts[k]

    def copy(self, includeELBOTerms=True, includeMergeTerms=True):
        if not includeELBOTerms:
            E = self.removeELBOTerms()
        if not includeMergeTerms:
            M = self.removeMergeTerms()
        copySS = copy.deepcopy(self)
        if not includeELBOTerms:
            self.restoreELBOTerms(E)
        if not includeMergeTerms:
            self.restoreMergeTerms(M)
        return copySS

    def setField(self, key, value, dims=None):
        ''' Set named field to provided array-like value.

        Thin wrapper around ParamBag's setField method.
        '''
        self._Fields.setField(key, value, dims=dims)

    def setAllFieldsToZeroAndRemoveNonELBOTerms(self):
        ''' Fill all arrays in _Fields to zeroes and remove merge terms.
        '''
        self._Fields.setAllFieldsToZero()
        self.setELBOFieldsToZero()
        self.removeMergeTerms()
        self.removeSelectionTerms()

    def setELBOFieldsToZero(self):
        if self.hasELBOTerms():
            self._ELBOTerms.setAllFieldsToZero()

    def setMergeFieldsToZero(self):
        if self.hasMergeTerms():
            self._MergeTerms.setAllFieldsToZero()
        if hasattr(self, 'mUIDPairs'):
            delattr(self, 'mUIDPairs')

    def reorderComps(self, order=None, uids=None,
                     fieldsToIgnore=['sumLogPiRemVec']):
        ''' Rearrange internal order of components.
        '''
        if uids is not None:
            uids = np.asarray(uids, dtype=np.int32)
            order = np.zeros_like(uids)
            for pos in range(uids.size):
                order[pos] = self.uid2k(uids[pos])
        else:
            order = np.asarray(order, dtype=np.int32)
        assert self.K == order.size
        assert hasattr(self, 'uids')
        self.uids = self.uids[order]
        assert self.uids.size == order.size
        self._Fields.reorderComps(order, fieldsToIgnore)
        if hasattr(self, 'mUIDPairs'):
            del self.mUIDPairs
        if self.hasELBOTerms():
            self._ELBOTerms.reorderComps(order)
        if self.hasMergeTerms():
            self._MergeTerms.reorderComps(order)
        if self.hasSelectionTerms():
            self._SelectTerms.reorderComps(order)

    def removeField(self, key):
        return self._Fields.removeField(key)

    def removeELBOandMergeTerms(self):
        E = self.removeELBOTerms()
        M = self.removeMergeTerms()
        return E, M

    def restoreELBOandMergeTerms(self, E, M):
        self.restoreELBOTerms(E)
        self.restoreMergeTerms(M)

    def removeELBOTerms(self):
        if not self.hasELBOTerms():
            return None
        _ELBOTerms = self._ELBOTerms
        del self._ELBOTerms
        return _ELBOTerms

    def removeMergeTerms(self):
        if hasattr(self, 'mUIDPairs'):
            del self.mUIDPairs
        if hasattr(self._Fields, 'M'):
            del self._Fields.M
        if not self.hasMergeTerms():
            return None
        MergeTerms = self._MergeTerms
        del self._MergeTerms
        return MergeTerms

    def restoreELBOTerms(self, ELBOTerms):
        if ELBOTerms is not None:
            self._ELBOTerms = ELBOTerms

    def restoreMergeTerms(self, MergeTerms):
        if MergeTerms is not None:
            self._MergeTerms = MergeTerms

    def removeSelectionTerms(self):
        if not self.hasSelectionTerms():
            return None
        STerms = self._SelectTerms
        del self._SelectTerms
        return STerms

    def restoreSelectionTerms(self, STerms):
        if STerms is not None:
            self._SelectTerms = STerms

    def hasAmpFactor(self):
        return hasattr(self, 'ampF')

    def applyAmpFactor(self, ampF):
        self.ampF = ampF
        for key in self._Fields._FieldDims:
            arr = getattr(self._Fields, key)
            if arr.ndim == 0:
                # Edge case: in-place updates don't work with
                # de-referenced 0-d arrays
                setattr(self._Fields, key, arr * ampF)
            else:
                arr *= ampF

    def hasELBOTerms(self):
        return hasattr(self, '_ELBOTerms')

    def hasELBOTerm(self, key):
        if not hasattr(self, '_ELBOTerms'):
            return False
        return hasattr(self._ELBOTerms, key)

    def getELBOTerm(self, key):
        return getattr(self._ELBOTerms, key)

    def setELBOTerm(self, key, value, dims=None):
        if not hasattr(self, '_ELBOTerms'):
            self._ELBOTerms = ParamBag(K=self.K, **self._kwargs)
        self._ELBOTerms.setField(key, value, dims=dims)

    def hasMergeTerms(self):
        return hasattr(self, '_MergeTerms')

    def hasMergeTerm(self, key):
        if not hasattr(self, '_MergeTerms'):
            return False
        return hasattr(self._MergeTerms, key)

    def getMergeTerm(self, key):
        return getattr(self._MergeTerms, key)

    def setMergeTerm(self, key, value, dims=None):
        if not hasattr(self, '_MergeTerms'):
            self._MergeTerms = ParamBag(K=self.K, **self._kwargs)
        self._MergeTerms.setField(key, value, dims=dims)

    def hasSelectionTerm(self, key):
        if not hasattr(self, '_SelectTerms'):
            return False
        return hasattr(self._SelectTerms, key)

    def hasSelectionTerms(self):
        return hasattr(self, '_SelectTerms')

    def getSelectionTerm(self, key):
        return getattr(self._SelectTerms, key)

    def setSelectionTerm(self, key, value, dims=None):
        if not hasattr(self, '_SelectTerms'):
            self._SelectTerms = ParamBag(K=self.K)
        self._SelectTerms.setField(key, value, dims=dims)

    def insertComps(self, SS):
        self._Fields.insertComps(SS)
        self.uids = np.hstack([self.uids, SS.uids])
        if hasattr(self, '_ELBOTerms'):
            if SS.hasELBOTerms():
                self._ELBOTerms.insertComps(SS._ELBOTerms)
            else:
                self._ELBOTerms.insertEmptyComps(SS.K)
        if SS.hasMergeTerms():
            if self.hasMergeTerms():
                self._MergeTerms.insertComps(SS._MergeTerms)
            else:
                self._MergeTerms = SS._MergeTerms.copy()
                self._MergeTerms.K = self.K
        elif self.hasMergeTerms():
            self._MergeTerms.K = self.K
        if hasattr(self, '_SelectTerms'):
            self._SelectTerms.insertEmptyComps(SS.K)

    def insertEmptyComps(self, Kextra, newuids=None):
        if newuids is None:
            uidstart = self.uids.max() + 1
            newuids = np.arange(uidstart, uidstart + Kextra)
        self._Fields.insertEmptyComps(Kextra)
        self.uids = np.hstack([self.uids, newuids])
        if hasattr(self, '_ELBOTerms'):
            self._ELBOTerms.insertEmptyComps(Kextra)
        if hasattr(self, '_MergeTerms'):
            self._MergeTerms.insertEmptyComps(Kextra)
        if hasattr(self, '_SelectTerms'):
            self._SelectTerms.insertEmptyComps(Kextra)

    def removeComp(self, k=None, uid=None):
        ''' Remove any value associated with index k from tracked values.
        '''
        if k is None and uid is not None:
            k = self.uid2k(uid)
        self.uids = np.delete(self.uids, k)
        self._Fields.removeComp(k)
        if hasattr(self, '_ELBOTerms'):
            self._ELBOTerms.removeComp(k)
        if hasattr(self, '_MergeTerms'):
            self._MergeTerms.removeComp(k)
        if hasattr(self, '_SelectTerms'):
            self._SelectTerms.removeComp(k)

    def getComp(self, k, doCollapseK1=True):
        SS = SuffStatBag(K=1, D=self.D)
        SS._Fields = self._Fields.getComp(k, doCollapseK1=doCollapseK1)
        return SS

    def findMergePairByUID(self, uidA, uidB):
        ''' Find which currently tracked merge pair contains desired uids.

        Returns
        -------
        rowID : int
            index of tracked merge quantities related to specific uid pair.
        '''
        assert hasattr(self, 'mUIDPairs')
        rowID = np.flatnonzero(
            np.logical_and(uidA == self.mUIDPairs[:, 0],
                           uidB == self.mUIDPairs[:, 1]))
        if not rowID.size == 1:
            raise ValueError(
                'Bad search for correct merge UID pair.\n' + str(rowID))
        rowID = rowID[0]
        return rowID

    def mergeComps(self, kA=None, kB=None, uidA=None, uidB=None,
                   fieldsToIgnore=['sumLogPiRemVec'], **kwargs):
        ''' Merge components kA, kB into a single component, in-place.

        Post Condition
        --------------
        This SuffStatBag will have K-1 states, one less than before the call.
        All fields related to [kA] will have values combined with [kB].
        All fields related to [kB] will then be removed/deleted.
        '''
        if self.K <= 1:
            raise ValueError('Must have at least 2 components to merge.')

        if kA is None or kB is None:
            kA = self.uid2k(uidA)
            kB = self.uid2k(uidB)
            #kA = np.flatnonzero(self.uids == uidA)
            #kB = np.flatnonzero(self.uids == uidB)
        else:
            uidA = self.uids[kA]
            uidB = self.uids[kB]
        assert kA is not None
        assert kB is not None

        if kB == kA:
            raise ValueError('Distinct component ids required.')

        # Find the right row that corresponds to input kA, kB
        if hasattr(self, 'mUIDPairs'):
            rowID = self.findMergePairByUID(uidA, uidB)
        else:
            rowID = None

        # Fill entry [kA] of each field with correct value.
        self._mergeFieldsAtIndexKA(kA, kB, rowID, fieldsToIgnore)
        # Fill entry [kA] of each elboterm with correct value.
        self._mergeELBOTermsAtIndexKA(kA, kB, rowID)

        self._setMergeTermsAtIndexKAToNaN(kA, kB, rowID)

        self._mergeSelectionTermsAtIndexKA(kA, kB, rowID)

        self._discardAnyTrackedPairsThatOverlapWithAorB(uidA, uidB)
        self.uids = np.delete(self.uids, kB)
        assert uidA in self.uids
        assert uidB not in self.uids

        # Finally, remove dimension kB from all fields
        Stash = dict()
        for key in fieldsToIgnore:
            if key in self._Fields._FieldDims:
                arr, dims = self.removeField(key)
                Stash[key] = arr, dims
        self._Fields.removeComp(kB)
        # Reset ignored field 'sumLogPiRemVec'
        for key in Stash:
            arr, dims = Stash[key]
            self.setField(key, arr[1:], dims)

        if self.hasELBOTerms():
            self._ELBOTerms.removeComp(kB)
        if self.hasMergeTerms():
            self._MergeTerms.removeComp(kB)
        if self.hasSelectionTerms():
            self._SelectTerms.removeComp(kB)

    def _discardAnyTrackedPairsThatOverlapWithAorB(self, uidA, uidB):
        ''' Update to discard remaining pairs that overlap uidA/uidB.

        Post Condition
        --------------
        Attributes mUIDPairs and _MergeTerms dont have any more info
        about other pairs (uidj,uidk) where where uidA or uidB are involved.
        '''
        if hasattr(self, 'mUIDPairs'):
            mUIDPairs = self.mUIDPairs
            # Remove any other pairs associated with kA or kB
            keepRowIDs = ((mUIDPairs[:, 0] != uidA) *
                          (mUIDPairs[:, 1] != uidA) *
                          (mUIDPairs[:, 0] != uidB) *
                          (mUIDPairs[:, 1] != uidB))
            keepRowIDs = np.flatnonzero(keepRowIDs)
            self.setMergeUIDPairs(mUIDPairs[keepRowIDs])

            # Remove any other pairs related to kA, kB
            if self.hasMergeTerms():
                for key, dims in list(self._MergeTerms._FieldDims.items()):
                    mArr = getattr(self._MergeTerms, key)
                    if dims[0] == 'M':
                        mArr = mArr[keepRowIDs]
                        self._MergeTerms.setField(key, mArr, dims=dims)

    def _mergeFieldsAtIndexKA(self, kA, kB, rowID, fieldsToIgnore):
        ''' For each field, rewrite values for comp kA to merge kA, kB.

        Post Condition
        --------------
        Every key, arr pair in _Fields will have size K, as before.
        The array will have entries related to component kA overwritten.
        '''
        for key, dims in list(self._Fields._FieldDims.items()):
            if key in fieldsToIgnore:
                continue
            if dims is not None and dims != ():
                # Get numpy array object for field named by key
                arr = getattr(self._Fields, key)
                assert arr.ndim >= 1

                # Now edit this array in place
                if self.hasMergeTerm(key) and dims == ('K'):
                    mArr = getattr(self._MergeTerms, key)
                    mdims = self._MergeTerms._FieldDims[key]
                    # Use precomputed term stored under _MergeTerms
                    if mdims == ('M'):
                        arr[kA] = mArr[rowID]
                    else:
                        arr[kA] = mArr[kA, kB]
                elif dims == ('K', 'K'):
                    # Special logic for HMM transition matrix
                    arr[kA] += arr[kB]
                    arr[:, kA] += arr[:, kB]
                elif dims[0] == 'K':
                    # applies to vast majority of all fields
                    arr[kA] += arr[kB]
                elif len(dims) > 1 and dims[1] == 'K':
                    arr[:, kA] += arr[:, kB]

    def _mergeELBOTermsAtIndexKA(self, kA, kB, rowID):
        ''' For each ELBOterm, rewrite values for comp kA to merge kA, kB.

        Post Condition
        --------------
        Every key, arr pair in _ELBOTerms will have size K, as before.
        The array will have entries related to component kA overwritten.
        '''
        if self.hasELBOTerms():
            for key, dims in list(self._ELBOTerms._FieldDims.items()):
                if not self.hasMergeTerm(key):
                    continue

                arr = getattr(self._ELBOTerms, key)
                mArr = getattr(self._MergeTerms, key)
                mdims = self._MergeTerms._FieldDims[key]

                if mdims[0] == 'M':
                    if rowID is None:
                        raise ValueError("Badness: rowID is None." +
                            "Probably forget to call setMergeUIDPairs()")
                    if mArr.ndim == 3 and mArr.shape[1] == 2:
                        arr[kA, :] = mArr[rowID, 0]
                        arr[:, kA] = mArr[rowID, 1]
                    elif mArr.ndim <= 1:
                        arr[kA] = mArr[rowID]
                    else:
                        raise NotImplementedError('TODO')

                elif dims[0] == 'K':
                    if mArr.ndim == 2:
                        arr[kA] = mArr[kA, kB]
                    else:
                        arr[kA] += mArr[kB]

    def _setMergeTermsAtIndexKAToNaN(self, kA, kB, rowID):
        ''' Make terms tracked for kA incompatible for future merges.
        '''
        if self.hasMergeTerms():
            for key, dims in list(self._MergeTerms._FieldDims.items()):
                mArr = getattr(self._MergeTerms, key)
                if dims == ('K', 'K'):
                    mArr[kA, kA + 1:] = np.nan
                    mArr[:kA, kA] = np.nan
                elif dims == ('K'):
                    mArr[kA] = np.nan
                elif dims[0] == 'M':
                    if len(dims) == 3 and dims[-1] == 'K' and key == 'Htable':
                        mArr[:, :, kA] = 0
                    else:
                        mArr[rowID] = 0

    def _mergeSelectionTermsAtIndexKA(self, kA, kB, rowID):
        ''' Update terms at index kA.
        '''
        if self.hasSelectionTerms():
            for key, dims in list(self._SelectTerms._FieldDims.items()):
                mArr = getattr(self._SelectTerms, key)
                if dims == ('K', 'K'):
                    ab = mArr[kB, kB] + 2 * mArr[kA, kB] + mArr[kA, kA]
                    mArr[kA, :] += mArr[kB, :]
                    mArr[:, kA] += mArr[:, kB]
                    mArr[kA, kA] = ab
                elif dims == ('K'):
                    mArr[kA] = mArr[kA] + mArr[kB]


    def replaceCompsWithContraction(self,
            removeUIDs=[],
            replaceUIDs=[],
            replaceSS=None,
            keysToSetNonExtraZero=['sumLogPiRemVec']):
        ''' Replace existing clusters and remove others.

        Post Condition
        --------------
        Values associated with uids in replaceUIDs are copied from replaceSS.
        Values associated with uids in removeUIDs are removed.

        Examples
        --------
        >>> SS = SuffStatBag(K=5, D=2)
        >>> SS.setField('x', 10 + np.tile(np.arange(5), (2,1)).T, dims=('K','D'))
        >>> SS.setELBOTerm('Hresp', np.ones(5), dims='K')
        >>> print (SS.uids)
        [0 1 2 3 4]
        >>> print (SS.x)
        [[10. 10.]
         [11. 11.]
         [12. 12.]
         [13. 13.]
         [14. 14.]]
        >>> replaceSS = SuffStatBag(K=2, D=2)
        >>> replaceSS.setUIDs([1,2])
        >>> rx = SS.x[replaceSS.uids] + 0.5*SS.x[3][np.newaxis,:]
        >>> replaceSS.setField('x', rx, dims=('K','D'))
        >>> replaceSS.setELBOTerm('Hresp', 2*np.ones(2), dims='K')
        >>> SS.replaceCompsWithContraction(\
            removeUIDs=[3], replaceUIDs=[1,2], replaceSS=replaceSS)
        >>> print (SS.getELBOTerm('Hresp'))
        [1. 2. 2. 1.]
        >>> print (SS.x)
        [[10.  10. ]
         [17.5 17.5]
         [18.5 18.5]
         [14.  14. ]]
        >>> print (SS.uids)
        [0 1 2 4]
        '''
        intersectUIDs = np.intersect1d(replaceSS.uids, self.uids)
        if intersectUIDs.size < replaceSS.uids.size:
            raise ValueError("Cannot replace unfamiliar uids")

        replace_ids = []
        for uid in replaceUIDs:
            replace_ids.append(self.uid2k(uid))

        for key, dims in list(self._Fields._FieldDims.items()):
            if dims is None:
                continue
            assert dims[0] == 'K' and 'K' not in dims[1:]
            arr = getattr(self._Fields, key)
            arr[replace_ids] = getattr(replaceSS._Fields, key)

        if self.hasELBOTerms():
            for key, dims in list(self._ELBOTerms._FieldDims.items()):
                if dims is None:
                    continue
                assert dims[0] == 'K' and 'K' not in dims[1:]
                arr = getattr(self._ELBOTerms, key)
                arr[replace_ids] = replaceSS.getELBOTerm(key)

        for uid in removeUIDs:
            self.removeComp(uid=uid)

    def replaceCompWithExpansion(self, uid=0, xSS=None,
                                 keysToSetNonExtraZero=['sumLogPiRemVec']):
        ''' Replace existing component with expanded set of statistics.

        Post Condition
        --------------
        Values associated with uid are removed.
        All entries of provided xSS are added last in index order.
        '''
        if not np.intersect1d(xSS.uids, self.uids).size == 0:
            raise ValueError("Cannot expand with same uids.")

        for key in self._Fields._FieldDims:
            if key in keysToSetNonExtraZero:
                arr = getattr(self._Fields, key)
                arr.fill(0)

        if hasattr(xSS, 'mUIDPairs'):
            assert not self.hasMergeTerms()
            self.setMergeUIDPairs(xSS.mUIDPairs)
        self.insertComps(xSS)
        self.removeComp(uid=uid)

    def transferMassFromExistingToExpansion(self, uid=0, xSS=None):
        ''' Transfer mass from existing component to expansion components.

        Post Condition
        --------------
        All entries of provided xSS are added last in index order.
        All fields associated with uid are decremented by xSS's contents.
        '''
        if not np.intersect1d(xSS.uids, self.uids).size == 0:
            raise ValueError("Cannot expand with same uids.")
        k = self.uid2k(uid)

        # Decrement Fields terms
        for key, dims in list(self._Fields._FieldDims.items()):
            arr = getattr(self._Fields, key)
            if dims is None:
                pass
            elif dims == ('K', 'K'):
                raise NotImplementedError('TODO')
            elif dims[0] == 'K':
                if key == 'sumLogPiRemVec':
                    arr[-1] -= getattr(xSS, key).sum(axis=0)
                elif hasattr(xSS, key + 'EmptyComp'):
                    arr[k] += getattr(xSS, key + 'EmptyComp')
                else:
                    arr[k] -= getattr(xSS, key).sum(axis=0)
        # Decrement ELBO terms
        for key, dims in list(self._ELBOTerms._FieldDims.items()):
            arr = getattr(self._ELBOTerms, key)
            if dims is None:
                pass
            elif dims == ('K', 'K'):
                raise NotImplementedError('TODO')
            elif dims[0] == 'K':
                if hasattr(xSS._ELBOTerms, key + 'EmptyComp'):
                    arr[k] += getattr(xSS._ELBOTerms, key + 'EmptyComp')
                else:
                    raise ValueError("All K-dim ELBO fields need emptycomp!")
        # Insert the expansion stats at indices K, K+1, ...
        self.insertComps(xSS)

    def __add__(self, PB):
        if self.K != PB.K or self.D != PB.D:
            raise ValueError('Dimension mismatch')
        if not np.allclose(self.uids, PB.uids):
            raise ValueError('Cannot combine stats for differing uids.')
        SSsum = SuffStatBag(K=self.K, D=self.D, uids=self.uids)
        SSsum._Fields = self._Fields + PB._Fields
        if hasattr(self, '_ELBOTerms') and hasattr(PB, '_ELBOTerms'):
            SSsum._ELBOTerms = self._ELBOTerms + PB._ELBOTerms
        elif hasattr(PB, '_ELBOTerms'):
            SSsum._ELBOTerms = PB._ELBOTerms.copy()
        if hasattr(self, '_MergeTerms') and hasattr(PB, '_MergeTerms'):
            SSsum._MergeTerms = self._MergeTerms + PB._MergeTerms
        elif hasattr(PB, '_MergeTerms'):
            SSsum._MergeTerms = PB._MergeTerms.copy()
        if hasattr(self, '_SelectTerms') and hasattr(PB, '_SelectTerms'):
            SSsum._SelectTerms = self._SelectTerms + PB._SelectTerms
        if not hasattr(self, 'mUIDPairs') and hasattr(PB, 'mUIDPairs'):
            self.setMergeUIDPairs(PB.mUIDPairs)
        return SSsum

    def __iadd__(self, PB):
        if self.K != PB.K or self.D != PB.D:
            raise ValueError('Dimension mismatch')
        if not np.allclose(self.uids, PB.uids):
            raise ValueError('Cannot combine stats for differing uids.')
        self._Fields += PB._Fields
        if hasattr(self, '_ELBOTerms') and hasattr(PB, '_ELBOTerms'):
            self._ELBOTerms += PB._ELBOTerms
        elif hasattr(PB, '_ELBOTerms'):
            self._ELBOTerms = PB._ELBOTerms.copy()
        if hasattr(self, '_MergeTerms') and hasattr(PB, '_MergeTerms'):
            self._MergeTerms += PB._MergeTerms
        elif hasattr(PB, '_MergeTerms'):
            self._MergeTerms = PB._MergeTerms.copy()
        if hasattr(self, '_SelectTerms') and hasattr(PB, '_SelectTerms'):
            self._SelectTerms += PB._SelectTerms
        if not hasattr(self, 'mUIDPairs') and hasattr(PB, 'mUIDPairs'):
            self.setMergeUIDPairs(PB.mUIDPairs)
        return self

    def __sub__(self, PB):
        if self.K != PB.K or self.D != PB.D:
            raise ValueError('Dimension mismatch')
        if not np.allclose(self.uids, PB.uids):
            raise ValueError('Cannot combine stats for differing uids.')
        SSsum = SuffStatBag(K=self.K, D=self.D, uids=self.uids)
        SSsum._Fields = self._Fields - PB._Fields
        if hasattr(self, '_ELBOTerms') and hasattr(PB, '_ELBOTerms'):
            SSsum._ELBOTerms = self._ELBOTerms - PB._ELBOTerms
        if hasattr(self, '_MergeTerms') and hasattr(PB, '_MergeTerms'):
            SSsum._MergeTerms = self._MergeTerms - PB._MergeTerms
        return SSsum

    def __isub__(self, PB):
        if self.K != PB.K or self.D != PB.D:
            raise ValueError('Dimension mismatch')
        if not np.allclose(self.uids, PB.uids):
            raise ValueError('Cannot combine stats for differing uids.')
        self._Fields -= PB._Fields
        if hasattr(self, '_ELBOTerms') and hasattr(PB, '_ELBOTerms'):
            self._ELBOTerms -= PB._ELBOTerms
        if hasattr(self, '_MergeTerms') and hasattr(PB, '_MergeTerms'):
            self._MergeTerms -= PB._MergeTerms
        return self

    def __getattr__(self, key):
        _Fields = object.__getattribute__(self, "_Fields")
        _dict = object.__getattribute__(self, "__dict__")
        if key == "_Fields":
            return _Fields
        elif hasattr(_Fields, key):
            return getattr(_Fields, key)
        elif key == '__deepcopy__':  # workaround to allow copying
            return None
        elif key in _dict:
            return _dict[key]
        # Field named 'key' doesnt exist.
        errmsg = "'SuffStatBag' object has no attribute '%s'" % (key)
        raise AttributeError(errmsg)

    """

示例#25

0

显示文件

 def test_removeComp_K1_D1(self):
     A = ParamBag(K=1, D=1)
     A.setField('N', [1], dims='K')
     A.setField('x', [[1]], dims=('K', 'D'))
     with self.assertRaises(ValueError):
         A.removeComp(0)