Exemplos de log_sum_exp em Python, exemplos de com.ibeifeng.hmm2.common.log_sum_exp em Python

Exemplo n.º 1

0

Exibir arquivo

def calc_gamma(alpha, beta, gamma):
    """
    根据alphe和beta的值计算gamma值
    最终结果保存在gamma矩阵中
    :param alpha: 传入的alpha矩阵 => 经过log转换后的
    :param beta:  传入的beta矩阵 => 经过log转换后的
    :param gamma: 传入的gamma矩阵，需要进行更新，最终结果是经过log转换后的
    :return: gamma矩阵
    """
    # 1. 获取相关变量
    T, n = np.shape(alpha)

    # 2. 遍历更新
    for t in range(T):
        # 2.1. 累加alpha和beta值(ppt上分子部分)
        for i in range(n):
            gamma[t][i] = alpha[t][i] + beta[t][i]

        # 2.2. 计算log_sum_exp的值（ppt上分母部分）
        lse = log_sum_exp(gamma[t])

        # 2.3. 计算最终结果
        for i in range(n):
            gamma[t][i] -= lse

    # 3. 返回最终结果
    return gamma

Exemplo n.º 2

0

Exibir arquivo

def calc_alpha(pi, A, B, Q, alpha, fetch_index_by_obs_seq=None):
    """
    计算前向概率α的值
    :param pi: 初始的状态随机概率矩阵, n*1 => 经过对数转换
    :param A:  状态转移矩阵, n*n => 经过对数转换
    :param B:  状态和观测值之间的转移矩阵, n*m => 经过对数转换
    :param Q:  观测值序列, 长度为T
    :param alpha:  前向概率矩阵
    :param fetch_index_by_obs_seq: 根据序列获取对应的索引值，可以为None；是一个接受两个参数的函数，第一个参数为序列，第二个参数为索引值
    :return:  返回alpha矩阵同时也更新传入的alpha矩阵参数
    """
    # 1. 初始化
    fetch_index_by_obs_seq_f = fetch_index_by_obs_seq
    if fetch_index_by_obs_seq_f is None:
        # 默认是使用ord函数将对应位置的字符转换为ASCII码，eg: ord('a')=97; ord('中')=20013
        fetch_index_by_obs_seq_f = lambda obs, obs_index: ord(obs[obs_index])

    # 2. 获取相关变量
    n = np.shape(A)[0]
    T = len(Q)

    # 3. 更新t=1时刻(初始时刻)对应的前向概率值
    for i in range(n):
        alpha[0][i] = pi[i] + B[i][fetch_index_by_obs_seq_f(Q, 0)]

    # 4. 更新t=2,3....T时刻对应的前向概率值
    tmp = [0 for i in range(n)]
    for t in range(1, T):
        # TODO: 开始更新时刻t、状态为i的前向概率值
        for i in range(n):
            # 4.1. 计算累加值
            for j in range(n):
                tmp[j] = alpha[t - 1][j] + A[j][i]

            # 4.2. 计算log_sum_exp的值
            alpha[t][i] = log_sum_exp(tmp)

            # 4.3. 累加状态和观测值之间的转移矩阵
            alpha[t][i] += B[i][fetch_index_by_obs_seq_f(Q, t)]

    # 5. 返回最终返回值
    return alpha

Exemplo n.º 3

0

Exibir arquivo

def calc_beta(pi, A, B, Q, beta, fetch_index_by_obs_seq=None):
    """
    计算后向概率β的值
    :param pi: 初始的状态随机概率矩阵, n*1 => 经过对数转换
    :param A:  状态转移矩阵, n*n => 经过对数转换
    :param B:  状态和观测值之间的转移矩阵, n*m => 经过对数转换
    :param Q:  观测值序列, 长度为T
    :param beta: 后向概率矩阵
    :param fetch_index_by_obs_seq: 根据序列获取对应的索引值，可以为None；是一个接受两个参数的函数，第一个参数为序列，第二个参数为索引值
    :return:  返回beta矩阵同时也更新传入的beta矩阵参数
    """
    # 1. 初始化
    fetch_index_by_obs_seq_f = fetch_index_by_obs_seq
    if fetch_index_by_obs_seq_f is None:
        # 默认是使用ord函数将对应位置的字符转换为ASCII码，eg: ord('a')=97; ord('中')=20013
        fetch_index_by_obs_seq_f = lambda obs, obs_index: ord(obs[obs_index])

    # 2. 获取相关变量
    n = np.shape(A)[0]
    T = len(Q)

    # 3. 更新t=T时刻(初始时刻)对应的后向概率值
    for i in range(n):
        beta[T - 1][i] = 0

    # 4. 更新t=T-1,T-2....1时刻对应的前向概率值
    tmp = [0 for i in range(n)]
    for t in range(T - 2, -1, -1):
        # TODO: 更新时刻t对应状态为i的后向概率
        for i in range(n):
            # 4.1 计算累加值
            for j in range(n):
                tmp[j] = A[i][j] + beta[t +
                                        1][j] + B[j][fetch_index_by_obs_seq_f(
                                            Q, t + 1)]

            # 4.2 计算log_sum_exp的值
            beta[t][i] = log_sum_exp(tmp)

    # 5. 结果返回
    return beta

Exemplo n.º 4

0

Exibir arquivo

def calc_ksi(alpha, beta, A, B, Q, ksi, fetch_index_by_obs_seq=None):
    """
    计算时刻t的时候状态为i，时刻t+1的时候状态为j的联合概率ksi
    :param alpha:  传入的alpha矩阵 => 经过log转换后的
    :param beta:  传入的beta矩阵 => 经过log转换后的
    :param A: 状态转移矩阵, n*n => 经过对数转换
    :param B:  状态和观测值之间的转移矩阵, n*m => 经过对数转换
    :param Q:  观测值序列, 长度为T
    :param ksi: 待求解的ksi概率矩阵，最终结果是需要经过log转换的
    :param fetch_index_by_obs_seq: 根据序列获取对应的索引值，可以为None；是一个接受两个参数的函数，第一个参数为序列，第二个参数为索引值
    :return: 返回ksi矩阵
    """
    # 1. 初始化
    # 初始化序列转换为索引的方法
    fetch_index_by_obs_seq_f = fetch_index_by_obs_seq
    if fetch_index_by_obs_seq_f is None:
        fetch_index_by_obs_seq_f = lambda obs, obs_index: ord(obs[obs_index])

    # 2. 变量获取
    T, n = np.shape(alpha)

    # 3. 开始迭代更新ksi矩阵
    tmp = np.zeros((n, n))
    for t in range(T - 1):
        # 3.1 计算t时刻状态为i，t+1时刻状态为j的概率值（ppt上的分子部分）
        for i in range(n):
            for j in range(n):
                tmp[i][j] = alpha[t][i] + A[i][j] + beta[t + 1][j] + B[j][
                    fetch_index_by_obs_seq_f(Q, t + 1)]

        # 3.2 计算log_sum_exp的值(ppt上分母部分)
        lse = log_sum_exp(tmp.flat)

        # 3.3 计算最终的结果值
        for i in range(n):
            for j in range(n):
                ksi[t][i][j] = tmp[i][j] - lse

    # 4. 返回最终结果
    ksi

Exemplo n.º 5

0

Exibir arquivo

def baum_welch(pi, A, B, Q, max_iter=10, fetch_index_by_obs_seq=None):
    """
    根据传入的初始概率矩阵(pi、A、B)以及观测序列Q，使用baum_welch算法进行迭代求解最终的pi、A、B的值；最大迭代次数默认为10；最终更新结果保存在传入的参数矩阵中(pi\A\B)
    :param pi: 初始的状态随机概率矩阵, n*1 => 经过对数转换
    :param A:  状态转移矩阵, n*n => 经过对数转换
    :param B:  状态和观测值之间的转移矩阵, n*m => 经过对数转换
    :param Q:  观测值序列, 长度为T
    :param max_iter: 最大迭代次数，默认为10
    :param fetch_index_by_obs_seq: 根据序列获取对应的索引值，可以为None；是一个接受两个参数的函数，第一个参数为序列，第二个参数为索引值
    :return:  返回(pi, A, B)
    """
    # 1. 初始化
    fetch_index_by_obs_seq_f = fetch_index_by_obs_seq
    if fetch_index_by_obs_seq_f is None:
        # 默认是使用ord函数将对应位置的字符转换为ASCII码，eg: ord('a')=97; ord('中')=20013
        fetch_index_by_obs_seq_f = lambda obs, obs_index: ord(obs[obs_index])

    # 2. 初始化相关参数
    T = len(Q)
    n = np.shape(A)[0]
    if len(np.shape(B)) == 1:
        m = 1
    else:
        m = np.shape(B)[1]
    alpha_ = np.zeros((T, n))
    beta_ = np.zeros((T, n))
    gamma_ = np.zeros((T, n))
    ksi_ = np.zeros((T - 1, n, n))

    # 3. 开始遍历求解
    for time in range(max_iter):
        # 3.1 分别计算在当前情况下的alphe、beta、gamma、ksi的值
        calc_alpha(pi, A, B, Q, alpha_, fetch_index_by_obs_seq_f)
        calc_beta(pi, A, B, Q, beta_, fetch_index_by_obs_seq_f)
        calc_gamma(alpha_, beta_, gamma_)
        calc_ksi(alpha_, beta_, A, B, Q, ksi_, fetch_index_by_obs_seq_f)

        # 3.2 更新pi的值
        for i in range(n):
            pi[i] = gamma_[0][i]

        # 3.3 更新A的值
        tmp1 = np.zeros(T - 1)  # 对应ppt上分子
        tmp2 = np.zeros(T - 1)  # 对应ppt上的分母
        for i in range(n):
            for j in range(n):
                # 3.3.1 获取所有时刻从状态i转移到状态j的概率值
                for t in range(T - 1):
                    tmp1[t] = ksi_[t][i][j]
                    tmp2[t] = gamma_[t][i]

                # 3.3.2 计算状态转移矩阵
                A[i][j] = log_sum_exp(tmp1) - log_sum_exp(tmp2)

        # 3.4 更新B的值
        tmp1 = np.zeros(T)  # 对应ppt上分子
        tmp2 = np.zeros(T)  # 对应ppt上的分母
        for i in range(n):
            for o in range(m):
                # 3.4.1 获取所有时刻位于状态i的概率
                valid = 0
                for t in range(T):
                    # a. 计算分子的值
                    if o == fetch_index_by_obs_seq_f(Q, t):
                        # 当前观测值和对应观测值一致，计算分子
                        tmp1[valid] = gamma_[t][i]
                        valid += 1
                    # b. 累积分母的值
                    tmp2[t] = gamma_[t][i]

                # 3.4.2 更新状态转移矩阵的值B
                if valid == 0:
                    # 表示没有从i和o的观测值转移矩阵
                    B[i][o] = 0
                else:
                    B[i][o] = log_sum_exp(tmp1[:valid]) - log_sum_exp(tmp2)

    # 4. 返回最终结果
    return (pi, A, B)

Exemplo n.º 6

0

Exibir arquivo

    B = np.log(B)

    Q = ['白', '黑', '白', '白', '黑']
    T = len(Q)
    n = len(A)

    print("测试前向概率计算....................")
    alpha = np.zeros((T, n))
    # 开始计算
    hmm_learn.calc_alpha(pi, A, B, Q, alpha, common.convert_obs_seq_2_index)
    # 输出最终结果
    # print(np.exp(alpha))
    print(alpha)

    # 计算最终概率值：
    p = common.log_sum_exp(alpha[T - 1].flat)
    print(Q, end="->出现的概率为:")
    print(np.exp(p))

    print("测试后向概率计算....................")
    beta = np.zeros((T, n))
    # 开始计算
    hmm_learn.calc_beta(pi, A, B, Q, beta, common.convert_obs_seq_2_index)
    # 输出最终结果
    # print(np.exp(beta))
    print(beta)

    # 计算最终概率值：
    tmp_p = np.zeros(n)
    for i in range(n):
        tmp_p[i] = pi[i] + B[i][common.convert_obs_seq_2_index(Q, 0)] + beta[0][i]