Skip to content

zslyre/statsmodels

 
 

Repository files navigation

为什么翻译

本人会计出身,转行数据分析(更多是用excel、sql、spss等工具),30岁开始入坑python,在学习statsmodels包的过程中,在知乎、百度、CSDN和github上均没有找到statsmodels的中文文档,一开始以为 ApacheCN 开源组织(号称一群有想法,爱装逼,爱斗图,有活力,爱搞事,爱吃辣条的朋友)已经翻译了该包的文档,最后发现他们只是翻译该文档的目录,为了更好地入坑,我只好用我那拙劣的英语、再加上谷歌翻译,苦逼的翻译2周,也仅仅是把docs文件夹下的文件翻译完(未校验),水平有限,请大家多担待。翻译这个活没有什么技术可言,但真的很苦逼。所以真的非常的感谢 ApacheCN 开源组织在我学习的过程中贡献的各种中文文档,非常感谢!

关于统计模型

statsmodels是一个Python软件包,为scipy提供了补充,以进行统计计算,包括描述性统计以及统计模型的估计和推断。

statsmodels主要包括如下子模块:

回归模型:线性回归,广义线性模型,稳健的线性模型,线性混合效应模型等等。

方差分析(ANOVA)。

时间序列分析:AR,ARMA,ARIMA,VAR和其它模型。

非参数方法: 核密度估计,核回归。

统计模型结果可视化。

比较:statsmodels更关注统计推断,提供不确定估计和参数p-value。相反的,scikit-learn注重预测。

主要特点

  • 线性回归模型:
    • 普通最小二乘法
    • 广义最小二乘法
    • 加权最小二乘法
    • 具有自回归误差的最小二乘
    • 分位数回归
    • 递归最小二乘法
  • 具有混合效应和方差成分的混合线性模型
  • GLM:支持所有单参数指数族分布的广义线性模型
  • 用于二项式和泊松的贝叶斯混合GLM
  • GEE:单向聚类或纵向数据的广义估计方程
  • 离散模型:
    • Logit 和 Probit
    • 多项 logit (MNLogit)
    • 泊松和广义泊松回归
    • 负二项式回归
    • 零膨胀计数模型
  • RLM: 鲁棒的线性模型,支持多个 M 估计器。
  • 时间序列分析:时间序列分析模型
    • 完整的StateSpace建模框架
      • 季节性ARIMA和ARIMAX模型
      • VARMA和VARMAX模型
      • 动态因子模型
      • 未观测到的组件模型
    • 马尔可夫切换模型(MSAR),也称为隐马尔可夫模型(HMM)
    • 单变量时间序列分析:AR,ARIMA
    • 矢量自回归模型,VAR和结构VAR
    • 矢量误差修正模型,VECM
    • 指数平滑,Holt-Winters
    • 时间序列的假设检验:单位根,协整和其他
    • 用于时间序列分析的描述性统计数据和过程模型
  • 生存分析:
    • 比例风险回归(Cox模型)
    • 生存者函数估计(Kaplan-Meier)
    • 累积发生率函数估计
  • 多变量:
    • 缺失数据的主成分分析
    • 旋转因子分析
    • MANOVA
    • 典型相关
  • 非参数统计:单变量和多变量核密度估计
  • 数据集:用于示例和测试的数据集
  • 统计:广泛的统计检验
    • 诊断和规格检验
    • 拟合优度和正态性检验
    • 多元测试函数
    • 各种其他统计检验
  • 使用MICE进行插补,秩序统计回归和高斯插补
  • 调解分析
  • 图形包括用于数据和模型结果的可视化分析的绘图功能
  • 输入/输出
    • 用于读取Stata .dta文件的工具,但pandas具有较新的版本
    • 表输出到ascii,latex和html
  • 其他模型
  • Sandbox:statsmodels包含一个 sandbox 文件夹,其中包含处于开发和测试各个阶段的代码, 因此不被视为“生产就绪”。其中包括:
    • 广义矩法(GMM)估计器
    • 核回归
    • scipy.stats.distributions的各种扩展
    • 面板数据模型
    • 信息理论测度

如何获得

GitHub上的master分支是最新的代码

https://www.github.com/statsmodels/statsmodels

发行标签的源代码下载可在GitHub上获得

https://github.com/statsmodels/statsmodels/tags

二进制文件和源代码发行版可从PyPi获得

https://pypi.org/project/statsmodels/

二进制文件可以安装在Anaconda中

conda install statsmodels

About

Statsmodels: statistical modeling and econometrics in Python

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages

  • Python 93.8%
  • AGS Script 3.5%
  • HTML 1.1%
  • R 0.8%
  • Stata 0.5%
  • Fortran 0.1%
  • Other 0.2%