首页 > TAG信息列表 > statsmodels

调整ARIMA进行预测:Python中的简单方法

这篇文章将介绍一种直截了当的方法,可以估计与最先进的手动方法接近的参数。 我们将使用贝叶斯优化方法(Mango)在短短200次迭代中从108,000个可能选项中搜索最佳参数。 ARIMA时间序列预测模型非常适合具有趋势和季节性的序列。这是一个被广泛采用的经典模型,通常作为基准现代深度

VS code运行python 机器学习代码

标题 问题描述运行报错截图存在的问题解决办法1、消除输出控制台乱码2、消除找不到import statsmodels.api as sm所指的程序问题 运行成功后的结果设置python导入其他库包文件的镜像地址为国内镜像的方法设置VS code的python环境为anaconda的python环境。 问题描述 这是

数据的蜂度和偏度

https://zhuanlan.zhihu.com/p/234833433 之前笔者在做一个金融数据项目时,有朋友问我,衡量股票收益率有没有什么好的方法。这个问题让笔者也思索了好久,其实股票的收益率如果我们从本质来看不就是数据吗,无非就是收益率我们就想让其越高越好,也就是让这个数据增加得越多越好。而衡量数

Python学习笔记-StatsModels 统计回归(0)简介

关于 StatsModels statsmodels(http://www.statsmodels.org)是一个Python库,用于拟合多种统计模型,执行统计测试以及数据探索和可视化。 文档 最新版本的文档位于: https://www.statsmodels.org/stable/ 主要功能 线性回归模型: 普通最小二乘法 广义最小二乘法 加权最小二乘法 具有

Statsmodels 简介

https://www.jianshu.com/p/e45558ccf533 13.3 statsmodels介绍        statsmodels(http://www.statsmodels.org)是一个Python库,用于拟合多种统计模型,执行统计测试以及数据探索和可视化。statsmodels包含更多的“经典”频率学派统计方法,而贝叶斯方法和机器学习模型可在其

Statsmodels重复图表?

我在这里发布了一个IPython Notebook http://nbviewer.ipython.org/gist/dartdog/9008026在单元格5中,我称:编辑此代码应产生重复的图形. import pandas as pd import io import statsmodels.api as sm %matplotlib inline import matplotlib.pyplot as plt content2 = '''\ Un

似然比测试statsmodels

在统计模型中,普通最小二乘法已实施似然比检验 OLSResults.compare_lr_test(restricted) 对于广义线性模型(GLM),情况并非如此.我试图强行复制OLS实现: from scipy import stats llf_full = results.llf llf_restr = results_res.llf df_full = results.df_resid df_restr = re

列之间的相关性python火焰

有一个关于如何使用python blaze模块进行分析的简单问题.因此,我正在尝试执行以下代码: from blaze import SQL,Table from sqlalchemy import create_engine from scipy.stats import pearsonr sql_path=r'/path/to/my/database.db' e=create_engine('sqlite:///%s'%sql_path) blz

python-使用pandas pd.cut生成带有statsmodels的分类变量

我尝试使用pd.cut从连续变量创建分类变量.我想在随后的statsmodel定义的包括此虚拟变量的回归中使用它.当我创建以这种方式创建的类别变量时,出现错误 TypeError: data type not understood. 下面包括一个测试用例. import numpy as np import pandas as pd import statsmod

Statsmodels-广播形状不同吗?

我正在尝试使用statsmodels中的logit模块对数据集执行逻辑回归,该数据集包含目标变量为boolean(默认值)和两个功能(fico_interp,home_ownership_int).这三个值均来自同一数据帧“ traindf”: from sklearn import datasets import statsmodels.formula.api as smf lmf = smf.logit

调用函数中的patsy时出现命名空间问题

我正在尝试为statsmodels公式API写一个包装器(这是一个简化的版本,该函数的作用还不止于此): import statsmodels.formula.api as smf def wrapper(formula, data, **kwargs): return smf.logit(formula, data).fit(**kwargs) 如果我将此功能提供给用户,然后用户尝试定义自己

我如何获取statsmodels / patsy公式所依赖的列?

假设我有一个熊猫数据框: df = pd.DataFrame({'x1': [0, 1, 2, 3, 4], 'x2': [10, 9, 8, 7, 6], 'x3': [.1, .1, .2, 4, 8], 'y': [17, 18, 19, 20, 21]}) 现在,我使用公式拟合statsmodel

Python-ImportError:DLL加载失败:导入statsmodels时

这个问题已经在这里有了答案:            >            Installing scipy in Python 3.5 on 32-bit Windows 7 Machine                                    4个 我的Python版本在win32上是3.5.我从这里成功安装了Nump

我尝试拟合线性混合效应模型时,为什么statsmodels引发IndedxError?

给定代码: import statsmodels.api as sm import statsmodels.formula.api as smf df.reset_index(drop=True, inplace=True) display(df.describe()) md = smf.mixedlm("c ~ iscorr", df, groups=df.subnum) mdf = md.fit() 在df是pandas.DataFrame的情况下,我从smf.mixedlm

python-如何从statsmodels中的WLS回归的2D参数获取测试预测

我使用statsmodels递增了WLS regression functions的参数. 我有一个这样声明的10×3数据集X: X = np.array([[1,2,3],[1,2,3],[4,5,6],[1,2,3],[4,5,6],[1,2,3],[1,2,3],[4,5,6],[4,5,6],[1,2,3]]) 这是我的数据集,我有一个10×2的endg向量,看起来像这样: z = [[ 3.90311860e-322

如何将statsmodels中的OLS应用于groupby

我按月在产品上运行OLS.虽然这对于单个产品来说很好用,但我的数据框包含许多产品.如果我创建一个groupby对象,则OLS会给出错误. linear_regression_df: product_desc period_num TOTALS 0 product_a 1 53 3 product_a 2 52 6 produ

Python Statsmodels Mixedlm(混合线性模型)随机效应

我对Statsmodels Mixedlm的输出感到有点困惑,我希望有人可以解释一下. 我有一个大型的单户住宅数据集,包括每个房产的前两个销售价格/销售日期.我对整个数据集进行了地理编码,并获取了每个属性的高程.我试图了解不同城市之间提升与房地产价格升值之间关系的变化方式. 我使用statsmo

Python Statsmodel ARIMA开始[平稳性]

我刚开始使用statsmodels进行时间序列分析.我有一个包含日期和值的数据集(大约3个月).我正面临着为ARIMA模型提供正确订单的一些问题.我希望调整趋势和季节性,然后计算异常值. 我的’价值’不是固定不变的,statsmodel说我要么必须诱导平稳性,要么提供一些差异以使其有效.我玩了不同

python – ImportError:无法导入名称’factorial’

我想使用logit模型并尝试导入statsmodels库. 我的版本:Python 3.6.8 我得到的最好的建议是降级scipy但不清楚如何以及应该降级到什么版本.请帮忙解决.https://github.com/statsmodels/statsmodels/issues/5747 将statsmodels.formula.api导入为smf ImportError

Python – 滚动窗口OLS回归估计

对于我的评估,我在this link(https://drive.google.com/drive/folders/0B2Iv8dfU4fTUMVFyYTEtWXlzYkk)中找到了一个数据集,格式如下.我的数据集中的第三列(Y)是我的真实值 – 这就是我想要预测的(估计). time X Y 0.000543 0 10 0.000575 0 10 0.041324 1 10 0.04133

python – 在statsmodels中捕获高多重共线性

说我在statsmodels中适合模型 mod = smf.ols('dependent ~ first_category + second_category + other', data=df).fit() 当我做mod.summary()时,我可能会看到以下内容: Warnings: [1] The condition number is large, 1.59e+05. This might indicate that there are strong mult

python – 使用statsmodels进行Holt-Winters时间序列预测

我尝试使用holt-winters模型进行预测,如下所示,但我不断得到一个与我的预期不一致的预测.我还展示了情节的可视化 Train = Airline[:130] Test = Airline[129:] from statsmodels.tsa.holtwinters import Holt y_hat_avg = Test.copy() fit1 = Holt(np.asarray(Train['Passenger

Python Pandas中加权最小二乘的意外标准错误

在the code for the main OLS class in Python Pandas中,我正在寻求帮助以阐明在执行加权OLS时报告的标准错误和t统计使用的约定. 这是我的示例数据集,其中一些导入使用Pandas并直接使用scikits.statsmodels WLS: import pandas import numpy as np from statsmodels.regression.li

计算python中非线性曲线拟合的确定系数(R2)和均方根误差(RMSE)

如何计算python中非线性曲线拟合的确定系数(R2)和均方根误差(RMSE).以下代码执行直到曲线拟合.那么如何计算R2和RMSE? import numpy as np import matplotlib.pyplot as plt from scipy.optimize import curve_fit def func(x, a, b, c): return a * np.exp(-b * x) + c x =

python – Pandas Statsmodels使用DF预测器进行回归预测?

使用Pandas OLS我能够适应和使用如下模型: ols_test = pd.ols(y=merged2[:-1].Units, x=merged2[:-1].lastqu) #to exclude current year, then do forecast method yrahead=(ols_test.beta['x'] * merged2.lastqu[-1:]) + ols_test.beta['intercept'] 我需要切换到statsmod