thomas

V1

2022/10/04阅读:30主题:橙心

统计学第四章

统计学第四讲 时间序列模型

上讲回顾

时间序列分析:Var模型

作业分享

生产函数作业情况
VAR模型作业情况

时间序列分析

1.时间序列数据的设定

gen t=date(x,"YMD")

xtset

2.时间序列数据的操作

滞后项、超前项和差分项

use gnp96.dta, clear
tsset date
gen Lgnp = L.gnp96 /*一阶滞后*/
gen L2gnp = L2.gnp96
gen Fgnp = F.gnp96 /*一阶超前*/
gen F2gnp = F2.gnp96
gen Dgnp = D.gnp96 /*一阶差分*/
gen D2gnp = D2.gnp96
list in 1/10
list in -10/-1

案例:股市数据及预测

http://quotes.money.163.com/trade/lsjysj_zhishu_000001.html

arima模型与p,d,q的设定

数据、变量与有向无环图

数据结构与变量

模型

模型是一个基于统计学的假说体系,试图确定x与y之间的因果或者相关关系

这其中,要求 及所有列入的其他自变量相互独立 即

现实世界经常不能满足统计学的严格假设

随机取样vs官方统计数据

变量非独立

指标数据收集中的偏斜或者错误

有些关键变量数据无法收集

使用统计学新的方法,反事实框架进行研究

变量与假说

因变量y

我们研究的主题决定了因变量的选择。

比如研究畜牧业产业政策对肉羊产业的影响,因变量为肉羊产业的产出:羊肉产量;羊肉产值;羊肉出栏数量等

如果研究草原生态,那么因变量则是,单位草原面积肉羊存栏数量(这里有一个假说,草原牲畜主要是肉羊)

? 1、研究政策对乳业的影响,因变量是什么?

2、研究乳业发展的环境影响,因变量又是什么呢?


自变量

核心变量:涉及主要假说或核心观点的变量,比如政策效应中能够代表政策的变量。

控制变量或者协变量:与该因变量或该主题紧密相关的其他非核心变量。


作业

作业1:

(1)每组提出一个研究主题; (2)查找数据指标; (3)使用有向无环图分析,因变量是什么?关键自变量是什么?需要控制什么变量?什么变量不能控制? (4)使用合适的统计学方法得到结果。



本讲回顾

补充有向无环图分析
补充时间序列分析


面板数据分析

参考资料