thomas
V1
2022/10/04阅读:60主题:橙心
统计学第四章
统计学第四讲 时间序列模型
上讲回顾
时间序列分析:Var模型
作业分享
生产函数作业情况
VAR模型作业情况
时间序列分析
1.时间序列数据的设定
gen t=date(x,"YMD")
xtset
2.时间序列数据的操作
滞后项、超前项和差分项
use gnp96.dta, clear
tsset date
gen Lgnp = L.gnp96 /*一阶滞后*/
gen L2gnp = L2.gnp96
gen Fgnp = F.gnp96 /*一阶超前*/
gen F2gnp = F2.gnp96
gen Dgnp = D.gnp96 /*一阶差分*/
gen D2gnp = D2.gnp96
list in 1/10
list in -10/-1
案例:股市数据及预测
http://quotes.money.163.com/trade/lsjysj_zhishu_000001.html
arima模型与p,d,q的设定
数据、变量与有向无环图
数据结构与变量

模型
模型是一个基于统计学的假说体系,试图确定x与y之间的因果或者相关关系
这其中,要求 与 及所有列入的其他自变量相互独立 即
现实世界经常不能满足统计学的严格假设
随机取样vs官方统计数据
变量非独立
指标数据收集中的偏斜或者错误
有些关键变量数据无法收集
使用统计学新的方法,反事实框架进行研究
变量与假说
因变量y
我们研究的主题决定了因变量的选择。
比如研究畜牧业产业政策对肉羊产业的影响,因变量为肉羊产业的产出:羊肉产量;羊肉产值;羊肉出栏数量等
如果研究草原生态,那么因变量则是,单位草原面积肉羊存栏数量(这里有一个假说,草原牲畜主要是肉羊)
? 1、研究政策对乳业的影响,因变量是什么?
2、研究乳业发展的环境影响,因变量又是什么呢?
自变量
核心变量:涉及主要假说或核心观点的变量,比如政策效应中能够代表政策的变量。
控制变量或者协变量:与该因变量或该主题紧密相关的其他非核心变量。
作业
作业1:
(1)每组提出一个研究主题; (2)查找数据指标; (3)使用有向无环图分析,因变量是什么?关键自变量是什么?需要控制什么变量?什么变量不能控制? (4)使用合适的统计学方法得到结果。
本讲回顾
补充有向无环图分析
补充时间序列分析
面板数据分析
参考资料
https://zhuanlan.zhihu.com/p/41005312
作者介绍
thomas
V1