ZL1023

V1

2023/01/07阅读:17主题:全栈蓝

R语言:频数表和交叉表

一、前言

学术论文中非常重要的一部分内容是结果与讨论

结果与讨论的第一小节往往是描述性统计分析

描述性统计分析主要回答以下几个问题:

  1. 数据的集中趋势;
  2. 数据的离散程度;
  3. 数据的分布状态;
  4. 数据有无离群值。

大部分学术论文在结果与讨论的第一小节,一般必须回答前两个问题,即数据的集中趋势数据的离散程度

上期讨论了连续型变量的描述性统计分析,本期讨论类别型变量的描述性统计分析。

类别型变量的主要展示方式是频数表交叉表

连续型变量 类别型变量
集中趋势 算术平均值;中位数;等 频数;频率;等
离散程度 标准差;四分位差;等
分布状态 偏度;等
离群值 本期不讨论

1.1 频数表-示例文献

文献来源
文献来源
原始表格
原始表格

1.2 交叉表-示例文献

文献来源
文献来源
原始表格
原始表格

二、R包

本期使用的R包主要有一个:

# load "tidyverse" package
library(tidyverse)
# load "compareGroups" package
library(compareGroups)

三、示例数据

本期使用的regicor数据集来源于REGICOR研究,该研究重点关注西班牙东北部地区缺血性心脏病的人群分布和相关危险因素。

本期仅使用regicor数据集的部分变量,包括:

  1. sex:性别;
  2. smoker:吸烟状况;
  3. histhtn:高血压病史;
  4. histchol:高胆固醇病史;
  5. cv:心血管疾病。
# load "regicor" data
data(regicor)
# get related variables
demo_data <- regicor[c("sex","smoker","histhtn","histchol","cv")]

四、R语言实现

4.1 频数表

# creat frequency table
descrTable(demo_data)
# creat frequency table
descrTable(demo_data) %>%
 # save frequency table to local
 export2csv(file="fre_tab.csv")

4.2 交叉表

# creat cross table
descrTable(cv~.,data=demo_data) %>%
 # save frequency table to local
 export2csv(file="cro_tab.csv")

分类:

数学

标签:

数学编程

作者介绍

ZL1023
V1