
蛇哥学Python
V1
2022/11/03阅读:13主题:萌绿
pandas数据结构
尽量宽恕别人,而决不要原谅自己。 ——西拉斯
大家好,我是蛇哥
今天学习一下pandas的数据结构
组成
pandas由两种数据结构组成:Series和DataFrame
Series
带标签的一维同构数组
标签 | 值 |
---|---|
张三 | 100 |
李四 | 99 |
Series创建方式一
由字典创建
import pandas as pd
dic = {"张三分数": 100, "李四分数": 99}
result = pd.Series(dic)
print(result)
张三分数 100
李四分数 99
dtype: int64
Series创建方式二
由数组(一维数组)创建
import pandas as pd
arr = [100, 99]
result = pd.Series(arr, index=['张三分数', '李四分数'])
print(result)
张三分数 100
李四分数 99
dtype: int64
注:不指定索引则默认从0开始
Series创建方式三
由标量创建
import pandas as pd
result = pd.Series(100, index=['张三分数', '李四分数'])
print(result)
张三分数 100
李四分数 99
dtype: int64
DataFrame
DataFrame 是一个二维的数组结构,类似二维数组
索引 | 列1 | 列2 | .. |
---|---|---|---|
0 | |||
1 | |||
2 |
DataFrame创建方式一
由字典创建一
import pandas as pd
dic = {'张三分数': ['100', '98'], '李四分数': ['99', '97']}
df = pd.DataFrame(dic, index=['上学期', '下学期'])
print(df)
张三分数 李四分数
上学期 100 99
下学期 98 97
由字典创建二
import pandas as pd
dic = [{'张三分数': '100', '李四分数': '99'}, {'张三分数': '98', '李四分数': '97', '王五分数': '66'}]
df = pd.DataFrame(dic, index=['上学期', '下学期'])
print(df)
张三分数 李四分数 王五分数
上学期 100 99 NaN
下学期 98 97 66
注:不指定索引则默认从0开始
DataFrame创建方式二
由numpy ndarray创建
import pandas as pd
import numpy as np
df = pd.DataFrame(np.array([['100', '99', 60],
['98', '97', '66']]),
index=['上学期', '下学期'],
columns=['张三分数', '李四分数', '王五分数'])
print(df)
张三分数 李四分数 王五分数
上学期 100 99 60
下学期 98 97 66
注:np.array与dict构造DataFrame不一样,array里面每一个list长度必须一样,代表DataFrame每一行,长度不一样会报错
DataFrame其他创建方式
DataFrame还可通过pd.read_csv读取csv文件或者pd.read_excel读取excel文件创建
这一部分留到DataFrame读取数据一节学习
-- end --
作者介绍

蛇哥学Python
V1