蛇哥学Python

V1

2022/11/03阅读:13主题:萌绿

pandas数据结构

尽量宽恕别人,而决不要原谅自己。 ——西拉斯

大家好,我是蛇哥
今天学习一下pandas的数据结构

组成

pandas由两种数据结构组成:Series和DataFrame

Series

带标签的一维同构数组

标签
张三 100
李四 99

Series创建方式一

由字典创建

import pandas as pd
dic = {"张三分数"100"李四分数"99}
result = pd.Series(dic)
print(result)


张三分数    100
李四分数     99
dtype: int64

Series创建方式二

由数组(一维数组)创建

import pandas as pd
arr = [10099]
result = pd.Series(arr, index=['张三分数''李四分数'])
print(result)


张三分数    100
李四分数     99
dtype: int64

注:不指定索引则默认从0开始

Series创建方式三

由标量创建

import pandas as pd
result = pd.Series(100, index=['张三分数''李四分数'])
print(result)


张三分数    100
李四分数     99
dtype: int64

DataFrame

DataFrame 是一个二维的数组结构,类似二维数组

索引 列1 列2 ..
0
1
2

DataFrame创建方式一

由字典创建一

import pandas as pd
dic = {'张三分数': ['100''98'], '李四分数': ['99''97']}
df = pd.DataFrame(dic, index=['上学期''下学期'])
print(df)


    张三分数 李四分数
上学期  100   99
下学期   98   97

由字典创建二

import pandas as pd
dic = [{'张三分数''100''李四分数''99'}, {'张三分数''98''李四分数''97''王五分数''66'}]
df = pd.DataFrame(dic, index=['上学期''下学期'])
print(df)


    张三分数 李四分数 王五分数
上学期  100   99  NaN
下学期   98   97   66

注:不指定索引则默认从0开始

DataFrame创建方式二

由numpy ndarray创建

import pandas as pd
import numpy as np
df = pd.DataFrame(np.array([['100''99'60],
                            ['98''97''66']]),
                  index=['上学期''下学期'],
                  columns=['张三分数''李四分数''王五分数'])
print(df)


    张三分数 李四分数 王五分数
上学期  100   99   60
下学期   98   97   66

注:np.array与dict构造DataFrame不一样,array里面每一个list长度必须一样,代表DataFrame每一行,长度不一样会报错

DataFrame其他创建方式

DataFrame还可通过pd.read_csv读取csv文件或者pd.read_excel读取excel文件创建

这一部分留到DataFrame读取数据一节学习


        -- end --

分类:

后端

标签:

Python

作者介绍

蛇哥学Python
V1