组成

pandas由两种数据结构组成：Series和DataFrame

Series

带标签的一维同构数组

标签	值
张三	100
李四	99

Series创建方式一

由字典创建

import pandas as pd
dic = {"张三分数": 100, "李四分数": 99}
result = pd.Series(dic)
print(result)


张三分数    100
李四分数     99
dtype: int64

Series创建方式二

由数组（一维数组）创建

import pandas as pd
arr = [100, 99]
result = pd.Series(arr, index=['张三分数', '李四分数'])
print(result)


张三分数    100
李四分数     99
dtype: int64

注：不指定索引则默认从0开始

Series创建方式三

由标量创建

import pandas as pd
result = pd.Series(100, index=['张三分数', '李四分数'])
print(result)


张三分数    100
李四分数     99
dtype: int64

DataFrame

DataFrame 是一个二维的数组结构，类似二维数组

索引	列1	列2	..
0
1
2

DataFrame创建方式一

由字典创建一

import pandas as pd
dic = {'张三分数': ['100', '98'], '李四分数': ['99', '97']}
df = pd.DataFrame(dic, index=['上学期', '下学期'])
print(df)


    张三分数 李四分数
上学期  100   99
下学期   98   97

由字典创建二

import pandas as pd
dic = [{'张三分数': '100', '李四分数': '99'}, {'张三分数': '98', '李四分数': '97', '王五分数': '66'}]
df = pd.DataFrame(dic, index=['上学期', '下学期'])
print(df)


    张三分数 李四分数 王五分数
上学期  100   99  NaN
下学期   98   97   66

注：不指定索引则默认从0开始

DataFrame创建方式二

由numpy ndarray创建

import pandas as pd
import numpy as np
df = pd.DataFrame(np.array([['100', '99', 60],
                            ['98', '97', '66']]),
                  index=['上学期', '下学期'],
                  columns=['张三分数', '李四分数', '王五分数'])
print(df)


    张三分数 李四分数 王五分数
上学期  100   99   60
下学期   98   97   66

注：np.array与dict构造DataFrame不一样，array里面每一个list长度必须一样，代表DataFrame每一行，长度不一样会报错

DataFrame其他创建方式

DataFrame还可通过pd.read_csv读取csv文件或者pd.read_excel读取excel文件创建

这一部分留到DataFrame读取数据一节学习

        -- end --