首页 » Python » 秦路天善智能python学习笔记-pandas的关联

秦路天善智能python学习笔记-pandas的关联

 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import pandas as pd
position = pd.read_csv("DataAnalyst.csv",encoding="gbk",engine="python",sep=",")
position2 = pd.read_csv("DataAnalyst_ceshi.csv",encoding="gbk",engine="python",sep=",")
print(position.head())
print(position2.head())
# 常用的主要由merge,join,concat
# join 是按照索引来的,适合完全顺序一致的,所以尽量多用merge,另外join不能有重复列
position3 = position.merge(right=position2,how="inner",on='companyId')  # 如果对应的列名字不对,需要单独设定左右表格的列名
print(position3.head())
position4 = position.merge(right=position2,how="inner",left_on='companyId',right_on='companyId')  # 同名会去重,不同名会保留
print(position4.head())

print(pd.concat([position,position2],sort=True))  # concat直接强制给拼接在一起了。如果有重复的列,不会新建列但是也不去重
print(pd.concat([position,position2],axis=1))  # 这里是左右堆叠了,等价于粗暴点的join

# 一般concat 更适合多个表字段相同的合并,可以很方便的把两个表变成一个大表。

原文链接:秦路天善智能python学习笔记-pandas的关联,转载请注明来源!

0