灵感来源
- 保持更新,努力学习
- python脚本学习
组合两个表
解题思路
题目要求根据两个表(Person
和Address
)的关联关系返回组合结果。在关系型数据库中,这通常通过外键关联实现,而在 Pandas 中,可以使用merge
方法来模拟 SQL 的LEFT JOIN
操作。
关键步骤:
- 数据关联:通过
Person
表的PersonId
和Address
表的PersonId
进行左连接,确保即使地址信息不存在,也会返回人员的基本信息。 - 字段选择:提取所需的字段(
FirstName
,LastName
,City
,State
),如果地址信息缺失则用NaN
表示。
-
import pandas as pddef combine_two_tables(person: pd.DataFrame, address: pd.DataFrame) -> pd.DataFrame:# 使用左连接合并两个表,以Person表为主merged = pd.merge(person, address, on='personId', how='left')# 选择所需的列并重新命名return merged[['firstName', 'lastName', 'city', 'state']]
逐行解释
import pandas as pddef combine_two_tables(person: pd.DataFrame, address: pd.DataFrame) -> pd.DataFrame:# 使用左连接合并两个DataFrame,保留Person表中的所有记录# 无论Address表中是否存在匹配的personIdmerged = pd.merge(left=person, # 左侧DataFrame(主表)right=address, # 右侧DataFrame(从表)on='personId', # 用于连接的键(外键)how='left' # 左连接:保留左侧表的所有记录)# 选择需要返回的列,并按照题目要求的顺序排列# 如果地址信息缺失,city和state会显示为NaNreturn merged[['firstName', 'lastName', 'city', 'state']]