2023-01-20 00:32:00
Pandas是Python中用于数据分析的常用库,提供了丰富的函数和方法来简化数据处理流程。以下是Pandas常见函数的总结:
导入数据df[df[col] > 0.5]:选择col列的值大于0.5的行。
df.sort_values(col1):按照列col1排序数据,默认升序排列。
df.sort_values(col2, ascending=False):按照列col2降序排列数据。
df.sort_values([col1,col2], ascending=[True,False]):先按列col1升序排列,后按col2降序排列数据。
df.groupby(col):返回一个按列col进行分组的Groupby对象。
df.groupby([col1,col2]):返回一个按多列进行分组的Groupby对象。
df.groupby(col1)[col2]:返回按列col1进行分组后,列col2的均值。
df.pivot_table(index=col1, values=[col2,col3], aggfunc=max):创建一个按列col1进行分组,并计算col2和col3的最大值的数据透视表。
df.groupby(col1).agg(np.mean):返回按列col1分组的所有列的均值。
data.apply(np.mean):对DataFrame中的每一列应用函数np.mean。
data.apply(np.max,axis=1):对DataFrame中的每一行应用函数np.max。