常见 pandas库常见函数

常见 pandas库常见函数
最新回答
︸世态炎凉

2022-07-23 01:48:33

Pandas库中常见的函数包括但不限于数据读取函数、数据处理函数、Series和DataFrame相关函数以及时间序列处理函数

数据读取函数

  • pd.read_csv(filename):用于读取CSV格式的文件,是数据分析和处理中常用的数据导入方式。
  • pd.read_excel(filename):用于读取Excel格式的文件,支持多种Excel版本和复杂的Excel结构。
  • pd.read_sql(query, connection_object):用于从SQL数据库中读取数据,需要指定查询语句和数据库连接对象。
  • pd.read_json(json_string):用于从JSON字符串中读取数据,适用于处理JSON格式的数据源。
  • pd.read_html(url):用于从HTML页面中读取数据,可以解析网页中的表格数据。

数据处理函数

  • pd.isnull(series):用于判断Series中的元素是否为空(NaN)。
  • pd.notnull(series):用于判断Series中的元素是否不为空(not NaN)。
  • pd.concat(objs, axis=0, join='outer', ...):用于将多个DataFrame或Series按照指定的轴进行合并。
  • DataFrame.sort_values(by, axis=0, ascending=True, ...):用于对DataFrame中的数据按照指定的列进行排序。
  • df.replace(to_replace, value, inplace=False, ...):用于替换DataFrame中的指定值。

Series和DataFrame相关函数

  • Series(^[x,y,...]^) 或 Series({'a':x,'b':y,...}, index=param1):用于生成一个Series对象。
  • DataFrame.from_dict(result, orient='index', columns=^['B']^):用于从字典创建DataFrame对象。
  • a.reset_index():用于将DataFrame的索引重置为默认整数索引,并将原索引转换为一个新列。

时间序列处理函数

  • Pandas提供了丰富的时间序列处理功能,包括将日期转为秒级时间戳或将秒级时间戳转为日期等,方便进行时间序列数据的分析和处理。