输入/输出#

腌制#

read_pickle(filepath_or_buffer[, ...])

从文件加载腌制的 pandas 对象(或任何对象)。

DataFrame.to_pickle(path, *[, compression, ...])

将对象腌制(序列化)到文件。

平面文件#

read_table(filepath_or_buffer, *[, sep, ...])

将通用分隔文件读入 DataFrame。

read_csv(filepath_or_buffer, *[, sep, ...])

将逗号分隔值 (csv) 文件读入 DataFrame。

DataFrame.to_csv([path_or_buf, sep, na_rep, ...])

将对象写入逗号分隔值 (csv) 文件。

read_fwf(filepath_or_buffer, *[, colspecs, ...])

将固定宽度格式的行表读入 DataFrame。

剪贴板#

read_clipboard([sep, dtype_backend])

从剪贴板读取文本并传递给 read_csv().

DataFrame.to_clipboard([, excel, sep])

将对象复制到系统剪贴板。

Excel#

read_excel(io[, sheet_name, header, names, ...])

将 Excel 文件读入 pandas DataFrame

DataFrame.to_excel(excel_writer, *[, ...])

将对象写入 Excel 表格。

ExcelFile(path_or_buffer[, engine, ...])

用于将表格 Excel 表格解析为 DataFrame 对象的类。

ExcelFile.book

ExcelFile.sheet_names

ExcelFile.parse([sheet_name, header, names, ...])

将指定的表格解析为 DataFrame。

Styler.to_excel(excel_writer[, sheet_name, ...])

将 Styler 写入 Excel 表格。

ExcelWriter(path[, engine, date_format, ...])

用于将 DataFrame 对象写入 excel 表格的类。

JSON#

read_json(path_or_buf, *[, orient, typ, ...])

将 JSON 字符串转换为 pandas 对象。

json_normalize(data[, record_path, meta, ...])

将半结构化 JSON 数据规范化为扁平表格。

DataFrame.to_json([path_or_buf, orient, ...])

将对象转换为 JSON 字符串。

build_table_schema(data[, index, ...])

data 创建表格模式。

HTML#

read_html(io, *[, match, flavor, header, ...])

将 HTML 表格读取到 list of DataFrame 对象中。

DataFrame.to_html([buf, columns, col_space, ...])

将 DataFrame 渲染为 HTML 表格。

Styler.to_html([buf, table_uuid, ...])

将 Styler 写入 HTML-CSS 格式的文件、缓冲区或字符串。

XML#

read_xml(path_or_buffer, *[, xpath, ...])

将 XML 文档读入 DataFrame 对象。

DataFrame.to_xml([path_or_buffer, index, ...])

将 DataFrame 渲染为 XML 文档。

Latex#

DataFrame.to_latex([buf, columns, header, ...])

将对象渲染为 LaTeX 表格、长表格或嵌套表格。

Styler.to_latex([buf, column_format, ...])

将 Styler 写入 LaTeX 格式的文件、缓冲区或字符串。

HDFStore: PyTables (HDF5)#

read_hdf(path_or_buf[, key, mode, errors, ...])

从存储区读取,如果我们打开了它,则关闭它。

HDFStore.put(key, value[, format, index, ...])

将对象存储在 HDFStore 中。

HDFStore.append(key, value[, format, axes, ...])

追加到文件中的表。

HDFStore.get(key)

从文件中检索存储的 Pandas 对象。

HDFStore.select(key[, where, start, stop, ...])

检索存储在文件中的 Pandas 对象,可以选择基于 where 条件。

HDFStore.info()

打印存储库的详细信息。

HDFStore.keys([include])

返回存储在 HDFStore 中的对象的键列表。

HDFStore.groups()

返回所有顶级节点的列表。

HDFStore.walk([where])

遍历 Pandas 对象的 PyTables 组层次结构。

警告

可以将 DataFrameSeries 的子类存储到 HDF5 中,但子类的类型在存储时会丢失。

Feather#

read_feather(path[, columns, use_threads, ...])

从文件路径加载 Feather 格式的对象。

DataFrame.to_feather(path, **kwargs)

将 DataFrame 写入二进制 Feather 格式。

Parquet#

read_parquet(path[, engine, columns, ...])

从文件路径加载 Parquet 对象,返回 DataFrame。

DataFrame.to_parquet([path, engine, ...])

将 DataFrame 写入二进制 Parquet 格式。

ORC#

read_orc(path[, columns, dtype_backend, ...])

从文件路径加载 ORC 对象,返回 DataFrame。

DataFrame.to_orc([path, engine, index, ...])

将 DataFrame 写入 ORC 格式。

SAS#

read_sas(filepath_or_buffer, *[, format, ...])

读取存储为 XPORT 或 SAS7BDAT 格式文件的 SAS 文件。

SPSS#

read_spss(path[, usecols, ...])

从文件路径加载 SPSS 文件,返回 DataFrame。

SQL#

read_sql_table(table_name, con[, schema, ...])

将 SQL 数据库表读取到 DataFrame 中。

read_sql_query(sql, con[, index_col, ...])

将 SQL 查询读取到 DataFrame 中。

read_sql(sql, con[, index_col, ...])

将 SQL 查询或数据库表读取到 DataFrame 中。

DataFrame.to_sql(name, con, *[, schema, ...])

将 DataFrame 中存储的记录写入 SQL 数据库。

Google BigQuery#

read_gbq(query[, project_id, index_col, ...])

(已弃用) 从 Google BigQuery 加载数据。

STATA#

read_stata(filepath_or_buffer, *[, ...])

将 Stata 文件读入 DataFrame。

DataFrame.to_stata(path, *[, convert_dates, ...])

将 DataFrame 对象导出到 Stata dta 格式。

StataReader.data_label

返回 Stata 文件的数据标签。

StataReader.value_labels()

返回一个嵌套字典,将每个变量名与其值和标签关联起来。

StataReader.variable_labels()

返回一个字典,将每个变量名与其对应标签关联起来。

StataWriter.write_file()

将 DataFrame 对象导出到 Stata dta 格式。