Python怎么读取csv文件?

开发者资讯
2025-06-30
编辑

　　Python读取CSV文件主要有两种方式，使用内置的csv模块或第三方库pandas。csv模块适合轻量级操作，通过csv.reader或csv.DictReader逐行解析数据为列表或字典。pandas则适合复杂数据处理，提供pd.read_csv()直接生成DataFrame对象，支持列名访问、数据过滤等高级功能。选择方法时需权衡数据规模与开发效率。

　　Python怎么读取csv文件?

　　在Python中，可以使用内置的csv模块或第三方库来读取CSV文件。以下是两种方法的详细说明和示例代码：

　　方法一：使用内置的csv模块

　　csv模块是Python标准库的一部分，适合处理简单的CSV文件。

　　示例代码

　　pythonimport csv# 打开CSV文件with open('data.csv', mode='r', encoding='utf-8') as file:# 创建CSV阅读器对象csv_reader = csv.reader(file)# 逐行读取数据for row in csv_reader:print(row) # 每行是一个列表，如 ['Name', 'Age', 'City']# 如果CSV有标题行，可使用DictReader按列名访问with open('data.csv', mode='r', encoding='utf-8') as file:csv_dict_reader = csv.DictReader(file)for row in csv_dict_reader:print(row['Name'], row['Age']) # 通过列名访问数据

　　参数说明

　　ｄｅｌｉｍｉｔｅｒ：指定分隔符(默认为,)，例如ｄｅｌｉｍｉｔｅｒ=';'。

　　quotechar：指定引号字符(默认为")，用于处理含特殊字符的字段。

Python怎么读取csv文件.jpg

　　方法二：使用pandas库

　　pandas适合处理复杂数据，功能更强大。

　　安装pandas

　　bashpip install pandas

　　示例代码

　　pythonimport pandas as pd# 读取CSV文件到DataFramedf = pd.read_csv('data.csv', encoding='utf-8')# 查看前5行数据print(df.head())# 按列名访问数据print(df['Name']) # 输出Name列的所有值print(df.at[0, 'Age']) # 输出第一行的Age值

　　常用参数

　　sep：分隔符(默认为,)，例如sep=';'。

　　header：指定标题行位置默认为0，即第一行。

　　index_col：将某列设为行索引(如index_col=0)。

　　三、处理特殊场景

　　1. 读取无标题的CSV

　　python# 使用csv模块with open('data.csv', 'r') as file:csv_reader = csv.reader(file)headers = next(csv_reader) # 手动读取第一行作为标题data = list(csv_reader) # 剩余数据# 使用pandasdf = pd.read_csv('data.csv', header=None)df.columns = ['Col1', 'Col2', 'Col3'] # 自定义列名

　　2. 处理大文件(分块读取)

　　python# pandas分块读取(每次读取1000行)chunk_size = 1000for chunk in pd.read_csv('large_data.csv', chunksize=chunk_size):process(chunk) # 对每个数据块进行处理

　　3. 处理编码问题

　　python# 尝试不同编码(如gbk、latin1)df = pd.read_csv('data.csv', encoding='gbk')

　　四、总结

　　简单需求：使用csv模块。

　　复杂需求：使用pandas，支持数据清洗、分析、导出为Excel等。

　　注意：始终检查文件路径、编码和分隔符是否匹配实际文件格式。

　　以上就是关于Python怎么读取csv文件的详细介绍，读取CSV时需注意编码、分隔符和文件路径问题。若遇乱码，尝试指定encoding='gbk'或'latin1';若格式特殊，需设置sep=';'。处理超大文件时，pandas的分块读取可避免内存溢出。最终建议优先使用pandas简化流程，除非项目对依赖库有严格限制。