前言
大家好,我是倔强青铜三。欢迎关注我,微信公众号:倔强青铜三。点赞、收藏、关注,一键三连!
欢迎来到苦练Python第62天!
今天我们来学习Python标准库中的csv模块。
一、CSV 是什么?能做什么?
CSV(Comma-Separated Values,逗号分隔值)是一种纯文本表格格式。
- 每行是一条记录(record),行内每个字段(field)用分隔符(通常是逗号)隔开。结构简单、体积小、兼容性强,几乎所有电子表格、数据库、数据分析工具都支持。
常见场景
- Excel / WPS / Google Sheets 导出或导入数据MySQL、PostgreSQL 等数据库批量导入导出机器学习数据集(如 Kaggle 的
.csv 文件)日志、传感器、爬虫抓取的中间结果Python 自带的 csv 模块(import csv)让我们不用关心各种方言差异,就能安全地读写 CSV。
二、写 CSV —— 把内存数据变成文件
2.1 用列表写入:writer.writerow / writer.writerows
# 示例:把成绩表写入 scores.csvimport csvheader = ['姓名', '语文', '数学', '英语']rows = [ ['张三', 90, 85, 88], ['李四', 78, 92, 87], ['王五', 95, 91, 93]]with open('scores.csv', 'w', newline='', encoding='utf-8') as f: writer = csv.writer(f) writer.writerow(header) # 写表头 writer.writerows(rows) # 写多行运行后得到文件 scores.csv:
姓名,语文,数学,英语张三,90,85,88李四,78,92,87王五,95,91,932.2 用字典写入:DictWriter(自动对齐字段)
# 示例:把订单写入 orders.csvimport csvfieldnames = ['订单号', '商品', '单价', '数量']orders = [ {'订单号': 1001, '商品': 'Python 入门', '单价': 59, '数量': 2}, {'订单号': 1002, '商品': 'Python 进阶', '单价': 79, '数量': 1}]with open('orders.csv', 'w', newline='', encoding='utf-8') as f: writer = csv.DictWriter(f, fieldnames=fieldnames) writer.writeheader() writer.writerows(orders)文件内容:
订单号,商品,单价,数量1001,Python 入门,59,21002,Python 进阶,79,1三、读 CSV —— 把文件读回内存
3.1 按列表读取:csv.reader
# 读取刚才生成的 scores.csvimport csvwith open('scores.csv', newline='', encoding='utf-8') as f: reader = csv.reader(f) for row in reader: print(row)输出:
['姓名', '语文', '数学', '英语']['张三', '90', '85', '88']['李四', '78', '92', '87']['王五', '95', '91', '93']注意:读出来默认是字符串,需要自行转换类型。
3.2 按字典读取:csv.DictReader(字段名做键)
# 读取 orders.csvimport csvwith open('orders.csv', newline='', encoding='utf-8') as f: reader = csv.DictReader(f) for row in reader: print(row['商品'], '共', int(row['数量']) * int(row['单价']), '元')输出:
Python 入门 共 118 元Python 进阶 共 79 元四、自定义方言:处理“奇怪”的 CSV
有时分隔符不是逗号,而是 Tab、分号,甚至管道符 |;或者字段里本身包含分隔符,需要特殊引号。
通过 csv.register_dialect 可以“注册”一种新方言,后续直接引用名字即可。
# 写入以分号分隔、单引号包围的 csvimport csvcsv.register_dialect('semicolon', delimiter=';', quotechar="'", quoting=csv.QUOTE_MINIMAL)data = [["Tom;Jerry", 100], ["Spike", 90]]with open('pets.csv', 'w', newline='') as f: writer = csv.writer(f, dialect='semicolon') writer.writerow(['主人', '分数']) writer.writerows(data)# 读取同样使用方言with open('pets.csv', newline='') as f: reader = csv.reader(f, dialect='semicolon') for row in reader: print(row)输出:
['主人', '分数']["Tom;Jerry", '100']['Spike', '90']五、自动检测方言:Sniffer 一键猜格式
拿到一个未知格式的 CSV,可以用 csv.Sniffer 自动推断分隔符、引号规则。
# 假设我们拿到 example.csv,但不知道分隔符import csvraw = '''name|age|cityAlice|30|BeijingBob|25|Shanghai'''with open('example.csv', 'w', encoding='utf-8') as f: f.write(raw)with open('example.csv', newline='') as f: sample = f.read(1024) f.seek(0) dialect = csv.Sniffer().sniff(sample, delimiters='|,\t;') reader = csv.reader(f, dialect=dialect) for row in reader: print(row)输出:
['name', 'age', 'city']['Alice', '30', 'Beijing']['Bob', '25', 'Shanghai']六、完整实战:统计销售总额
把上面所有知识点串起来——
- 读入
orders.csv计算每个订单金额把结果写入 summary.csvimport csv# 1. 读total = 0summary_rows = []with open('orders.csv', newline='', encoding='utf-8') as f: reader = csv.DictReader(f) for row in reader: price = int(row['单价']) qty = int(row['数量']) sub = price * qty total += sub summary_rows.append([row['订单号'], row['商品'], sub])# 2. 写with open('summary.csv', 'w', newline='', encoding='utf-8') as f: writer = csv.writer(f) writer.writerow(['订单号', '商品', '金额']) writer.writerows(summary_rows) writer.writerow(['', '总计', total])print('已生成 summary.csv,总销售额:', total)运行后 summary.csv:
订单号,商品,金额1001,Python 入门,1181002,Python 进阶,79,总计,197七、小结与下一步
- csv.writer / csv.DictWriter:把列表或字典写文件csv.reader / csv.DictReader:把文件读回列表或字典Dialect / Sniffer:处理各种分隔符、引号、转义规则
最后感谢阅读!欢迎关注我,微信公众号:
倔强青铜三。
欢迎点赞、收藏、关注,一键三连!!
