注意Unix, Windows差异.
一. 相对路径
注意使用pyinstaller将项目封装为exe文件时更需要注意
1.1 在本模块中调用
例如 在代码文件目录下存在
main.py
main.txt
# 当前目录
with open('main.txt') as f:
pass
# 在当前层级, 往下访问, 使用 "."符号表示即可
import os
# 不同的符号
print(os.path.exists(r'.\test_pack\test.txt'))
# 等价
print(os.path.exists('./test_pack/test.txt'))
在当前代码中执行这是没问题的, 执行的文件的路径, 会指向该目录下的main.txt
文件
# 类似于这个, 执行命令的来源, 其路径的差异
print(os.getcwd())
1.2 第三方模块调用
上述的例子
main.py
main.txt
other.py
在other
文件中
import main
# 在此模块调用main.py
pass
不同层级的相对路径
os.path.abspath(os.path.join(os.path.dirname(__file__), os.path.pardir))
# 先获取到最上层的文件夹(父文件夹)的相对路径, 然后转为绝对路径
print(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
# 或者通过这种方法, 逐级获取父文件夹
os.path.dirname
, 返回路径(所在的文件夹)os.path.abspath
, 绝对路径os.path.join
, 合并路径os.path.pardir
, 返回当前目录的父目录,默认值为..
(也可以写作os.pardir
).
print(__file__)
# 当前代码所在的文件的绝对路径
二. 文本的读取
2.1 open() 方法
open()
方法用于打开一个文件, 并返回文件(file)
对象.
在对文件进行处理过程都需要使用到这个函数,如果该文件无法被打开,会抛出 OSError
**注意:**使用 open() 方法一定要保证关闭文件对象,即调用 close() 方法.
with open(file) as f:
pass
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
参数说明:
- file: 必需,文件路径(相对或者绝对路径).
- mode: 可选,文件打开模式
- buffering: 设置缓冲
- encoding: 一般使用utf8, 注意bom的存在
- errors: 报错级别
- newline: 区分换行符
- closefd: 传入的file参数类型
- opener: 设置自定义开启器,开启器的返回值必须是一个打开的文件描述符。
mode
参数有:
这里需要注意的是一些特殊情况:
- 不确定文本的处理方式, 可能写入, 可能读取,
"+"
模式用于处理这种情况, 但是需要注意的是其操作是否保留源文件的数据. - 文本假如存在内容, 需要保存源文件的内容
- 文本存在内容, 需要读取源文件的内容(指针指向文件的末尾, 需要使用
seek()
函数将指针移回开始的位置,seek(0)
. - 文本存在内容, 需要在文件的最前面插入内容(默认指针指向文件的末尾, 如日志, 希望不断插入内容在最前面, 同时保留后面的内容)
模式 | 描述 |
---|---|
t | 文本模式 (默认)。 |
x | 写模式,新建一个文件,如果该文件已存在则会报错。 |
b | 二进制模式。 |
+ | 打开一个文件进行更新(可读可写)。 |
U | 通用换行模式(Python 3 不支持)。 |
r | 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 |
rb | 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。 |
r+ | 打开一个文件用于读写。文件指针将会放在文件的开头。 |
rb+ | 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。 |
w | 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
wb | 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。 |
w+ | 打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
wb+ | 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。 |
a | 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
ab | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
a+ | 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。 |
ab+ | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。 |
默认为文本模式,如果要以二进制模式打开,加上 b 。
2.2 file 对象
file 对象使用 open 函数来创建,下表列出了 file 对象常用的函数:
序号 | 方法及描述 |
---|---|
1 | file.close()关闭文件。关闭后文件不能再进行读写操作。 |
2 | file.flush()刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入。 |
3 | file.fileno()返回一个整型的文件描述符(file descriptor FD 整型), 可以用在如os模块的read方法等一些底层操作上。 |
4 | file.isatty()如果文件连接到一个终端设备返回 True,否则返回 False。 |
5 | file.next()**Python 3 中的 File 对象不支持 next() 方法。**返回文件下一行。 |
6 | [file.read(size])从文件读取指定的字节数,如果未给定或为负则读取所有。 |
7 | [file.readline(size])读取整行,包括 "\n" 字符。 |
8 | [file.readlines(sizeint])读取所有行并返回列表,若给定sizeint>0,返回总和大约为sizeint字节的行, 实际读取值可能比 sizeint 较大, 因为需要填充缓冲区。 |
9 | file.seek(offset[, whence\]) 移动文件读取指针到指定位置 |
10 | file.tell() 返回文件当前位置。 |
11 | file.truncate(size) 从文件的首行首字符开始截断,截断文件为 size 个字符,无 size 表示从当前位置截断;截断之后后面的所有字符被删除,其中 windows 系统下的换行代表2个字符大小。 |
12 | file.write(str) 将字符串写入文件,返回的是写入的字符长度。 |
13 | file.writelines(sequence) 向文件写入一个序列字符串列表,如果需要换行则要自己加入每行的换行符。 |
三. 文件的遍历
os.listdir()
, 返回指定路径下的文件和文件夹列表. (不会进入下一层目录)
os.walk()
, 返回生成器
# 遍历所有的文件的路径
# 包含子文件夹下的内容
for filepath, dir_names, filenames in os.walk(folder_path):
for filename in filenames:
print((os.path.join(filepath, filename), filename))