Python核心特性与面试题精讲

如云长翩

1. Python基础面试题精讲

1.1 Python语言特性解析

Python作为一门广受欢迎的编程语言，其核心优势主要体现在以下几个方面：

解释性语言：Python代码在运行时由解释器逐行执行，无需编译过程，这使得开发调试周期大大缩短。解释执行的特点也带来了跨平台优势，同一份代码可以在不同操作系统上运行。
面向对象：Python从设计之初就是一门面向对象的语言，支持类、继承、多态等OOP特性。即使是基本数据类型也是对象，这种一致性简化了语言结构。
动态类型：变量不需要声明类型，类型在运行时确定。这种灵活性提高了开发效率，但也需要开发者更注意类型安全。
丰富的标准库：Python自带"电池"，提供了涵盖文件I/O、系统操作、网络编程、数据处理等领域的模块，如os、sys、re、json等。
可扩展性：Python可以轻松调用C/C++代码，关键性能部分可以用C扩展实现。常见的科学计算库如NumPy就是基于这种机制。
跨平台：得益于解释器实现，Python代码可以在Windows、Linux、MacOS等系统上无缝运行。
开源生态：PyPI上有超过30万个第三方库，覆盖Web开发、数据分析、人工智能等各个领域。

实际应用场景：在数据科学领域，Python的这些特性尤为突出。例如，Jupyter Notebook结合Pandas、Matplotlib等库，可以快速进行数据探索和分析，这正是解释性和丰富生态优势的体现。

1.2 PEP8规范深度解读

PEP8是Python官方的编码风格指南，遵循它可以提高代码的可读性和一致性。以下是关键规范的详细说明：

缩进：每级缩进使用4个空格（非Tab）。混合使用空格和Tab会导致IndentationError。
行长度：
- 代码行不超过79字符
- 文档字符串/注释不超过72字符
- 长表达式可使用括号、反斜杠或字符串连接符换行
空白符使用：
- 二元运算符两侧各留一个空格
- 函数参数列表的逗号后留空格
- 不要用空格垂直对齐多行相关代码
命名约定：
- 模块名：小写字母，必要时用下划线
- 类名：驼峰式（CapWords）
- 函数/变量名：小写字母加下划线
- 常量：全大写加下划线
导入顺序：
- 标准库导入
- 相关第三方库导入
- 本地应用/库导入
- 每组导入之间空一行
文档字符串：所有公共模块、函数、类和方法都应包含文档字符串（docstring）。

python复制# 良好的PEP8实践示例
def calculate_average(numbers):
    """计算数字列表的平均值。
    
    Args:
        numbers: 包含数字的可迭代对象
        
    Returns:
        float: 计算结果的平均值
    """
    total = sum(numbers)
    count = len(numbers)
    return total / count

注意事项：虽然PEP8是官方推荐，但在已有项目中应优先遵循项目现有风格。某些情况下（如数据库字段映射），可以适当放宽命名规则。

1.3 is与==的深度区别

这两个操作符的根本区别在于它们的比较维度：

is操作符：
- 比较两个对象的内存地址（即id值）
- 用于判断两个引用是否指向同一个对象
- 对于None、True、False等单例对象，应始终使用is
==操作符：
- 比较两个对象的值是否相等
- 通过调用对象的__eq__()方法实现
- 可被重载以定义自定义相等逻辑

python复制a = [1, 2, 3]
b = a          # b引用同一个列表对象
c = [1, 2, 3]  # c创建了一个新列表

print(a is b)   # True，同一对象
print(a == b)   # True，值相同
print(a is c)   # False，不同对象
print(a == c)   # True，值相同

特殊情况：小整数（-5到256）和短字符串会被Python缓存，可能导致is判断为True，这是实现细节而非语言特性，不应依赖。

最佳实践：值比较用==，单例检查用is。在自定义类中实现__eq__时，应保持其与hash的一致性。

1.4 列表去重的多种方法

使用set转换（最简单直接）：

python复制original = [1, 2, 2, 3, 4, 4, 5]
unique = list(set(original))

缺点：不保持原始顺序，元素必须是可哈希的

使用dict.fromkeys（Python 3.7+保持插入顺序）：

python复制unique = list(dict.fromkeys(original))

使用collections.OrderedDict（早期Python版本保序）：

python复制from collections import OrderedDict
unique = list(OrderedDict.fromkeys(original))

列表推导式（保持顺序）：

python复制seen = set()
unique = [x for x in original if not (x in seen or seen.add(x))]

pandas.unique（适合大数据处理）：

python复制import pandas as pd
unique = pd.unique(original).tolist()

性能比较：对于小型列表（<1000元素），set转换最快；大型列表且需要保序时，pandas.unique表现最佳。

1.5 循环控制语句详解

break：
- 立即终止当前循环
- 只影响最内层循环
- 常用于满足条件时提前退出
continue：
- 跳过当前迭代，进入下一次循环
- 不会终止整个循环
- 用于过滤特定情况
pass：
- 空操作占位符
- 保持语法完整性
- 常用于待实现的代码块

python复制# 实际应用示例：处理用户输入
while True:
    user_input = input("请输入命令(q退出): ")
    if user_input == 'q':
        break  # 退出循环
        
    if not user_input.isdigit():
        print("请输入数字！")
        continue  # 跳过后续处理
        
    number = int(user_input)
    if number == 0:
        pass  # 待处理特殊情况
    else:
        print(10 / number)

扩展应用：在异常处理中，pass常用于暂时忽略特定异常，但生产环境中应有适当日志记录。

1.6 迭代器协议深入解析

迭代器是Python中实现惰性计算的核心机制，其协议包含两个关键方法：

__iter__()：返回迭代器对象自身
__next__()：返回下一个元素，无元素时抛出StopIteration

自定义迭代器示例：

python复制class CountDown:
    def __init__(self, start):
        self.current = start
        
    def __iter__(self):
        return self
        
    def __next__(self):
        if self.current <= 0:
            raise StopIteration
        num = self.current
        self.current -= 1
        return num

# 使用示例
for num in CountDown(5):
    print(num)  # 输出5,4,3,2,1

迭代器优势：

内存高效：只在需要时生成元素
无限序列：可以表示无限长的数据流
统一接口：for循环、生成器表达式等均基于迭代器协议

常见陷阱：迭代器是一次性对象，遍历后需重新创建。可通过itertools.tee实现多路迭代。

1.7 可迭代对象与迭代器关系

关键区别：

特性	可迭代对象 (Iterable)	迭代器 (Iterator)
实现方法	`__iter__()`	`__iter__()` + `__next__()`
获取方式	iter()函数转换	本身就是迭代器
状态保持	无	记录当前迭代位置
示例	list, tuple, dict, str	file对象, 生成器
复用性	可多次迭代	通常一次性使用

类型检查：

python复制from collections.abc import Iterable, Iterator

data = [1, 2, 3]
print(isinstance(data, Iterable))  # True
print(isinstance(data, Iterator))  # False

iter_data = iter(data)
print(isinstance(iter_data, Iterator))  # True

设计模式：实现可迭代对象时，通常将__iter__作为工厂方法返回新的迭代器实例，以支持多次迭代。

1.8 变量作用域详解

Python的作用域遵循LEGB规则：

Local：函数内部
Enclosing：闭包函数外层
Global：模块级别
Built-in：内置命名空间

作用域控制关键字：

global：
- 声明变量来自全局作用域
- 可在函数内修改全局变量
- 滥用会导致代码难以维护
nonlocal：
- Python 3引入
- 修改嵌套作用域中的变量
- 不能创建新变量

python复制count = 0  # 全局变量

def outer():
    total = 0  # 闭包变量
    
    def inner():
        nonlocal total  # 修改闭包变量
        global count    # 修改全局变量
        total += 1
        count += 1
        local_var = 10  # 局部变量
        
    inner()
    print(total)  # 1
    print(local_var)  # 报错，局部变量不可见

outer()
print(count)  # 1

最佳实践：尽量减少全局变量使用，优先通过参数和返回值传递数据。闭包适合实现装饰器等模式。

1.9 列表推导式进阶技巧

基础形式：

python复制[x * 2 for x in range(10)]  # [0, 2, 4, ..., 18]

带条件过滤：

python复制[x for x in range(10) if x % 2 == 0]  # [0, 2, 4, 6, 8]

多重循环：

python复制[(x, y) for x in range(3) for y in range(3)]  
# [(0,0), (0,1), (0,2), (1,0), ..., (2,2)]

嵌套推导式：

python复制matrix = [[1, 2], [3, 4], [5, 6]]
[row[i] for row in matrix for i in range(2)]  # [1, 2, 3, 4, 5, 6]

字典推导式：

python复制{x: x**2 for x in range(5)}  # {0:0, 1:1, 2:4, 3:9, 4:16}

集合推导式：

python复制{x % 5 for x in range(10)}  # {0, 1, 2, 3, 4}

性能考虑：对于大型数据集，生成器表达式(x for x in iterable)更节省内存。当需要多次迭代时，再转换为列表。

1.10 Python运算符详解

算术运算符：

//：地板除（向下取整）

python复制7 // 2   # 3
-7 // 2  # -4 (不是-3)

%：取模（余数）

python复制10 % 3   # 1
-10 % 3  # 2 (符号与除数一致)

**：幂运算

python复制2 ** 3   # 8
4 ** 0.5 # 2.0

比较运算符：==, !=, <, >, <=, >=
赋值运算符：=, +=, -=, *=, /=, //=, %=, **=
位运算符：&, |, ^, ~, <<, >>
逻辑运算符：and, or, not
成员运算符：in, not in
身份运算符：is, is not

特殊行为：Python运算符可重载，通过实现特殊方法如__add__, __eq__等实现自定义行为。

1.11 Python异常体系

Python异常继承体系（部分）：

code复制BaseException
 ├── SystemExit
 ├── KeyboardInterrupt
 ├── GeneratorExit
 └── Exception
      ├── StopIteration
      ├── ArithmeticError
      │    ├── FloatingPointError
      │    ├── OverflowError
      │    └── ZeroDivisionError
      ├── AssertionError
      ├── AttributeError
      ├── BufferError
      ├── EOFError
      ├── ImportError
      ├── LookupError
      │    ├── IndexError
      │    └── KeyError
      ├── MemoryError
      ├── NameError
      ├── OSError
      │    ├── IOError
      │    ├── FileNotFoundError
      │    └── InterruptedError
      ├── SyntaxError
      ├── TypeError
      └── ValueError

常见异常场景：

IndexError：列表索引越界
KeyError：字典键不存在
TypeError：操作或函数应用于不适当类型
ValueError：类型正确但值不合法
AttributeError：对象没有该属性
ImportError：导入模块/对象失败

异常处理最佳实践：

捕获具体异常而非笼统的Exception

使用try/except/else/finally完整结构

合理使用上下文管理器(with语句)处理资源

自定义异常应从Exception派生

1.12 递归算法实现

递归求和优化版本：

python复制def recursive_sum(n, acc=0):
    """尾递归优化版求和"""
    if n == 0:
        return acc
    return recursive_sum(n - 1, acc + n)

# 注意：Python未实现尾递归优化，大数仍会栈溢出

递归使用原则：

基准条件（终止条件）
递归条件（问题分解）
向基准条件演进

递归与迭代对比：

特性	递归	迭代
代码简洁性	高	低
内存使用	栈空间消耗大	变量存储，更高效
适用问题	树形结构、分治算法	线性过程
调试难度	较难（调用栈深）	较易

Python限制：默认递归深度限制约1000层（可通过sys.setrecursionlimit调整），对于深度问题建议改用迭代或尾递归优化。

1.13 经典算法实现：九九乘法表

优化版乘法表实现：

python复制def multiplication_table():
    """生成格式整齐的九九乘法表"""
    for i in range(1, 10):
        row = []
        for j in range(1, i + 1):
            product = i * j
            # 统一两位数格式
            row.append(f"{j}×{i}={product:2d}")
        print(" ".join(row))

# 输出示例：
# 1×1= 1
# 1×2= 2 2×2= 4
# 1×3= 3 2×3= 6 3×3= 9
# ...

进阶变体：

右上三角格式
使用列表推导式简化
输出HTML表格格式
支持自定义范围（如12×12）

教学价值：九九乘法表练习涵盖了嵌套循环、字符串格式化、对齐处理等基础编程概念，是入门经典案例。

1.14 大文件处理策略

逐行读取（内存最友好）：

python复制def process_large_file(file_path):
    with open(file_path, 'r', encoding='utf-8') as f:
        for line in f:  # 文件对象本身就是迭代器
            process_line(line)  # 自定义处理函数

分块读取（平衡内存与性能）：

python复制def read_in_chunks(file_path, chunk_size=1024*1024):
    """生成器函数，分块读取文件"""
    with open(file_path, 'rb') as f:
        while True:
            chunk = f.read(chunk_size)
            if not chunk:
                break
            yield chunk

内存映射（适合随机访问）：

python复制import mmap

def mmap_example(file_path):
    with open(file_path, 'r+b') as f:
        with mmap.mmap(f.fileno(), 0) as mm:
            # 可以像操作字符串一样操作mm
            if mm.find(b'keyword') != -1:
                print("Found keyword")

Dask/Pandas分块（结构化数据处理）：

python复制import pandas as pd

chunk_iter = pd.read_csv('large.csv', chunksize=10000)
for chunk in chunk_iter:
    process_chunk(chunk)

性能考量：文本文件处理时，注意编码转换开销；二进制文件处理时，考虑使用memoryview减少拷贝。

1.15 对象复制机制详解

Python中的复制操作分为三个层次：

赋值(=)：
- 创建新引用
- 共享同一对象
- 修改相互影响
浅拷贝：
- 创建新容器对象
- 元素仍是引用
- 方法：copy()方法、切片、copy.copy()
深拷贝：
- 完全独立的新对象
- 递归复制所有对象
- 方法：copy.deepcopy()

python复制import copy

original = [[1, 2], [3, 4]]

# 赋值
ref = original  
# 浅拷贝
shallow = copy.copy(original)  
# 深拷贝
deep = copy.deepcopy(original)  

original[0][0] = 99
print(ref[0][0])     # 99
print(shallow[0][0]) # 99
print(deep[0][0])    # 1

选择策略：

不可变对象：赋值即可
简单可变对象：浅拷贝足够
复杂嵌套对象：需要深拷贝

性能警告：深拷贝递归处理可能很耗时，对于复杂对象考虑自定义__deepcopy__方法优化。

1.16 文件读取方法对比

方法	返回值类型	内存占用	适用场景
read()	str/bytes	高	小文件一次性读取
read(size)	str/bytes	可控	按指定大小分块读取
readline()	str	低	逐行处理文本文件
readlines()	list	高	需要所有行的列表
文件迭代器	str	最低	大文件逐行处理最佳选择

内存高效遍历大文件：

python复制# 最佳实践
with open('huge.log') as f:
    for line in f:  # 使用文件迭代器
        process(line)
        
# 反模式（内存爆炸）
lines = open('huge.log').readlines()  # 读取所有行到内存

编码处理：文本文件操作时始终指定编码参数（如encoding='utf-8'），避免平台差异导致的解码错误。

1.17 随机数生成实践

Python随机数模块核心功能：

基础随机：

python复制import random

random.random()  # [0.0, 1.0)浮点数
random.uniform(1.5, 2.5)  # 指定范围浮点数

整数随机：

python复制random.randint(1, 10)  # 闭区间整数
random.randrange(0, 100, 5)  # 类似range的随机

序列操作：

python复制items = ['red', 'green', 'blue']
random.choice(items)  # 随机选择
random.sample(items, 2)  # 无重复抽样
random.shuffle(items)  # 原地打乱

种子设置：

python复制random.seed(42)  # 固定随机序列

安全敏感场景：

python复制import secrets  # Python 3.6+

secrets.token_bytes(16)  # 加密安全随机字节
secrets.token_hex(16)    # 随机16字节的hex字符串
secrets.choice(items)    # 安全随机选择

应用场景：游戏开发用random，密码学相关用secrets。注意random不适合安全敏感场景。

1.18 核心数据结构对比

Python四种主要容器类型的深度对比：

特性	列表(list)	元组(tuple)	字典(dict)	集合(set)
可变性	可变	不可变	可变	可变
有序性	有序	有序	Python 3.7+有序	无序
元素要求	无	无	键必须可哈希	元素必须可哈希
查找性能	O(n)	O(n)	O(1)	O(1)
内存占用	较低	最低	较高	中等
典型用途	有序集合	不可变记录	键值映射	唯一元素集合
语法示例	[1, 2, 3]	(1, 2, 3)

选择指南：

需要修改：list/dict/set
需要作为字典键或集合元素：tuple/frozenset
需要快速查找：dict/set
需要保持插入顺序：Python 3.7+的dict

进阶结构：collections模块提供deque、defaultdict、Counter等专用容器，可满足更多场景需求。

1.19 列表扁平化技巧

多维列表展开的多种方法：

列表推导式（最Pythonic）：

python复制nested = [[1,2], [3,4], [5,6]]
flat = [x for sublist in nested for x in sublist]

itertools.chain（高效迭代）：

python复制from itertools import chain
flat = list(chain.from_iterable(nested))

sum函数（技巧性，不推荐）：

python复制flat = sum(nested, [])

functools.reduce（函数式风格）：

python复制from functools import reduce
flat = reduce(lambda x,y: x+y, nested)

递归解包（任意嵌套深度）：

python复制def flatten_deep(lst):
    for item in lst:
        if isinstance(item, list):
            yield from flatten_deep(item)
        else:
            yield item

性能比较：对于二维列表，chain.from_iterable最快；深度嵌套时递归方案更通用。

1.20 排序操作对比

sorted()与list.sort()的详细对比：

特性	sorted()	list.sort()
适用范围	任何可迭代对象	仅列表
返回值	新排序列表	None（原地修改）
原数据	保持不变	被修改
内存效率	较低（创建新列表）	较高（原地排序）
支持链式操作	是	否
性能	略慢（需复制）	略快

关键参数：

key：指定排序依据的函数（如key=str.lower）
reverse：是否逆序排序

高级排序示例：

python复制# 多级排序
users = [
    {'name': 'Alice', 'age': 25},
    {'name': 'Bob', 'age': 30},
    {'name': 'Alice', 'age': 20}
]

# 先按name升序，再按age降序
sorted_users = sorted(users, key=lambda x: (x['name'], -x['age']))

稳定排序：Python的排序算法是稳定的，即相等元素的相对位置不变。这在多级排序中非常重要。

1.21 Lambda函数实践

匿名函数的典型应用场景：

简单函数表达式：

python复制square = lambda x: x ** 2

排序key函数：

python复制sorted(users, key=lambda u: u['age'])

高阶函数参数：

python复制list(map(lambda x: x * 2, [1, 2, 3]))

事件处理回调：

python复制button.on_click(lambda event: print("Clicked"))

限制与替代：

复杂逻辑应使用def定义
Python 3.8+的海象运算符:=可在lambda中赋值
functools.partial可固定部分参数

最佳实践：lambda应保持简短（通常单表达式），过度使用会降低可读性。命名函数通常更易维护。

1.22 字典排序技巧

字典排序的几种常见需求：

按键排序：

python复制sorted_dict = dict(sorted(original.items()))

按值排序：

python复制sorted_dict = dict(sorted(original.items(), key=lambda item: item[1]))

多级排序：

python复制# 先按值降序，再按键升序
sorted_dict = dict(sorted(original.items(), 
                         key=lambda item: (-item[1], item[0])))

保持插入顺序（Python 3.7+）：

python复制from collections import OrderedDict

ordered = OrderedDict(sorted(original.items()))

性能考虑：对于大型字典，排序操作可能很耗时。考虑使用heapq获取前N项而非全排序：

python复制import heapq
top3 = heapq.nsmallest(3, original.items(), key=lambda i: i[1])

现代Python：自3.7版起，普通dict已保持插入顺序，OrderedDict主要用于需要特定排序行为或向后兼容。

1.23 字符串格式化演进

Python字符串格式化的三代技术：

%格式化（最早）：

python复制"Hello, %s. You have %d messages." % (name, count)

str.format()（Python 2.6+）：

python复制"Hello, {}. You have {} messages.".format(name, count)
"Hello, {name}. You have {count} messages.".format(name=name, count=count)

f-string（Python 3.6+，推荐）：

python复制f"Hello, {name}. You have {count} messages."
f"Total: {price * quantity:.2f}"  # 表达式和格式说明符

格式化规范：

python复制# 数字格式化
f"{12345:,}"      # "12,345"
f"{3.14159:.2f}"  # "3.14"

# 对齐与填充
f"{'text':<10}"   # "text      "
f"{'text':>10}"   # "      text"
f"{'text':^10}"   # "   text   "

# 日期格式化
from datetime import datetime
f"{datetime.now():%Y-%m-%d}"  # "2023-07-15"

性能优势：f-string在运行时是已求值的表达式，比%和format()更高效。但定义时即求值，不适合动态格式字符串场景。

1.24 列表与迭代器对比

列表与迭代器的核心差异：

特性	列表 (List)	迭代器 (Iterator)
内存模型	预分配连续内存	惰性计算，按需生成
内存占用	与元素数量成正比	常数额外内存
访问方式	随机访问(O(1))	顺序访问(O(n))
重复遍历	支持	通常一次性
长度信息	已知(len())	通常未知
实现接口	可迭代对象	迭代器协议
典型应用	数据集合存储	数据流处理

迭代器模式优势：

处理无限序列（如传感器数据）
内存高效处理大数据
管道式数据处理（类似Unix管道）

转换方法：

python复制my_list = [1, 2, 3]
iterator = iter(my_list)  # 列表转迭代器
new_list = list(iterator)  # 迭代器转列表（耗尽迭代器）

设计原则：在API设计中，应尽量接受可迭代对象而非强制列表，提高接口通用性。itertools模块提供了丰富的迭代器工具函数。

2. Python高级特性解析

2.1 抽象类与接口类

在面向对象设计中，抽象类和接口类都是实现多态的重要机制：

抽象类特点：

可以包含具体方法的实现
通过@abstractmethod声明抽象方法
子类必须实现所有抽象方法
用于表示"是什么"的关系

接口类特点：

只包含抽象方法（Python中通过ABC模拟）
强调"能做什么"的能力
支持多继承实现多个接口
更强调契约而非实现

python复制from abc import ABC, abstractmethod

# 抽象类示例
class Animal(ABC):
    @abstractmethod
    def move(self):
        pass
        
    def eat(self):
        print("Eating...")

# 接口类示例
class Flyable(ABC):
    @abstractmethod
    def fly(self):
        pass

class Bird(Animal, Flyable):
    def move(self):
        print("Flying")
        
    def fly(self):
        print("With wings")

# 使用
parrot = Bird()
parrot.move()  # Flying
parrot.fly()   # With wings

现代Python实践：由于Python支持多重继承，抽象类和接口类的界限较模糊。通常使用ABC模块创建包含部分实现的抽象基类。

2.2 方法类型区别

Python类中的三种方法：

实例方法：
- 默认方法类型
- 第一个参数为self（实例引用）
- 可访问实例和类属性
类方法：
- @classmethod装饰器
- 第一个参数为cls（类引用）
- 可访问类属性，常用于工厂模式
静态方法：
- @staticmethod装饰器
- 无特殊第一个参数
- 与类逻辑相关但不需要访问实例或类状态

python复制class MyClass:
    class_attr = "class"
    
    def __init__(self):
        self.instance_attr = "instance"
        
    def instance_method(self):
        print(f"Instance: {self.instance_attr}, {self.class_attr}")
        
    @classmethod
    def class_method(cls):
        print(f"Class: {cls.class_attr}")
        # print(cls.instance_attr)  # 错误
        
    @staticmethod
    def static_method():
        print("Just a function")

调用方式对比：

python复制obj = MyClass()

# 实例方法
obj.instance_method()  # 自动传入self
MyClass.instance_method(obj)  # 手动传入实例

# 类方法
obj.class_method()     # 自动传入类
MyClass.class_method() # 同上

# 静态方法
obj.static_method()    # 无自动参数
MyClass.static_method()

设计原则：优先使用实例方法，除非有明确需求使用类方法或静态方法。静态方法过度使用可能表明需要重构为模块函数。

2.3 内存管理机制

Python内存管理的三大机制：

引用计数：
- 每个对象维护引用计数
- 引用增加：赋值、容器添加、参数传递
- 引用减少：del、变量重新赋值、离开作用域
- 计数为0时立即回收
垃圾回收：
- 解决循环引用问题
- 分代回收（0-2代）
- 标记-清除算法
内存池：
- 小对象专用内存分配器
- 减少malloc/free调用
- 提升小对象分配效率

手动管理示例：

python复制import gc

# 禁用自动回收
gc.disable()

# 创建循环引用
x = []
y = [x]
x.append(y)

# 手动回收
collected = gc.collect()
print(f"Collected {collected} objects")

# 调优
gc.set_threshold(700, 10, 10)  # 设置各代阈值

调试工具：objgraph模块可可视化对象引用关系，memory_profiler可分析内存使用情况。

2.4 内存泄漏排查

Python内存泄漏的常见原因：

循环引用：
- 对象间相互引用
- 涉及__del__方法时更复杂
- 解决方案：weakref模块
全局变量累积：
- 缓存未限制大小
- 解决方案：functools.lru_cache
未关闭资源：
- 文件、socket、数据库连接
- 解决方案：with语句
C扩展泄漏：
- 第三方扩展未正确释放内存
- 解决方案：检查扩展文档

诊断工具：

python复制import gc
import sys

def find_leaks():
    gc.collect()
    before = {id(o) for o in gc.get_objects()}
    
    # 执行可疑代码
    suspicious_operation()
    
    gc.collect()
    after = {id(o) for o in gc.get_objects()}
    
    leaked = after - before
    for obj_id in leaked:
        obj = next(o for