Python性能之cProfile和line_profile搭配使用!

470次阅读
没有评论

Python性能之cProfile和line_profile搭配使用!

python性能调试过程中最突出的问题就是耗时,性能测试工具有很多,这里介绍cprofile和line_profiler的搭配使用方法。前者返回项目中每个函数的耗时,后者可以分析函数每一行的耗时。

一,cProfile

cProfile是python默认的性能分析器

cProfile是一种确定性分析器,只测量CPU时间,并不关心内存消耗和其他与内存相关联的信息。

参数分析:

run(statement, filename=None, sort=-1)
# statement: 需要测试的代码或者函数(函数名)
# fielname: 结果保存的位置, 默认为stdout
# sort: 结果排序方法,常用的有‘cumtime': 累积时间, ’name': 函数名, ‘line': 行号
# 以及下面结果分析里的’ncalls'等

使用方法一:

import re
import cProfile
cProfile.run('re.compile("abc")')

结果分析:

Python性能之cProfile和line_profile搭配使用!

第一行:129个函数调用被监控,其中128个是原生调用(不涉及递归)

ncalls:函数被调用的次数。如果这一列有两个值,就表示有递归调用,第二个值是原生调用次数,第一个值是总调用次数。

tottime:函数内部消耗的总时间。(可以帮助优化)

percall:是tottime除以ncalls,一个函数每次调用平均消耗时间。

cumtime:之前所有子函数消费时间的累计和。

filename:lineno(function):被分析函数所在文件名、行号、函数名。

使用方法二:

import cProfile
import re
cProfile.run('re.compile("abc")', 'result.out', 'cumtime')

使用方法三:控制台

终端:python -m cProfile -o result.out -s cumulative test.py
# 效果同方法二

结果分析:

结果保存在文件名为result.out的二进制文件里。

结果读取:pstats模块和Stats类

import pstats
def view_profile(path):
    p = pstats.Stats(f"{path}")
    p.sort_stats("cumulative")  # 表示结果按照累计时间耗费排序,其它排序同上
    p.print_stats(3)  # 输出结果 输出结果的前三行,参数还可以是0,1之间的小数,表示输出结果的占比,没有参数表示输出全部结果
    p.print_callers()  # 可以显示函数被哪些函数调用
    p.print_callees()  # 可以显示哪个函数调用了哪些函数

二,line_profiler

这个性能分析器和cProfile不同,他能帮你一行一行的分析性能。

如果瓶颈问题在某一行中,这样就需要line_profiler解决了。

建议使用kernprof工具

安装

pip install line_profiler

使用方法一:kernprof

@profile
def fib(n):
    # 文件名aaa.py
    a, b = 0, 1
    for i in range(0, n):
        a, b = b, a+b
    return a
fib(5)
终端:kernprof -l -v aaa.py
# -l表示逐行分析 -v用于控制台输出, 不加-v会把分析结果写入aaa.py.lprof文件

使用方法二:函数调用

from line_profiler import LineProfiler
def test_line(func_name, parameter=None):
    “”“
    :param: func_name, str, 函数名
    :param: parameter, 函数参数
    ”“”
    lp = LineProfiler()
    lp_wrapper = lp(func_name)
    if parameter is not None:
        lp_wrapper(parameter) #如果有参数,没参数不用写
    lp.print_stats() # 展示结果

结果分析

Python性能之cProfile和line_profile搭配使用!

Line:文件中的行号。

Hits:性能分析时代码执行的次数。

Time:一段代码执行的总时间,由计数器决定。

Per Hit:执行一段代码平均消耗时间。

% Time:执行一段代码时间消耗比例。

三,搭配使用

先用cProfile确定项目中耗时最多的几个函数,然后用line_profiler分析这几个耗时最多的函数,确定行性能瓶颈。

神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试

相关文章:

版权声明:wuyou2021-06-15发表,共计1944字。
新手QQ群:570568346,欢迎进群讨论 Python51学习