import math
l = [] 
%timeit for x in range(100): l.append(math.pow(x,2))
%timeit [math.pow(x,2) for x in range(100)]
l = []
%timeit for x in range(100): l.append(x*x)
%timeit [x*x for x in range(100)]

28.6 µs ± 1.19 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
19.6 µs ± 283 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
13 µs ± 462 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
7.45 µs ± 239 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


def build_count_base(t):                 
    d = {}                   
    for s in t:
        if s in d:
            d[s] += 1
        else:  
            d[s] = 1
    return d

def build_count_set(t):                   
    d = {k:0 for k in set(t)}
    for s in t:
        d[s] += 1
    return d

def build_count_count(t):
    d = {k:t.count(k) for k in set(t)}
    return d

def build_count_excpt(t):             
    d = {}                   
    for s in t:
        try:     
            d[s] += 1
        except:
            d[s] = 1
    return d

import collections

def build_count_counter(t):
    return collections.Counter(t)

def build_count_defaultdict(t):
    d = collections.defaultdict(int)
    for k in s:
        d[k] += 1
    return d

s = "Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nam tristique at velit in varius. Cras ut ultricies orci. Fusce vel consequat ante, vitae luctus tortor. Sed condimentum faucibus enim, sit amet pulvinar ligula feugiat ac. Sed interdum id risus id rhoncus. Nullam nisi justo, ultrices eu est nec, hendrerit maximus lorem. Nam urna eros, accumsan nec magna eu, elementum semper diam. Nulla tempus, nibh id elementum dapibus, ex diam lacinia est, sit amet suscipit nulla nibh eu sapien. Aliquam orci enim, malesuada in facilisis vitae, pharetra sit amet mi. Pellentesque mi tortor, sagittis quis odio quis, fermentum faucibus ex. Aenean sagittis nisl orci. Maecenas tristique velit sed leo facilisis porttitor. "
s = s*10000
len(s)
print(f"len(s) = {len(s)}, nbkeys {len(set(s))} base, count, count_count, except, colection.counter")
%timeit build_count_base(s)
%timeit build_count_set(s)
%timeit build_count_count(s)
%timeit build_count_excpt(s)
%timeit build_count_counter(s)
%timeit build_count_defaultdict(s)

len(s) = 7160000, nbkeys 33 base, count, count_count, except, colection.counter
1.08 s ± 82.8 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
1.09 s ± 42.6 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
338 ms ± 12.8 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
1.01 s ± 50.5 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
458 ms ± 12.5 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
940 ms ± 62.7 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


print("with split")
s2 = s.split()
print(f"len(s) = {len(s2)}, nbkeys {len(set(s2))} base, count, count_count, except, colection.counter")
%timeit build_count_base(s2)
%timeit build_count_set(s2)
%timeit build_count_count(s2)
%timeit build_count_excpt(s2)
%timeit build_count_counter(s2)
%timeit build_count_defaultdict(s2)

with split
len(s) = 1100000, nbkeys 90 base, count, count_count, except, colection.counter
320 ms ± 64.1 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
201 ms ± 5.4 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
2.03 s ± 55 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
172 ms ± 5.95 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
101 ms ± 2.71 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
904 ms ± 56.3 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


from time import perf_counter

l = []

t_start = perf_counter()
[math.pow(x,2) for x in range(100)]
print(f"elapsed time: {perf_counter() - t_start:.2e} s")

elapsed time: 3.23e-04 s

Processing time evaluation¶

Measure ⏱, don't guess! Profile to find the bottlenecks.¶

Do not optimize everything!¶

Context: some notes on developing efficient software¶

Note 1¶

Example¶

Note 2¶

Example¶

Note 3¶

Example¶

Different types of profiling¶

Time profiling¶

Memory profiling¶

Small code snippets¶

Do not guess (the return of word counting problem)¶

Conclusion of these measurements¶

Script base benchmark¶

Function based profiling (cProfile)¶

Statistical profiling¶

Line based profiling¶

Memory profiler¶

Time and memory profiler¶

Further reading¶