Диагностика и улучшение скорости вычислений

У меня есть скрипт, который импортирует модуль geometry, и этот модуль сильно замедляет мой скрипт. Мой скрипт создает растровое изображение, и для 16 миллионов пикселей это займет более 100 часов.

вот проблемный модуль:

'''
Created on 2 fevr. 2014

@author: gary
'''
#module name is: geometry.py

import numpy as np
import numpy.linalg as la
import tetgen

def barycentric_coords(vertices, point):
    T = (np.array(vertices[:-1])-vertices[-1]).T
    v = np.dot(la.inv(T), np.array(point)-vertices[-1])
    v.resize(len(vertices))
    v[-1] = 1-v.sum()
    #print vertices
    return v

def tetgen_of_hull(points):
    tg_all = tetgen.TetGen(points)

    hull_i = set().union(*tg_all.hull)
    hull_points = [points[i] for i in hull_i]

    tg_hull = tetgen.TetGen(hull_points)
    return tg_hull, hull_i

def containing_tet(tg, point):
    for tet in tg.tets:
        verts = [tg.points[j] for j in tet]
        bcoords = barycentric_coords(verts, point)
        if (bcoords >= 0).all():
            return bcoords
    return None, None

это статистика, которую cProfile дает для моего скрипта, который использует функции выше, очевидно, на это потрачено время:

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
  1291716   45.576    0.000  171.672    0.000 geometry.py:10(barycentric_coords)

  6460649   31.617    0.000   31.617    0.000 {numpy.core.multiarray.array}
  2583432   15.979    0.000   15.979    0.000 {method 'reduce' of 'numpy.ufunc'
objects}
     2031   12.032    0.006  193.333    0.095 geometry.py:26(containing_tet)
  1291716   10.944    0.000   58.323    0.000 linalg.py:244(solve)
  1291716    7.075    0.000    7.075    0.000 {numpy.linalg.lapack_lite.dgesv}
  1291716    5.750    0.000    9.865    0.000 linalg.py:99(_commonType)
  2583432    5.659    0.000    5.659    0.000 {numpy.core.multiarray._fastCopyAn
dTranspose}
  1291716    5.526    0.000    7.299    0.000 twodim_base.py:169(eye)
  1291716    5.492    0.000   12.791    0.000 numeric.py:1884(identity)

Итак, вот мой вопрос:

numpy кажется довольно медленным при вычислении барицентрических координат здесь, стоит ли делать это в c++? Или есть ли способ оптимизировать это по-другому (в python)?


person adrienlucca.net    schedule 06.02.2014    source источник
comment
@VladimirF извините, я по ошибке нажал «опубликовать», не закончив...   -  person adrienlucca.net    schedule 06.02.2014
comment
Вы тратите много времени на преобразование списков python в массивы numpy. Есть ли способ, которым вы можете сразу же построить их как массивы numpy? (Не слишком знаком с numpy, поэтому я, вероятно, говорю о своей залысине...)   -  person molbdnilo    schedule 06.02.2014
comment
Возможно ли удалить отсюда какой-либо numpy и запустить его через pypy?   -  person adrienlucca.net    schedule 06.02.2014
comment
@molbdnilo, вы правы, если он понизит цикл for до уровня numpy, он должен сильно ускориться   -  person usethedeathstar    schedule 06.02.2014
comment
Вы, вероятно, обнаружите, что line_profiler дает гораздо более полезный результат, чем cProfile   -  person ali_m    schedule 07.02.2014


Ответы (1)


Настоящим поглотителем времени, скорее всего, будет инверсия матрицы, которую вы делаете в barycentric_coords:

    v = np.dot(la.inv(T), np.array(point)-vertices[-1])

Помните, что практически во всех случаях: не инвертировать эта матрица!

Вы можете заменить эту строку на:

v = np.linalg.lstsq(T, np.array(point)-vertices[-1])[0]

Чтобы получить тот же результат с гораздо более быстрым решением методом наименьших квадратов.

person perimosocordiae    schedule 06.02.2014