/ / пресмятане на разстояние между две numpy масиви - python, numpy, scipy

изчисляване на разстоянието между две измамни масиви - питон, тромав, скип

Интересувах се от изчисляване на различни пространствени разстояния между две масиви от нуми (x и y).

http://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.spatial.distance.cdist.html

import numpy as np
from scipy.spatial.distance import cdist

x = np.array([[[1,2,3,4,5],
[5,6,7,8,5],
[5,6,7,8,5]],
[[11,22,23,24,5],
[25,26,27,28,5],
[5,6,7,8,5]]])
i,j,k = x.shape

xx = x.reshape(i,j*k).T

y = np.array([[[31,32,33,34,5],
[35,36,37,38,5],
[5,6,7,8,5]],
[[41,42,43,44,5],
[45,46,47,48,5],
[5,6,7,8,5]]])

yy = y.reshape(i,j*k).T

results =  cdist(xx,yy,"euclidean")
print results

Въпреки това, горните резултати произвеждат твърде много нежелани резултати. Как мога да го огранича само за желаните от мен резултати.

Искам да изчисля разстоянието между [1,11] и [31,41]; [2,22] и [32,42], ... и така нататък.

Отговори:

4 за отговор № 1

Ако просто искате разстоянията между всяка двойка точки, тогава не е необходимо да изчислявате матрица за пълно разстояние.

Вместо това, изчислете го директно:

import numpy as np

x = np.array([[[1,2,3,4,5],
[5,6,7,8,5],
[5,6,7,8,5]],
[[11,22,23,24,5],
[25,26,27,28,5],
[5,6,7,8,5]]])

y = np.array([[[31,32,33,34,5],
[35,36,37,38,5],
[5,6,7,8,5]],
[[41,42,43,44,5],
[45,46,47,48,5],
[5,6,7,8,5]]])

xx = x.reshape(2, -1)
yy = y.reshape(2, -1)
dist = np.hypot(*(xx - yy))

print dist

За да обясним малко повече за това какво се случва, първо променете масите така, че да имат 2xN форма (-1 е контейнер, който указва на numpy да изчислява правилния размер по тази ос автоматично):

In [2]: x.reshape(2, -1)
Out[2]:
array([[ 1,  2,  3,  4,  5,  5,  6,  7,  8,  5,  5,  6,  7,  8,  5],
[11, 22, 23, 24,  5, 25, 26, 27, 28,  5,  5,  6,  7,  8,  5]])

Следователно, когато изваждаме xx и yyще получим 2xN масив:

In [3]: xx - yy
Out[3]:
array([[-30, -30, -30, -30,   0, -30, -30, -30, -30,   0,   0,   0,   0,
0,   0],
[-30, -20, -20, -20,   0, -20, -20, -20, -20,   0,   0,   0,   0,
0,   0]])

След това можем да разопаковаме това в dx и dy компонента:

In [4]: dx, dy = xx - yy

In [5]: dx
Out[5]:
array([-30, -30, -30, -30,   0, -30, -30, -30, -30,   0,   0,   0,   0,
0,   0])

In [6]: dy
Out[6]:
array([-30, -20, -20, -20,   0, -20, -20, -20, -20,   0,   0,   0,   0,
0,   0])

И изчисли разстоянието (np.hypot е еквивалентно на np.sqrt(dx**2 + dy**2)):

In [7]: np.hypot(dx, dy)
Out[7]:
array([ 42.42640687,  36.05551275,  36.05551275,  36.05551275,
0.        ,  36.05551275,  36.05551275,  36.05551275,
36.05551275,   0.        ,   0.        ,   0.        ,
0.        ,   0.        ,   0.        ])

Или можем да извършим автоматично разопаковането и да го направим в една стъпка:

In [8]: np.hypot(*(xx - yy))
Out[8]:
array([ 42.42640687,  36.05551275,  36.05551275,  36.05551275,
0.        ,  36.05551275,  36.05551275,  36.05551275,
36.05551275,   0.        ,   0.        ,   0.        ,
0.        ,   0.        ,   0.        ])

Ако искате да изчислите други видове разстояния, просто променете np.hypot към функцията, която искате да използвате. Например за разстояния от Манхатън / град:

In [9]: dist = np.sum(np.abs(xx - yy), axis=0)

In [10]: dist
Out[10]: array([60, 50, 50, 50,  0, 50, 50, 50, 50,  0,  0,  0,  0,  0,  0])