Почему ndimage.label(image) помечает лишние фигуры среди рассмотренных?

Когда я использую ndimage.label(img), импортированный из пакета scipy, для маркировки изображения PNG в оттенках серого, оно ведет себя следующим образом.
У меня есть два изображения с некоторыми формами, созданными Photoshop:
Первое изображение:
http://imageshack.us/a/img140/8669/onehx.png
Я выполняю этот код на изображении выше.

>>> from scipy.misc import imread
>>> from scipy.ndimage import (label,find_objects)

>>> img=imread('first.jpg')
>>> x,y = label(img)
>>> print y                 # Prints exactly "4" shapes ,which is right.
4

>>> f=find_objects(x)
>>> print f                 # Returns exactly the "4" slices of the considered shapes.
[(slice(16L, 61L, None), slice(149L, 189L, None)),  
(slice(30L, 40L, None), slice(60L, 90L, None)),  
(slice(50L, 70L, None), slice(20L, 120L, None)),  
(slice(96L, 149L, None), slice(130L, 186L, None))]

До сих пор все работало нормально.
Но когда я делаю фигуру с помощью гладкой кисти, как показано здесь:

Второе изображение:
http://imageshack.us/a/img822/5696/twozg.png
Я выполняю этот код на втором изображении

>>> from scipy.misc import imread
>>> from scipy.ndimage import (label,find_objects)

>>> img=imread('second.jpg')
>>> x,y = label(img)
>>>print y               # Prints more than "5" shapes ,which is wrong.
6

>>> f=find_objects(x)
>>> print f               # Return more than the "5" slices of the considered shapes.
                          #But still has the "5" slices of the "5" considered shapes 
                          #among the other slices which I'm confused of.  
[(slice(16L, 61L, None), slice(149L, 189L, None)),  
(slice(30L, 40L, None), slice(60L, 90L, None)),  
(slice(50L, 70L, None), slice(20L, 120L, None)),  
(slice(96L, 149L, None), slice(130L, 186L, None)),  
(slice(126L, 170L, None), slice(65L, 109L, None)),  
(slice(127L, 128L, None), slice(79L, 80L, None))]    #This is the extra object.

Я просто хочу знать, почему ndimage.label(img) помечает больше фигур, чем рассматриваемые, когда я использую гладкую кисть.
Да, она может помечать рассматриваемые фигуры, но зачем лишняя маркировка и как я могу избавиться от лишних помеченных фигур.

Примечание:
(1)Дополнительные фигуры - это даже не фигуры, а своего рода тонкие черные области.!!
(2)Они ведут себя так же, если изображение было в формате RGB.
( 3) шаблон ненулевых значений в фигуре, нарисованной гладкой кистью, выглядит так:

>>> obj_6            #Not quite right but it's similar to this structure
array([[  0,   0,   1,   1,   1,   1,   0,   0],  
       [  0,   1,   6,  12,  15,   9,   3,   0],  
       [  0,   7,  24,  50,  57,  35,  12,   1],  
       [  2,  14,  52, 105, 119,  74,  24,   3],
       [  2,  16,  60, 122, 139,  86,  29,   4],
       [  1,  10,  37,  77,  88,  54,  18,   3],
       [  0,   3,  12,  25,  29,  18,   5,   1],
       [  0,   0,   1,   4,   5,   3,   1,   0]], dtype=uint8)

(4) Чтобы получить полную картину:
один:
введите здесь описание изображениядва:< br> введите здесь описание изображения
Спасибо за терпение.

Обновление(1):
Чтобы внести ясность, я разместил два изображения и соответствующие результаты:


person Someone Someoneelse    schedule 05.10.2012    source источник
comment
Спасибо за добавление obj_6. Не могли бы вы также опубликовать second.jpg где-нибудь?   -  person Warren Weckesser    schedule 07.10.2012
comment
Вы имеете в виду формат jpg второго.png???   -  person Someone Someoneelse    schedule 07.10.2012
comment
ОК, файл PNG есть, спасибо. Когда я запускаю label(img) в файле twozg.png, используя структуру по умолчанию (структуру +), я получаю 6 функций, потому что форма кисти имеет один пиксель, который соединен с остальными только одной диагональю. Если я использую полную структуру 3x3, я получаю 5 функций.   -  person Warren Weckesser    schedule 07.10.2012
comment
Хотя я уже пробовал это со структурой (3x3) перед публикацией, но пробую сейчас, я вижу, что это работает, так что в конце концов вы правы, лол. Спасибо.   -  person Someone Someoneelse    schedule 07.10.2012


Ответы (2)


Как выглядит узор ненулевых значений в фигуре, нарисованной гладкой кистью? Если там много нулей, label найдет много несвязанных функций.

Например, с этим блоком пикселей 4x4:

In [16]: img
Out[16]: 
array([[ 0. ,  0.5,  0. ,  1. ],
       [ 0. ,  0.5,  0.5,  0. ],
       [ 0.5,  0. ,  1. ,  0. ],
       [ 0.5,  0. ,  1. ,  0. ]])

label(img) находит три функции:

In [17]: lbl, n = label(img)

In [18]: lbl
Out[18]: 
array([[0, 1, 0, 2],
       [0, 1, 1, 0],
       [3, 0, 1, 0],
       [3, 0, 1, 0]])

In [19]: n
Out[19]: 3

Я подозреваю, что это то, что происходит с пикселями, нарисованными гладкой кистью.

person Warren Weckesser    schedule 06.10.2012
comment
У вас есть точка зрения, но я так не думаю по двум причинам: (1) Это дает тот же результат, используя параметр структуры внутри label... (2) Это может пометить всю гладкую форму кисти. - person Someone Someoneelse; 06.10.2012
comment
Мистер Уоррен, вы можете указать эту структуру в качестве параметра, чтобы понять, что я имею в виду. s= generate_binary_structure(2,2)..labl,n=label(img,s) - person Someone Someoneelse; 06.10.2012
comment
Конечно, для моего примера полная структура 3x3 приводит к одному признаку, но в целом это зависит от того, насколько редки нули в фигуре, нарисованной гладкой кистью. Даже полная двоичная структура 3x3 может привести к множеству функций, если там достаточно нулей. Увеличьте небольшой участок рядом с краем и осмотрите отдельные пиксели. Это должно помочь вам определить, достаточно ли плотны ненулевые пиксели, чтобы гарантировать, что сглаженная форма кисти действительно представляет собой единую функцию. - person Warren Weckesser; 07.10.2012
comment
Г-н Уоррен. Возможно, вы захотите еще раз прочитать мой вопрос, поскольку я разместил фактические изображения с соответствующими результатами. - person Someone Someoneelse; 07.10.2012

Чтобы ответить на ваш вопрос, причина, по которой он помечает дополнительную область, заключается в том, что вы используете структуру по умолчанию с возможностью подключения, равной единице, и она не знает, как искать диагональное соединение.

В дополнение к тому, что указал Уоррен, там, где требуется надежная маркировка (которая будет рассматривать диагональные пиксели как связанные), можно изменить эту структуру. Структура по умолчанию выглядит следующим образом

In [32]: ndimage.morphology.generate_binary_structure(2, 1).astype("uint8")
Out[32]: 
array([[0, 1, 0],
       [1, 1, 1],
       [0, 1, 0]], dtype=uint8)

Который имеет связность 1. Это распространяется на любое трехмерное изображение, с которым вы работаете.

Если вы хотите использовать маркировку, не беспокоясь о небольших дополнениях, которые вы получаете по умолчанию, вы можете изменить вызов ndimage.label, добавив аргумент ключевого слова «структура». Структура (или ядро) представляет собой бинарный объект того же ранга, что и изображение (размерность), и может быть легко изменена. Для создания полного ранга

In [41]: struct=np.ones((3,3), dtype="bool8")

In [42]: struct
Out[42]: 
array([[ True,  True,  True],
       [ True,  True,  True],
       [ True,  True,  True]], dtype=bool)
In [43]: ndimage.label(img, structure=struct)

По идее, это должно решить вопрос с добавлением в результат мелких объектов.

person Trevor    schedule 13.12.2012