เหตุใด ndimage.label(image) จึงติดป้ายกำกับรูปร่างพิเศษในกลุ่มที่พิจารณา

เมื่อฉันใช้ ndimage.label(img) นำเข้าจากแพ็คเกจ scipy เพื่อติดป้ายกำกับรูปภาพ PNG ระดับสีเทา มันจะทำงานเช่นนี้
ฉันมีสองภาพที่มีรูปร่างบางอย่างที่สร้างโดย Photoshop:
รูปภาพแรก :
http://imageshack.us/a/img140/8669/onehx.png
ฉันใช้รหัสนี้กับภาพด้านบน

>>> from scipy.misc import imread
>>> from scipy.ndimage import (label,find_objects)

>>> img=imread('first.jpg')
>>> x,y = label(img)
>>> print y                 # Prints exactly "4" shapes ,which is right.
4

>>> f=find_objects(x)
>>> print f                 # Returns exactly the "4" slices of the considered shapes.
[(slice(16L, 61L, None), slice(149L, 189L, None)),  
(slice(30L, 40L, None), slice(60L, 90L, None)),  
(slice(50L, 70L, None), slice(20L, 120L, None)),  
(slice(96L, 149L, None), slice(130L, 186L, None))]

จนถึงตอนนี้ก็ใช้งานได้ดี
แต่เมื่อฉันสร้างรูปร่างด้วยแปรงที่เรียบเนียนดังที่แสดงไว้ที่นี่:

ภาพที่สอง:
http://imageshack.us/a/img822/5696/twozg.png
ฉันใช้โค้ดนี้กับรูปภาพที่สอง

>>> from scipy.misc import imread
>>> from scipy.ndimage import (label,find_objects)

>>> img=imread('second.jpg')
>>> x,y = label(img)
>>>print y               # Prints more than "5" shapes ,which is wrong.
6

>>> f=find_objects(x)
>>> print f               # Return more than the "5" slices of the considered shapes.
                          #But still has the "5" slices of the "5" considered shapes 
                          #among the other slices which I'm confused of.  
[(slice(16L, 61L, None), slice(149L, 189L, None)),  
(slice(30L, 40L, None), slice(60L, 90L, None)),  
(slice(50L, 70L, None), slice(20L, 120L, None)),  
(slice(96L, 149L, None), slice(130L, 186L, None)),  
(slice(126L, 170L, None), slice(65L, 109L, None)),  
(slice(127L, 128L, None), slice(79L, 80L, None))]    #This is the extra object.

ฉันแค่อยากรู้ว่าทำไม ndimage.label(img) ถึงติดป้ายกำกับมากกว่ารูปร่างที่พิจารณาเมื่อฉันใช้แปรงเรียบ
ใช่ มันสามารถติดป้ายกำกับรูปร่างที่พิจารณาได้ แต่ทำไมถึงติดป้ายกำกับเพิ่มเติม และฉันจะกำจัดรูปร่างที่มีป้ายกำกับพิเศษได้อย่างไร

หมายเหตุ:
(1) รูปร่างพิเศษนั้นไม่ใช่รูปร่างแม้แต่น้อย มันเป็นพื้นที่สีดำบางๆ!!
(2)มันจะทำงานในลักษณะเดียวกันหากรูปภาพอยู่ในรูปแบบ RGB
( 3)รูปแบบของค่าที่ไม่ใช่ศูนย์ในรูปร่างที่วาดด้วยแปรงเรียบมีลักษณะดังนี้:

>>> obj_6            #Not quite right but it's similar to this structure
array([[  0,   0,   1,   1,   1,   1,   0,   0],  
       [  0,   1,   6,  12,  15,   9,   3,   0],  
       [  0,   7,  24,  50,  57,  35,  12,   1],  
       [  2,  14,  52, 105, 119,  74,  24,   3],
       [  2,  16,  60, 122, 139,  86,  29,   4],
       [  1,  10,  37,  77,  88,  54,  18,   3],
       [  0,   3,  12,  25,  29,  18,   5,   1],
       [  0,   0,   1,   4,   5,   3,   1,   0]], dtype=uint8)

(4) เพื่อให้ได้ภาพรวมทั้งหมด :
หนึ่ง:
ป้อนคำอธิบายรูปภาพที่นี่ สอง:< br>
ขอขอบคุณที่อดทนรอ

อัปเดต (1):
เพื่อให้ชัดเจน ฉันจึงโพสต์ภาพสองภาพและผลลัพธ์ที่เกี่ยวข้อง:

python numpy scipy

Someone Someoneelse 05.10.2012 แหล่งที่มา

comment

ขอบคุณที่เพิ่ม obj_6 คุณสามารถโพสต์ second.jpg ที่ไหนสักแห่งได้ไหม - Warren Weckesser 07.10.2012

comment

คุณหมายถึงรูปแบบ jpg ของ Second.png??? - Someone Someoneelse 07.10.2012

comment

ตกลง มีไฟล์ PNG อยู่ด้วย--ขอบคุณ เมื่อฉันรัน label(img) บนไฟล์ twozg.png โดยใช้โครงสร้างเริ่มต้น (โครงสร้าง +) ฉันจะได้รับคุณสมบัติ 6 ประการ เนื่องจากรูปร่างแปรงมีหนึ่งพิกเซลที่เชื่อมต่อกับส่วนที่เหลือผ่านเส้นทแยงมุมเดียวเท่านั้น ถ้าฉันใช้โครงสร้าง 3x3 เต็มรูปแบบ ฉันจะได้คุณสมบัติ 5 อย่าง - Warren Weckesser 07.10.2012

comment

แม้ว่าฉันจะลองใช้โครงสร้าง (3x3) แล้วก่อนที่จะโพสต์ แต่ตอนนี้ลองดูแล้วเห็นว่าได้ผล ดังนั้นคุณคิดถูกแล้ว 555 ขอบคุณ - Someone Someoneelse 07.10.2012

คำตอบ (2)

arrow_upward
2
arrow_downward

รูปแบบของค่าที่ไม่ใช่ศูนย์มีลักษณะอย่างไรในรูปร่างที่วาดด้วยแปรงเรียบ หากมีศูนย์จำนวนมากในนั้น label จะพบคุณลักษณะที่ยกเลิกการเชื่อมต่อจำนวนมาก

ตัวอย่างเช่น ด้วยบล็อกพิกเซล 4x4 นี้:

In [16]: img
Out[16]: 
array([[ 0. ,  0.5,  0. ,  1. ],
       [ 0. ,  0.5,  0.5,  0. ],
       [ 0.5,  0. ,  1. ,  0. ],
       [ 0.5,  0. ,  1. ,  0. ]])

label(img) พบคุณสมบัติสามประการ:

In [17]: lbl, n = label(img)

In [18]: lbl
Out[18]: 
array([[0, 1, 0, 2],
       [0, 1, 1, 0],
       [3, 0, 1, 0],
       [3, 0, 1, 0]])

In [19]: n
Out[19]: 3

ฉันสงสัยว่านี่คือสิ่งที่เกิดขึ้นในพิกเซลที่วาดด้วยแปรงเรียบ

Warren Weckesser 06.10.2012

comment

คุณมีประเด็น แต่ฉันไม่คิดอย่างนั้นด้วยเหตุผลสองประการ: (1) มันให้ผลลัพธ์เดียวกันโดยใช้พารามิเตอร์โครงสร้างภายใน label...(2) มันสามารถติดป้ายกำกับรูปร่างแปรงเรียบทั้งหมดได้ - Someone Someoneelse; 06.10.2012

comment

คุณวอร์เรน คุณสามารถใส่โครงสร้างนี้เป็นพารามิเตอร์เพื่อดูว่าฉันหมายถึงอะไร s= Generate_binary_structure(2,2)..labl,n=label(img,s) - Someone Someoneelse; 06.10.2012

comment

แน่นอนว่า สำหรับตัวอย่างของฉัน โครงสร้าง 3x3 แบบเต็มให้ผลลัพธ์เป็นฟีเจอร์เดียว แต่โดยทั่วไป มันขึ้นอยู่กับว่าค่าศูนย์นั้นเบาบางแค่ไหนในรูปร่างที่วาดด้วยแปรงเรียบ แม้แต่โครงสร้างไบนารี่ขนาด 3x3 แบบเต็มก็อาจส่งผลให้เกิดฟีเจอร์หลายอย่างได้ หากมีเลขศูนย์เพียงพอในนั้น ขยายส่วนเล็กๆ ใกล้กับขอบ และตรวจสอบแต่ละพิกเซล ซึ่งจะช่วยให้คุณทราบได้ว่าพิกเซลที่ไม่ใช่ศูนย์มีความหนาแน่นเพียงพอที่จะรับประกันว่ารูปร่างแปรงที่เรียบเนียนนั้นเป็นคุณสมบัติเดียวจริงๆ หรือไม่ - Warren Weckesser; 07.10.2012

comment

คุณวอร์เรน คุณอาจต้องการอ่านคำถามของฉันอีกครั้งเมื่อฉันโพสต์ภาพจริงพร้อมผลลัพธ์ที่เกี่ยวข้อง - Someone Someoneelse; 07.10.2012

arrow_upward
7
arrow_downward

เพื่อตอบคำถามของคุณ เหตุผลที่ป้ายพื้นที่เพิ่มเติมนั้นเป็นเพราะคุณใช้โครงสร้างเริ่มต้นที่มีการเชื่อมต่อแบบหนึ่ง และไม่รู้ว่าจะต้องมองหาการเชื่อมต่อในแนวทแยง

นอกเหนือจากสิ่งที่ Warren ชี้ให้เห็น ซึ่งจำเป็นต้องมีการติดฉลากที่มีประสิทธิภาพ (ซึ่งจะถือว่าพิกเซลในแนวทแยงเชื่อมต่อกัน) เราสามารถเปลี่ยนโครงสร้างนี้ได้ โครงสร้างเริ่มต้นมีดังนี้

In [32]: ndimage.morphology.generate_binary_structure(2, 1).astype("uint8")
Out[32]: 
array([[0, 1, 0],
       [1, 1, 1],
       [0, 1, 0]], dtype=uint8)

ซึ่งมีการเชื่อมต่อที่ 1 ซึ่งขยายไปยังรูปภาพมิติใดก็ตามที่คุณใช้งานอยู่

หากคุณต้องการใช้การติดป้ายกำกับโดยไม่ต้องกังวลกับสิ่งพิเศษเล็กๆ น้อยๆ ที่คุณได้รับตามค่าเริ่มต้น คุณสามารถเปลี่ยนการเรียกเป็น ndimage.label ได้โดยการเพิ่มอาร์กิวเมนต์คำหลัก "โครงสร้าง" โครงสร้าง (หรือเคอร์เนล) เป็นวัตถุไบนารี่ที่มีอันดับเดียวกับรูปภาพ (มิติ) และสามารถเปลี่ยนแปลงได้ง่าย เพื่อสร้างยศเต็มยศ

In [41]: struct=np.ones((3,3), dtype="bool8")

In [42]: struct
Out[42]: 
array([[ True,  True,  True],
       [ True,  True,  True],
       [ True,  True,  True]], dtype=bool)
In [43]: ndimage.label(img, structure=struct)

ตามทฤษฎีแล้ว สิ่งนี้ควรแก้ไขปัญหาการเพิ่มวัตถุขนาดเล็กเข้าไปในผลลัพธ์

Trevor 13.12.2012

เหตุใด ndimage.label(image) จึงติดป้ายกำกับรูปร่างพิเศษในกลุ่มที่พิจารณา

คำตอบ (2)

คำถามในหัวข้อ