มีวิธีระบุคำนามวลีที่คล้ายกันหรือไม่ บางคนแนะนำให้ใช้แนวทางตามรูปแบบ เช่น X as Y
expressions:
ยูเซน โบลต์ รับบทเป็น สปรินท์คิง
ลิเวอร์พูลเป็นหงส์แดง
มีวิธีระบุคำนามวลีที่คล้ายกันหรือไม่ บางคนแนะนำให้ใช้แนวทางตามรูปแบบ เช่น X as Y
expressions:
ยูเซน โบลต์ รับบทเป็น สปรินท์คิง
ลิเวอร์พูลเป็นหงส์แดง
มีเทคนิคมากมายในการค้นหาชื่ออื่นสำหรับเอนทิตีที่กำหนด โดยใช้รูปแบบต่างๆ เช่น:
X also known as Y
X also titled as Y
และการสแกนเอกสารจำนวนมาก (เช่น วิกิพีเดีย หรือบทความในหนังสือพิมพ์) เป็นวิธีหนึ่งที่จะทำได้
นอกจากนี้ยังมีทางเลือกอื่น ๆ ที่ฉันจำได้คือการใช้โครงสร้างลิงก์ระหว่างวิกิพีเดีย โดยการสำรวจลิงก์เปลี่ยนเส้นทางระหว่างบทความ คุณสามารถดาวน์โหลดไฟล์ที่มีรายการการเปลี่ยนเส้นทางได้จากที่นี่: https://wiki.dbpedia.org/Downloads2015-04 และการสำรวจไฟล์ คุณจะพบชื่อ/คำพ้องความหมายอื่นสำหรับเอนทิตี เช่น:
Kennedy_Centre -> John_F._Kennedy_Center_for_the_Performing_Arts>
Lord_Alton_of_Liverpool -> David_Alton,_Baron_Alton_of_Liverpool
Indiana_jones_2 -> Indiana_Jones_and_the_Temple_of_Doom
อีกสิ่งหนึ่งที่คุณสามารถทำได้คือรวมเทคนิคทั้งสองนี้เข้าด้วยกัน เช่น ค้นหาส่วนของข้อความที่มีทั้ง Indiana Jones
และ Indiana_Jones_and_the_Temple_of_Doom
เกิดขึ้นและไม่ได้ห่างกันเกินกว่า เช่น โทเค็น 4 หรือ 5 อัน คุณอาจพบรูปแบบเช่น also titled as
จากนั้นคุณสามารถใช้รูปแบบเหล่านี้เพื่อค้นหาคำพ้องความหมาย/ชื่อทางเลือกเพิ่มเติม