Apakah ada cara untuk mengidentifikasi frasa kata benda yang serupa. Beberapa menyarankan penggunaan pendekatan berbasis pola, misalnya ekspresi X as Y
:
Usain Bolt sebagai Raja Sprint
Liverpool sebagai Merah
Apakah ada cara untuk mengidentifikasi frasa kata benda yang serupa. Beberapa menyarankan penggunaan pendekatan berbasis pola, misalnya ekspresi X as Y
:
Usain Bolt sebagai Raja Sprint
Liverpool sebagai Merah
Ada banyak teknik untuk menemukan nama alternatif untuk entitas tertentu, menggunakan pola seperti:
X also known as Y
X also titled as Y
dan memindai banyak koleksi dokumen (misalnya Wikipedia atau artikel surat kabar) adalah salah satu cara untuk melakukannya.
Ada juga alternatif lain, salah satu yang saya ingat adalah menggunakan struktur antar tautan Wikipedia, misalnya dengan menjelajahi tautan pengalihan antar artikel. Anda dapat mengunduh file dengan daftar pengalihan dari sini: https://wiki.dbpedia.org/Downloads2015-04 dan menjelajahi file tersebut, Anda dapat menemukan nama/sinonim alternatif untuk entitas, misalnya:
Kennedy_Centre -> John_F._Kennedy_Center_for_the_Performing_Arts>
Lord_Alton_of_Liverpool -> David_Alton,_Baron_Alton_of_Liverpool
Indiana_jones_2 -> Indiana_Jones_and_the_Temple_of_Doom
Hal lain yang dapat Anda lakukan adalah menggabungkan kedua teknik ini, misalnya mencari segmen teks di mana Indiana Jones
dan Indiana_Jones_and_the_Temple_of_Doom
muncul dan jaraknya tidak lebih dari, katakanlah, 4 atau 5 token. Anda mungkin menemukan pola seperti also titled as
, lalu Anda dapat menggunakan pola ini untuk menemukan lebih banyak sinonim/nama alternatif.