Jina SEKARANG adalah solusi lengkap berbasis Python untuk pengindeksan multimodal dan pengambilan informasi. Ini mendukung beberapa pasangan mode yang berbeda, namun artikel ini menguraikan langkah-langkah untuk menerapkan solusi penelusuran teks-ke-gambar dan gambar-ke-gambar yang praktis, tanpa kode sama sekali.

Kami akan memandu Anda melalui langkah-langkah untuk membuat mesin pencari teks-ke-gambar Anda sendiri hanya dengan direktori gambar dan instalasi Jina SEKARANG. Jika Anda ingin melewati semua langkah ini sekarang dan hanya melihat hasilnya, gulir ke bawah ke bagian berjudul Tidak bisakah kita lewati saja?

Persyaratan

  1. Komputer yang kompatibel dengan UNIX. MacOS baik-baik saja, seperti halnya Subsistem Windows untuk Linux, tetapi tidak untuk Windows murni. Lihat saran instalasi di situs web Jina AI untuk informasi lebih lanjut.
  2. Koneksi internet.
  3. Instalasi Python 3.7 atau lebih tinggi. (“Petunjuk instalasi dari python.org.”) Instalasi Python Anda harus menyertakan pip. Ini biasanya diinstal ketika Anda menginstal Python, tetapi jika tidak, “ikuti instruksi di situs web Python”.

Mengumpulkan Data Merek Dagang

Pendaftaran merek dagang di AS dilakukan melalui Kantor Paten AS. Gambar dan deskripsi merek dagang merupakan bagian dari catatan publik dan tersedia melalui “antarmuka pengunduhan data massal” dan “mesin pencari publik”.

Catatan ini dalam format XML dan JPG, dan diperlukan upaya untuk menguraikannya. Ini bukan tutorial tentang cara memproses data catatan publik USPTO, jadi kami telah melakukan pekerjaannya untuk Anda. Kami telah mengekstrak 16612 gambar merek dagang desain AS (bukan merek dagang yang hanya berupa slogan atau nama) yang mana terdapat beberapa tindakan pendaftaran pada Agustus 2022. Anda dapat mengunduhnya dari Google Drive. Buka zip file yang diunduh ke lokasi yang nyaman di sistem file lokal Anda. File-file tersebut akan berada di direktori bernama tm_designs.

Anda dapat memeriksa sendiri gambarnya. Sebagian besar berwarna hitam-putih atau abu-abu, namun ada juga yang berwarna. Ini mencakup beberapa logo terkenal, misalnya:

Dan:

Dan logo penuh warna yang sangat jelas ini didaftarkan untuk orang pribadi:

Setiap gambar dalam format JPG dengan latar belakang putih. Nama file adalah nomor registrasi merek dagang. Misalnya, file 73139391.jpg berhubungan dengan Nomor Pendaftaran Merek Dagang AS 73139391, dan terlihat seperti ini:

Instal Jina SEKARANG

Di baris perintah, jalankan:

pip install jina-now

Pengguna Python yang mahir mungkin ingin melakukan instalasi ini di lingkungan virtual, untuk menghilangkan risiko ketergantungan yang tidak kompatibel, namun hal ini tidak sepenuhnya diperlukan.

Dapatkan Akun Jina AI

Mendaftar untuk akun Jina adalah opsional. Namun, pendaftarannya gratis dan memberi Anda akses gratis ke cloud hosting kami untuk kemudahan penerapan, penskalaan, dan pemantauan aplikasi pencarian Anda.

Langkah-langkah yang dijelaskan dalam artikel ini kemungkinan akan memakan waktu lebih sedikit untuk dijalankan di cloud Jina dibandingkan di komputer Anda sendiri.

Untuk mendapatkan akun Jina, buka Jina Hub dan klik tombol login di halaman web itu.

Menjalankan Jina SEKARANG

Setelah Jina SEKARANG diinstal, buka terminal baris perintah dan jalankan:

jina now start

Jika Jina SEKARANG terinstal dengan benar, Anda akan melihat ini di terminal baris perintah Anda:

Pencarian Teks ke Gambar

Pertama, kita akan membuat mesin telusur yang mengambil masukan teks, misalnya “elang” atau “sepatu”, dan menemukan gambar merek dagang yang cocok.

  • Pilih opsi pertama di Jina SEKARANG: text to image search

Anda akan melihat layar seperti ini:

  • Pilih opsi ketiga: excellent

Kami dapat memilih yang lain, namun hal ini akan memberikan hasil yang kurang akurat. Anda kemudian akan melihat layar seperti ini:

  • Pilih opsi terakhir: custom

Anda kemudian akan melihat sesuatu seperti ini:

  • Pilih opsi ketiga, Local path, lalu masukkan jalur ke direktori tm_designs dari file zip gambar merek dagang yang Anda unduh dari Google Drive.

Anda sekarang akan mendapatkan layar seperti ini:

Kami menyarankan Anda memilih Jina Cloud. Data merek dagang akan diunggah ke server Jina, yang akan mengindeksnya dan memungkinkan Anda mencarinya melalui antarmuka HTTPS REST, dan dari halaman web yang dapat Anda gunakan sebagai “taman bermain” pencarian. Ini mengharuskan Anda memiliki akun Jina, seperti yang dijelaskan di bagian sebelumnya.

Alternatifnya — Local— akan melakukan pengindeksan di komputer Anda dan membangun mesin pencari ke dalam wadah Docker, lalu menginstalnya dan menjalankannya di Docker. Jika Anda memilih opsi ini, Anda harus sudah menginstal dan menjalankan Docker.

Pengindeksan dan pengoperasian secara lokal hampir pasti akan memakan lebih banyak waktu dan menghabiskan banyak sumber daya lokal.

Anggaplah Anda memilih Jina Cloud. Anda akan mendapatkan layar seperti ini:

Jika Anda memilih yes, akses ke mesin pencari akan dibatasi untuk Anda dan pengguna lain yang Anda sebutkan secara spesifik. Anda harus memilih opsi ini jika Anda bekerja dengan data Anda sendiri, tetapi karena ini adalah data catatan publik tanpa nilai keamanan, Anda dapat dengan bebas memilih no.

Jika semua langkah telah dijalankan dengan benar, Anda akan mendapatkan layar seperti ini:

Jina SEKARANG akan mengumpulkan data Anda, mengunggahnya ke Jina Cloud dan mengindeksnya. Ini akan memakan waktu. Pengunggahan mungkin memerlukan waktu beberapa menit, dan pengindeksan memerlukan waktu beberapa jam.

Ketika Jina SEKARANG selesai mengunggah data dan mulai mengindeksnya, Anda akan melihat layar seperti ini:

Anda harus segera mencatat string IDc2f077f8a7 pada contoh di atas — karena Anda akan memerlukannya untuk mengakses indeks nanti.

Kemungkinan diperlukan waktu lebih dari satu jam (dan mungkin beberapa jam, tergantung beban) untuk menyelesaikan pengindeksan. Jika program Jina SEKARANG yang berjalan di komputer lokal Anda terhenti, atau koneksi internet terputus, jangan khawatir. Data Anda masih diindeks.

Mengakses Indeks

Setelah pengindeksan selesai, Anda dapat menanyakan data merek dagang menggunakan REST API yang terhubung ke Jina Cloud. REST API ini menggunakan JSON untuk pertukaran informasi dan Anda dapat membangun aplikasi di sekitarnya.

Anda juga dapat mengaksesnya melalui “taman bermain” untuk menguji seberapa baik responsnya terhadap pertanyaan. Menggunakan string ID dari atas, URL untuk taman bermain adalah:

https://nowrun.jina.ai/?host=grpcs://nowapi-<ID_STRING>.wolf.jina.ai&input_modality=text&output_modality=image&data=custom?utm_source=blog-trademark

Ganti saja string ID Anda dengan <ID_STRING>di URL di atas, dan lanjutkan. Indeks Anda akan tetap terpasang di Jina Cloud selama beberapa hari sebelum dihapus secara otomatis.

Layanan Jina Cloud juga tersedia untuk penggunaan komersial. Silakan kirim email ke <@jina.ai> untuk informasi lebih spesifik.

Tidak bisakah kita lewati saja?

Ya. Meskipun langkah-langkah untuk membuat indeks teks-ke-gambar cepat dan sederhana, membuat indeks untuk gambar sebanyak ini memerlukan waktu. Jadi, kami telah "membuat indeks untuk data merek dagang ini yang dapat Anda tanyakan sekarang".

Jika Anda mengikuti tautan itu, Anda akan mendapatkan halaman seperti ini:

Masukkan teks ke dalam kolom masukan dan tekan tombol Telusuri. Misalnya, kueri untuk “anjing dan pemutar rekaman”:

Anda dapat melihat bahwa hasil pertama adalah versi dari logo Suara Masternya RCA yang terkenal. Pencarian ini tidak menggunakan metadata tekstual. AI Jina menyadari bahwa kata “anjing” dan “pemutar rekaman” sangat cocok dengan objek yang digambarkan dalam gambar ini.

Aplikasi taman bermain ini menampilkan sembilan kecocokan terbaik dengan kueri Anda, diurutkan dari kecocokan terbaik hingga terburuk. Terkadang kueri akan memberikan hasil yang buruk karena tidak ada satu pun dalam indeksnya yang cocok. Kadang-kadang, beberapa pertandingan pertama akan bagus – misalnya untuk “anjing dan pemain rekaman” – dan pertandingan lainnya jauh lebih buruk.

Merek dagang memiliki deskripsi teks formal yang disertakan dalam pengajuannya. Misalnya, berikut adalah deskripsi teks nomor merek dagang AS 97112227:

Tanda tersebut terdiri dari orang berkerudung bergaya yang sedang mengetik di laptop menampilkan cumi-cumi terbalik dengan tentakel yang mengelilingi orang tersebut. Tudung dan jubah orang tersebut berwarna hitam dengan corak putih dan abu-abu. Wajah orang tersebut diwarnai dengan warna biru putih dengan corak warna hitam. Mata berwarna kuning. Tangannya berwarna krem. Laptop tersebut berwarna hitam, putih, dan abu-abu. Cumi-cumi berwarna merah diberi garis hitam. Cumi-cumi ini memiliki warna biru, putih, dan oranye. Mata cumi-cumi berwarna kuning dan hitam. Gigi cumi-cumi berwarna putih dan mulutnya berwarna hitam. Di sekitar beberapa tentakel cumi terdapat garis melengkung berwarna hitam. Warna putih di dalam tentakel melambangkan latar belakang dan/atau area transparan dan bukan merupakan bagian dari tanda.

Anda dapat melihat seperti apa tanda tersebut di situs web Kantor Paten & Merek Dagang AS:

Mari tempel seluruh teks deskripsi merek dagang ke Jina SEKARANG:

Anda dapat melihat bahwa ia menemukan merek dagang yang cocok, murni berdasarkan pemrosesan gambar cerdas dan penguraian teks bahasa alami.

Pencarian Gambar-ke-Gambar pada Data Merek Dagang

Sebagai penerapan praktis lainnya dari teknologi pencarian Jina NOW, bayangkan Anda memiliki desain yang ingin Anda beri merek dagang, dan ingin mencari merek dagang serupa. Anda ingin memberikan gambar sebagai masukan dan mencari gambar lain dengan konten serupa.

Ini bukanlah masalah yang sepele. Bayangkan Anda memberikan gambar seekor anjing abu-abu, berharap mendapatkan kembali gambar anjing lain, dan sebagai gantinya Anda mendapatkan gambar anjing abu-abu lainnya. Anda ingin mesin pencari Anda memiliki gagasan manusiawi tentang arti “serupa”, dengan memahami hal-hal yang digambarkan dalam gambar.

Anda dapat melakukan ini dengan Jina SEKARANG.

Buka terminal baris perintah dan jalankan:

jina now start

Sama seperti sebelumnya, Anda akan melihat ini di terminal baris perintah Anda:

Pindahkan kursor ke pilihan ketigaimage to image search— dan tekan enter.

Kemudian ikuti semua langkah yang sama seperti sebelumnya untuk pencarian teks-ke-gambar. Ketika Jina Cloud telah selesai mengindeks, Anda dapat mengakses indeks Anda melalui URL:

https://nowrun.jina.ai/?host=grpcs://nowapi-<ID_STRING>.wolf.jina.ai&input_modality=image&output_modality=image&data=custom?utm_source=blog-trademark

Ganti saja string ID Anda dengan <ID_STRING>di URL di atas.

Untuk kasus penggunaan ini, kami juga telah menyiapkan indeks data merek dagang bawaan yang dapat Anda gunakan segera.

Anda dapat menyeret gambar ke halaman ini, atau menelusuri file Anda untuk menemukannya, lalu menemukan yang paling cocok di database merek dagang.

Misalnya, membuat kueri menggunakan “logo His Master’s Voice” versi fotografi sekitar tahun 1890 (dikenal sebagai “Nipper” dari nama anjing):

Jina SEKARANG mampu mengenali objek dalam gambar, bahkan ketika digambar atau dari foto yang sangat lama, dan memberikan kecocokan yang lebih intuitif dengan mendasarkan hasil pencariannya pada pengenalan objek tersebut. Ini sangat membantu dalam mengidentifikasi kecocokan gaya yang mirip. Misalnya, parodi logo Starbucks yang terkenal (“ditemukan di Pinterest”):

Meskipun terdapat perbedaan besar dalam artefak yang terlihat antara logo parodi dan versi asli yang kebetulan tersimpan dalam catatan Kantor Merek Dagang Agustus 2022, Jina SEKARANG masih dapat menemukan kecocokan yang tepat.

Cobalah sendiri dan bergabunglah dengan Komunitas Jina

Sekarang setelah Anda melihat kekuatan kerangka penelusuran saraf Jina, dan kemudahan membuat indeks serta menyajikan hasil penelusuran, Anda dapat bereksperimen dengan data Anda sendiri dan memutuskan apakah Jina SEKARANG dapat menambah nilai pada bisnis Anda.

Kami akan dengan senang hati mendengar pendapat Anda dan membicarakan kasus penggunaan Anda. Anda dapat bergabung dengan komunitas pengguna kami yang berkembang pesat di Slack.

Belajarlah lagi

Ingin menggali lebih dalam ekosistem Jina? Berikut beberapa sumber: