Di Wallaroo, visi utama kami adalah membuat tombol tekan penerapan AI menjadi mudah dan intuitif. Jika kita merancang sesuatu dan menemukan bahwa hal itu tidak seintuitif yang seharusnya, maka kita tidak takut untuk mencobanya lagi. Setelah beberapa kali pengulangan, kami telah menyederhanakan cara data scientist berinteraksi dengan platform menjadi sebuah konsep inti: model pipeline.

Pipeline berisi semua artefak yang diperlukan untuk proses ML tertentu: tidak hanya semua model terlatih yang terlibat dengan proses tersebut, tetapi juga pemrosesan data perantara apa pun yang mungkin diperlukan agar model dapat berjalan. Saluran pipa yang paling sederhana adalah model tunggal; pipeline yang lebih rumit dapat mencakup model berantai, atau beberapa model yang dibandingkan dalam pengujian A/B atau eksperimen lainnya.

Dalam artikel ini, kita akan membahas fitur pipeline Wallaroo, dan membahas keuntungan mengatur proses ilmu data melalui pipeline.

Fitur Saluran Pipa

Langkah Pemrosesan Menengah

Data dunia nyata sering kali harus disiapkan dan diurutkan sebelum dimasukkan ke dalam model: pemrosesan data dan rekayasa fitur ini sering kali menjadi tanggung jawab data scientist yang membuat model. Misalnya, Anda mungkin memiliki proses ML yang menggunakan teks bahasa alami, seperti pertanyaan, dan menghasilkan jawaban yang dapat dipahami manusia. Hal ini memerlukan langkah prapemrosesan yang mengkodekan teks pertanyaan menjadi representasi numerik yang dapat dipahami model, dan langkah pascapemrosesan yang menerjemahkan keluaran model kembali menjadi teks yang dapat dipahami pengguna.

Melalui Wallaroo, ilmuwan data dapat menerapkan langkah-langkah prapemrosesan dan pascapemrosesan data yang diterapkan dengan Python dengan cara yang sama seperti mereka menerapkan model, melalui SDK kami yang mudah digunakan:

Dengan menyatukan langkah-langkah pemrosesan dan model dalam pipeline Wallaroo, data scientist dapat mendokumentasikan langkah-langkah pemrosesan data yang diperlukan, dan memastikan langkah-langkah tersebut diterapkan secara bersamaan.

Sekarang anggaplah sudah waktunya untuk memperbarui model tanya jawab. Jika model baru menggunakan teks sebelum dan sesudah pemrosesan yang sama, maka Anda dapat dengan mudah memperbarui model di dalam pipeline. Jika model baru menggunakan langkah pemrosesan yang berbeda, membuat pipeline baru dan menerapkannya sebagai pengganti pipeline lama tetap mudah!

Komposabilitas

Alur Wallaroo juga memungkinkan Anda menyusun beberapa model ke dalam satu aliran, termasuk pemrosesan data perantara apa pun yang mungkin diperlukan antar model. Misalnya, Anda mungkin ingin menganalisis artikel berita dengan mengekstraksi entitas yang disebutkan dalam teks, lalu melakukan analisis sentimen pada teks tersebut, termasuk informasi tentang entitas yang diekstraksi.

Hal ini mungkin melibatkan dua model: model ekstraksi entitas, dan model analisis sentimen. Model-model ini (dan pemrosesan data terkait) mungkin dikembangkan secara terpisah. Dengan Wallaroo, Anda dapat menyusun model-model ini ke dalam satu alur dan menerapkannya.

Pengujian A/B dan Penerapan Bayangan

Pipeline Wallaroo juga memiliki konfigurasi eksperimen eksplisit yang memungkinkan Anda membandingkan kinerja berbagai model di dunia nyata. Ini mungkin sebagai pengujian A/B (atau A/B/C…), di mana masukan langsung dialirkan ke berbagai model sesuai dengan kriteria yang dapat ditentukan pengguna. Atau, ini mungkin sebagai penerapan bayangan, di mana model utama dan model bayangan melihat semua masukan, dan prediksinya dicatat, namun hanya respons dari model utama yang dikembalikan ke sistem. Penerapan bayangan memungkinkan ilmuwan data “melihat pratinjau” bagaimana kinerja suatu model pada data dunia nyata sebelum sepenuhnya berkomitmen untuk menggunakannya dalam produksi.

Pemantauan Model

Selain memudahkan proses penerapan, pipeline Wallaroo juga memungkinkan data scientist menambahkan beberapa pemantauan dan peringatan yang berguna. Misalnya, jika Anda menjalankan model penipuan kartu kredit pada transaksi kartu kredit Anda, Anda mungkin ingin memantau dan waspada jika jumlah transaksi yang sangat tinggi ditandai sebagai “penipuan” dalam jangka waktu singkat.

Anda mungkin juga ingin memantau masukan ke model, karena perubahan yang tidak biasa pada masukan model dapat mengakibatkan perilaku model yang tidak diharapkan atau tidak diinginkan. Pemantauan model Wallaroo dapat mengidentifikasi data masukan yang berpotensi anomali serta perilaku model yang tidak biasa, dan mengirimkan peringatan bila diperlukan, sehingga Anda dapat mengatasi potensi masalah sebelum terlambat.

Memfasilitasi Proses Penerapan

Proses pengambilan keputusan berbasis ML dapat memiliki banyak bagian yang bergerak, dan memasukkan proses ini ke dalam produksi dapat memakan waktu. Platform Wallaroo dan salurannya membantu data scientist mengatur dan merancang aplikasi ML dan AI yang kompleks dengan cara yang membuat proses penerapan lebih sederhana, lebih cepat, dan lebih mudah dikelola.

Tertarik untuk menjalankan pengujian untuk melihat bagaimana pipeline ML Wallaroo dibandingkan dengan solusi penerapan Anda saat ini? Hubungi kami di [email protected] agar kami dapat menyiapkan tes penilaian teknis.