Apa yang telah kita pelajari dalam proyek regulasi AI?

Seperti yang saya yakin Anda sudah menyadarinya, saya telah beralih menulis catatan mingguan saya dari Kamis malam ke Jumat malam. Melakukannya di awal akhir pekan jauh lebih mudah bagi saya dan apa pun alasannya, terasa lebih mudah menulis kata-kata setelah seminggu yang panjang dan memuaskan dibandingkan pada Kamis malam ketika saya masih punya satu hari lagi di akhir pekan.

Minggu ini saya menghabiskan banyak waktu untuk merencanakan masa depan proyek yang telah saya bagikan kepada Anda dalam catatan mingguan saya selama 47 minggu. Saya juga mulai memikirkan apa yang akan terjadi selanjutnya dalam hal proyek dan saya akan mengambil beberapa baris untuk menjelaskan beberapa ide yang paling saya sukai. Saya tidak dapat menjanjikan bahwa semuanya akan bertahan, tetapi mungkin hal ini akan menginspirasi orang lain untuk menjangkau atau melakukan pekerjaan itu sendiri. Menurut saya, sebagai pegawai negeri, kita tidak boleh bersaing satu sama lain, ada cukup ruang bagi siapa saja yang ingin berinovasi dan idealnya kita semua harus bekerja sama.

Melihat ke belakang adalah 20/20 — Apa yang diperlukan untuk sukses dengan AI?

Sebagian besar minggu ini dihabiskan untuk merefleksikan apa yang telah dipelajari saat melakukan berbagai proyek regulasi kecerdasan buatan – penggabungan dengan referensi dan platform evaluasi regulasi. Dalam catatan minggu lalu, saya berbagi beberapa “pelajaran yang didapat khususnya seputar pengadaan” tetapi untuk entri minggu ini saya ingin berbagi satu pelajaran khusus yang menurut saya dapat diterapkan bagi siapa saja yang berpikir atau berencana untuk memulai proyek AI.

Tidak mengherankan jika data: kuantitas dan kualitas penting untuk proyek AI. Tanpa data, Anda tidak punya apa-apa. Saya rasa kebanyakan orang memahami betapa pentingnya data untuk proyek AI apa pun. Saya tidak memperdebatkan hal tersebut karena menurut saya pada tingkat tertentu kita semua memahami bahwa AI bukanlah sihir dan tidak hanya “mempelajari” apa pun yang kita inginkan (dan jika menurut Anda demikian… kita harus membicarakannya). Sebaliknya, saya ingin menambahkan detail tentang apa yang saya maksud ketika berbicara tentang kuantitas dan kualitas data.

Setelah Anda mendefinisikan masalah Anda dan memiliki gagasan bagus tentang alasan Anda ingin memecahkan masalah tersebut, sekarang saatnya melakukan penilaian data. Bersikaplah hati-hati dan jujur ​​dalam menilai data apa yang Anda miliki, seberapa bagus data tersebut, dan apakah Anda memiliki cukup data. Tidak ada aturan tegas tentang arti dari kualifikasi ini karena dapat bervariasi dari satu kasus ke kasus lainnya. Namun, Anda ingin memastikan bahwa data Anda (dan praktik pengumpulan data) konsisten, terstandarisasi, dipahami secara umum, dan idealnya dapat dibaca mesin. Anda ingin memastikan orang-orang memahami bahwa kolom data “apel” mengacu pada “semua apel granny smith, apel merah yang lezat” dan bahwa setiap orang yang menghitung apel melakukannya dengan cara yang sama. Anda ingin memastikan bahwa Anda memiliki titik data yang cukup untuk melatih suatu model (biasanya setidaknya beberapa ribu) dan bahwa masalah yang Anda coba selesaikan sebenarnya adalah masalah pembelajaran mesin. Jika Anda tidak memiliki cukup data (baik kualitas maupun kuantitas), apakah Anda punya cara lain untuk mengisi kesenjangan dalam data Anda? Misalnya, jika ini adalah area di mana pakar membedakan item antara dua kategori, dapatkah Anda meminta pakar memberi label pada titik data untuk Anda?

Setelah refleksi dan melihat ke belakang menjadi 20/20, banyak pekerjaan pada tahun lalu akan mendapat manfaat dari analisis awal yang lebih kuat terhadap data yang tersedia, strategi untuk mengisi kesenjangan dan penilaian yang jujur ​​mengenai apakah masalah yang kita coba hadapi adalah 20/20. yang harus dipecahkan memang merupakan sesuatu yang dapat diselesaikan dengan pembelajaran mesin, AI, dan/atau pemrosesan bahasa alami. Terkadang investasi waktu dan sumber daya di awal hanya untuk mengetahui bahwa Anda belum siap menggunakan AI tidak sia-sia.

Proyek Demonstrasi AI (Penggabungan dengan Referensi, Platform Evaluasi Peraturan, Aturan sebagai Kode)

Platform Evaluasi Peraturan: Kami telah melaksanakan opsi pada salah satu kontrak kami dan bersiap untuk memulai tahap berikutnya dari proyek ini. Kami meluangkan waktu untuk melakukan refleksi bersama sekelompok regulator dan ilmuwan data mengenai hasil kerja tahap pertama. Saya merencanakan postingan untuk minggu depan di mana saya berbicara tentang pembelajaran berikutnya seputar lingkup proyek AI, tetapi untuk saat ini kami sedang mempertimbangkannya. Pemikiran awal kami adalah fokus hampir secara eksklusif pada 1 use case, menuntaskan hasil yang mengesankan (dengan banyak iterasi) dan kemudian berpindah ke use case lain. Kasus penggunaan yang kami pilih adalah mengaitkan suatu peraturan dengan 1 atau beberapa kode industri sehingga kami dapat mengetahui secara pasti peraturan mana yang berdampak pada industri mana di seluruh rantai pasokan. Dengan menggunakan informasi ini, kita dapat mulai membuat kesimpulan tentang berapa banyak peraturan yang dihadapi oleh industri tertentu dan berapa banyak beban yang dihadapi industri tersebut.

Penggabungan dengan Referensi: Tidak ada hal besar yang perlu diperbarui pada proyek ini. Kami akan bertemu dengan kontraktor kami minggu depan sebelum pencapaian besar pada tanggal 14 Februari, jadi saya akan memiliki lebih banyak hal untuk dibagikan minggu depan.

Aturan sebagai Kode: Kami mengadakan pertemuan perkenalan antara kontraktor kami dan Program Tenaga Kerja yang merupakan pemilik kasus penggunaan yang kami pilih. Kami sedang melihat “Peraturan Standar Ketenagakerjaan Kanada Bagian 12 dan 13” yang merinci hak pembayaran liburan bagi karyawan yang memenuhi syarat. Peraturan-peraturan ini merupakan peraturan yang menarik untuk memulai dan melibatkan sejumlah konsep menarik untuk kita pahami seperti: apa itu pemberi kerja? apa itu karyawan? bagaimana kita mendefinisikan waktu dan menangkapnya? Sejumlah masalah awal lainnya juga telah diidentifikasi, namun kami berharap bahwa mulai minggu depan ketika kami mengadakan sesi kerja/fasilitasi formal pertama, kami dapat menyampaikan kemajuan signifikan dalam proyek Penemuan tentang Aturan sebagai Kode.

Cuacanya dingin di Ottawa tetapi Minggu ke-47 telah selesai. Semoga minggumu menyenangkan!