Perusahaan utilitas memiliki jutaan mil saluran listrik dan perlu memeriksanya secara rutin. Anomali pada saluran listrik dapat menimbulkan konsekuensi yang sangat besar, seperti pemadaman listrik dalam jumlah besar, kebakaran hutan, dan membahayakan nyawa. Jutaan tiang saluran listrik harus diperiksa dari berbagai sudut untuk menemukan cacat yang lebarnyahanya beberapa milimeter.

Menelusuri sejumlah besar gambar secara manual untuk menemukan cacat ini adalah tugas yang berat.

Sterblue berhasil mencapai level manusia dalam beberapa tugas segmentasi anomali dan peralatan pada peralatan saluran listrik, dengan menggunakan metode pembelajaran mendalam dan ilmu data yang canggih.

Di sini kami berbagi beberapa wawasan dasar dari pengalaman kami yang terus berkembang, jauh dari klise AI sebagai alat ajaib yang menyelesaikan semua masalah dalam satu klik.

Semuanya Dimulai Dengan Data Yang Baik

Data berlabel berkualitas sangat tinggi diperlukan untuk melatih jaringan saraf dengan sukses. Faktanya adalah pada tahun 2019, agar sukses dalam pembelajaran mesin, Anda memerlukan kumpulan data yang hampir sempurna.

Inilah sebabnya strategi Sterblue adalah menyediakan solusi inspeksi menyeluruh yang mencakup analisis data otomatis dan pengambilan data otomatis. Memiliki rencana penerbangan drone yang bersih, deterministik, dan dapat direproduksi di sekitar saluran listrik penting untuk mendapatkan kumpulan data homogen yang bagus.

Setelah kami mulai menggunakan gambar yang diambil menggunakan perangkat lunak drone, kami melihat peningkatan hasil yang luar biasa dibandingkan saat menggunakan gambar yang diambil dengan cara lain.

Banyak Data

Data berkualitas tinggi adalah satu hal. Namun untuk membuat perbedaan dalam dunia AI terapan, diperlukan akses ke banyak data.

Proyek AI apa pun yang kekurangan data pelatihan dalam jumlah besar dianggap gagal, kecuali dalam kasus yang sangat jarang terjadi di mana pendekatan revolusioner berhasil dikembangkan, namun yang kita bicarakan di sini adalah peristiwa yang terjadi sekali dalam satu dekade. Bagi kami, di seluruh dunia, memiliki corong besar untuk memasukkan data ke dalam sistem adalah hal yang harus dimiliki untuk mendapatkan hasil yang berharga.

Alat akuisisi data Sterblue membantu kami mendapatkan data dalam jumlah besar ini. Namun demikian, menghabiskan banyak energi untuk menyebarkan secara operasional solusi pengambilan data dalam skala besar adalah suatu kebutuhan mutlak. Setiap harinya, puluhan orang terlibat dalam pengambilan data di lapangan sehingga membutuhkan persiapan logistik yang mahal.

Pelabelan Berkualitas Tinggi

Memiliki banyak gambar yang bagus tidak ada gunanya jika pelabelan gambarnya tidak berkualitas. Sterblue memulai dengan melatih jaringan saraf menggunakan gambar yang diberi label oleh pengguna akhir (utilitas) di platform kami. Namun kami memperhatikan bahwa kualitasnya tidak selalu sempurna.

Hal ini masuk akal: pengguna akhir kami adalah orang-orang yang membayar kami agar tidak perlu memberi label pada gambar itu sendiri. Mereka dengan senang hati memberi label pada kumpulan data pada awalnya untuk memulai pipeline AI, namun pada tahun 2019 AI membutuhkan lebih banyak data daripada itu, dan standar kualitas yang lebih tinggi yang tidak dapat diberikan oleh pelanggan kami tanpa terlalu banyak kesulitan di pihak mereka.

Inilah sebabnya kami menggunakan penyedia pelabelan data pihak ketiga untuk membersihkan kumpulan data sehingga kami mendapatkan data yang sempurna untuk pelatihan AI. Peralihan beberapa bulan yang lalu ini merupakan satu-satunya perubahan paling berdampak yang kami terapkan untuk mencapai tujuan kami.

Mengetahui Domain Bisnis

Strategi Sterblue adalah menangani vertikal bisnis satu demi satu. Hal ini terbukti sangat berharga karena kami menyadari bahwa pengetahuan domain bisnis yang mendalam merupakan faktor penting keberhasilan dalam pembelajaran mesin terapan.

Pengetahuan bisnis ini memungkinkan kami merancang representasi data yang sesuai, mengoptimalkan alat pelabelan, memastikan kualitas data, dan banyak aspek lain dari jalur ilmu data.

Melatih jaringan saraf dalam tanpa pengetahuan bisnis sama saja seperti mengajarkan topik yang tidak Anda ketahui sama sekali hanya dengan mengikuti sebuah buku: Anda mungkin berpikir bahwa secara teori hal ini dapat berhasil, namun dalam praktiknya gagal total.

Di sisi lain, pengetahuan bisnis mendetail yang kami pelajari melalui interaksi dengan data dunia nyata selama beberapa tahun merupakan aset yang sangat berharga bagi kami saat ini.

Mewujudkan Sains yang Sulit

Sesuai dengan namanya, ilmu data adalah sebuah ilmu. Beberapa orang menggambarkannya sebagai bentuk seni, tetapi mereka salah.

Ilmu data adalah ilmu pengetahuan, dan itu berarti menilai hasil berdasarkan pengukuran obyektif di kehidupan nyata, dan tidak pernah melupakan kenyataan pahit. Mudah untuk membodohi diri sendiridan merasa antusias melihat beberapa hasil luar biasa yang diberikan AI Anda, padahal di sekelilingnya terdapat lautan hasil sampah. Konsisten metrik obyektif adalah cara yang baik untuk mengetahui di mana tepatnya Anda berada dan apakah Anda menuju ke arah yang benar. Hasil anekdotal tidak demikian.

Kesuksesan dalam AI tidak dicapai dengan melakukan aksi yang unik, namun dengan menerapkan metode tercanggih secara metodis, disertai pragmatisme dan kreativitas dalam jumlah yang sehat.

Kekuatan Pencampuran

Pembelajaran Mesin bukanlah masalah yang terselesaikan sepenuhnya. Artinya untuk satu permasalahan tertentu, beberapa metode dapat memberikan hasil yang baik. Sebagai seorang data scientist, penting untuk terbuka terhadap berbagai pendekatan dan mencobanya untuk menemukan pendekatan yang paling relevan dengan kasus penggunaan.

Seringkali, ketangguhan solusi akhir dicapai dengan menggunakan perpaduan cerdas dari beberapa solusi. Ilustrasinya adalah contoh permusuhan: stiker sederhana atau beberapa piksel yang diubah dapat "menipu beberapa arsitektur jaringan saraf" sehingga membingungkan suatu objek dengan objek lain yang tampaknya tidak berhubungan.

Sama seperti hewan ras murni yang paling rapuh dan hewan ras campuran lebih kuat, penerapan jaringan saraf ras murni terkadang juga rapuh. Produk yang memadukan berbagai pendekatan pembelajaran mesin terapan akan lebih tangguh.

Dukungan Perkakas

Kami melihat bahwa mencapai hasil yang berharga dalam pembelajaran mesin terapan bergantung pada beberapa elemen kunci yang tercantum di atas dalam postingan ini.

Apa yang belum saya bicarakan adalah bahwa masing-masing elemen ini bergantung pada banyak alat agar dapat dilakukan secara efisien. Mengembangkan alat yang mendukung dan mengoptimalkan semua langkah ini sebenarnya adalah inti dari pembelajaran mesin terapan.

Mengembangkan model jaringan neural baru hanyalah sebagian kecil dari kesuksesan pembelajaran mesin terapan. Bagian terbesar dari pekerjaan sebenarnya adalah seluruh alat pendukung yang ada disekitarnya.

Dari antarmuka pelabelan data yang super efisien hingga perencanaan penerbangan drone yang optimal, semua alat Sterblue berpartisipasi dalam mendukung kasus penggunaan yang efisien untuk pembelajaran mesin dalam skala besar.