Saya memiliki file data yang berisi lebih dari 2000 baris dan 45001 kolom.
Kolom pertama sebenarnya adalah "string" yang menjelaskan tipe datanya.
Mulai dari kolom #2, sampai dengan kolom #45001, datanya direpresentasikan sebagai
"1"
or
"0"
Misalnya pola data dalam satu garis adalah
(0 0 0
1 1
01 1 1
01 1 1 1
0 0 01
0 01 1 1
0 0)
Jumlah datanya adalah 25. Dalam baris data ini terdapat 5 subkelompok yang dibuat hanya dengan angka "1", misal. (11
111
1111
1
111
). Angka "0" di antara subgrup diasumsikan sebagai "pembatas". Jumlah semua "1" adalah = 13.
Saya ingin menghitung rasio
(total semua "1" / total jumlah subgrup yang dibuat hanya dengan "1")
Itu adalah
(13/5).
Saya mencoba dengan kode ini untuk menghitung total semua "1" ;
awk -F '0' '{print NF}' < inputfile.in
Ini memberi nilai 13.
Tapi saya tidak tahu bagaimana melangkah lebih jauh dari sini untuk menghitung rasio yang saya inginkan. Saya tidak tahu bagaimana menemukan jumlah subgrup dalam setiap baris karena jumlah kemunculan "1" dan "0" adalah acak.
Ingin mendapatkan bantuan untuk menyelesaikan masalah ini.
Hargai bantuan apa pun sebelumnya.