У меня есть файл данных, содержащий более 2000 строк и 45001 столбец.
Первый столбец на самом деле представляет собой «строку», которая объясняет тип данных.
Начните со столбца № 2 до столбца № 45001, данные представлены в виде
"1"
or
"0"
Например, шаблон данных в строке
(0 0 0
1 1
01 1 1
01 1 1 1
0 0 01
0 01 1 1
0 0)
Общее количество данных равно 25. В этой строке данных есть 5 подгрупп, которые состоят только из числа «1», например. (11
111
1111
1
111
). «0» между подгруппами считаются «разделителями». Сумма всех «1» = 13.
Я хотел бы рассчитать соотношение
(сумма всех «1» / общее количество подгрупп, составленных только «1»)
То есть
(13/5).
Я попытался использовать этот код для вычисления суммы всех «1»;
awk -F '0' '{print NF}' < inputfile.in
Это дает значение 13.
Но я не знаю, как пойти дальше, чтобы рассчитать соотношение, которое я хочу. Я не знаю, как найти количество подгрупп в каждой строке, потому что количество вхождений «1» и «0» случайно.
Желание получить некоторую помощь, чтобы решить эту проблему.
Оцените любую помощь заранее.