Пытаюсь проанализировать распределение задержек в системе. Задержки собираются следующим образом: измеряется максимальная наблюдаемая задержка в минуту, затем, если эта задержка является наибольшей задержкой, наблюдаемой в этот день, это значение записывается. В конце дня у меня получается что-то вроде этого:
[12, 15, 19, ..., 57, 120]
Это время вызовов API в миллисекундах за один день. Мне нужно построить какую-нибудь полезную метрику из этих данных, но я не знаю как! Очевидно, не имеет смысла вычислять среднее или медианное значение из этого набора данных. Это не будет реальным медианным или средним значением, потому что, если максимальная задержка произошла в течение первой минуты дня, это будет как медиана, так и среднее значение. Я не могу полагаться на максимальное значение, потому что это может быть выбросом, вызванным каким-то редким событием, например задержкой сети. Этот выброс не будет отражать качество кода и не поможет выявить реальные ошибки.
Можете ли вы помочь мне построить метрику, которая имеет смысл на основе этих данных?