quantileTDigestWeighted
Приблизительно вычисляет квантиль числовой последовательности, используя алгоритм t-digest. Функция учитывает вес каждого элемента последовательности.
Максимальная ошибка 1%. Потребление памяти — log(n)
, где n
— число значений. Результат не детерминирован и зависит от порядка выполнения запроса.
Производительность функции ниже, чем производительность функции quantile или quantileTiming. По соотношению размера состояния к точности вычисления, эта функция значительно превосходит quantile
.
Внутренние состояния функций quantile*
не объединяются, если они используются в одном запросе. Если вам необходимо вычислить квантили нескольких уровней, используйте функцию quantiles, это повысит эффективность запроса.
Использование quantileTDigestWeighted
не рекомендуется для небольших наборов данных и может привести к значительной ошибке. Рассмотрите возможность использования quantileTDigest
в таких случаях.
Синтаксис
quantileTDigestWeighted(level)(expr, weight)
Синоним: medianTDigestWeighted
.
Аргументы
level
— уровень квантили. Опционально. Константное значение с плавающей запятой от 0 до 1. Мы рекомендуем использовать значениеlevel
из диапазона[0.01, 0.99]
. Значение по умолчанию: 0.5. Приlevel=0.5
функция вычисляет медиану.expr
— выражение, зависящее от значений столбцов, возвращающее данные числовых типов или типов Date, DateTime.weight
— столбец с весам элементов последовательности. Вес — это количество повторений элемента в последовательности.
Возвращаемое значение
- Приблизительный квантиль заданного уровня.
Тип:
- Float64 для входных данных числового типа.
- Date, если входные значения имеют тип
Date
. - DateTime, если входные значения имеют тип
DateTime
.
Пример
Запрос:
SELECT quantileTDigestWeighted(number, 1) FROM numbers(10)
Результат:
┌─quantileTDigestWeighted(number, 1)─┐
│ 4.5 │
└────────────────────────────────────┘
Смотрите также