Applied stats (Авито)

Cards (23)

  • Выборка
    ξ=\xi =ξ1,ξ2,,ξ30Bern(μ) \xi_1, \xi_2, …, \xi_30\sim Bern(\mu)
  • Нулевая гипотеза это 

    То, что мы хотим опровергнуть
  • Альтернативная гипотеза это 

    то, что мы хотим доказать
  • Пример постановки гипотез
    H0:μ=H_0: \mu=0.5;H1:μ>0.50.5; H_1: \mu>0.5
  • критерий
    Алгоритм, который по либо признает, что мы нашли доказательство в пользу альтернативной гипотезы, либо говорит, что его не нашли. Соответственно алгоритм либо отвергает нулевую гипотезу, либо не отвергает
  • Критерий как функция, которая принимает реализацию выборки и возвращает 1, если нужно отвергнуть нулевую, и 0 иначе 

    Функция
  • Сокращенная запись функции
    S=S={Σξ20}\{\Sigma\xi \geq 20\}
  • статистика
    Q=Q=Σ(ξ)\Sigma(\xi)
  • Критерий с Q
    Q=Q={Q(ξ)20}\{Q(\xi)\geq20\}
  • Q это статистика критерия, С это критическое значение
  • False Positive Rate

    H0 отвергается, когда она верна
  • False Negative Rate

    H0 не отвергается, когда она неверна
  • Альфа = 100%
    Критерий всегда отвергает нулевую гипотезу
  • как выбрать уровень значимости
    Это риск неправильного принятия положительного решения, который мы считаем приемлемым
  • Откуда импортируется binom
    scipy.stats
  • Функция вероятности дискретного распределения pξ(x)p_\xi(x)
    Вероятность, с которой ξ\xi принимает значение xx
  • Функция вероятности дискретного распределения в питоне
    .pmf, probability mass function
  • Кумулятивная функция распределения в питоне
    cdf (cumulative distribution function)
  • Кумулятивная функция распределения 

    Fξ(x)=F_\xi(x)=P(ξ<x)P(\xi<x)
  • Квантиль 5%
    Точка, площадь столбцов справа от которой будет 5%. Площадь столбцов слева 95%
  • Квантиль в питоне
    .ppf(0.95) (percent point function)
  • Pvalue это

    Вероятность при справедливости нулевой гипотезы получить столь же экстремальное значение статистики q или ещё более экстремальное
  • Нулевая гипотеза отвергается, когда
    Pvalue меньше или равно альфе