10.19. Feature Scaling

Cards (10)

  • Scaling это

    масштабирование
  • Два вида масштабирования
    Стандартизация, нормализация
  • Стандартизация
    z-score normalization
  • Стандартизация
    Средние значения μ=\mu =1,σ= 1, \sigma=00
  • Формула для стандартизации
    Xchanged=X_{changed}=Xμσ \frac {X-\mu}\sigma
  • Нормализация
    Данные в диапазоне [0;1]
  • Формула для нормализации
    Xchanged=X_{changed}=XXminXmaxXmin \frac {X-X_{min}}{X_{max}-X_{min}}
  • Что делают методы fit(), transform()

    fit() вычисляет метрики, transform() масштабирует и возвращает данные
  • Пайплайн
    1.Разбиение на train и test, 2. fit() для train(), 3. transform() для train(), 4. transform() для test()
  • Нужно ли масштабировать у?

    Нет, не нужно и может быть вредно