Save
...
ML
10. Linear Regression
10.19. Feature Scaling
Save
Share
Learn
Content
Leaderboard
Learn
Created by
Дарья Чернова
Visit profile
Cards (10)
Scaling
это
масштабирование
Два вида
масштабирования
Стандартизация
,
нормализация
Стандартизация
z-score normalization
Стандартизация
Средние
значения
μ
=
\mu =
μ
=
1
,
σ
=
1, \sigma=
1
,
σ
=
0
0
0
Формула для
стандартизации
X
c
h
a
n
g
e
d
=
X_{changed}=
X
c
han
g
e
d
=
X
−
μ
σ
\frac {X-\mu}\sigma
σ
X
−
μ
Нормализация
Данные в
диапазоне
[0;1]
Формула для
нормализации
X
c
h
a
n
g
e
d
=
X_{changed}=
X
c
han
g
e
d
=
X
−
X
m
i
n
X
m
a
x
−
X
m
i
n
\frac {X-X_{min}}{X_{max}-X_{min}}
X
ma
x
−
X
min
X
−
X
min
Что делают методы
fit
(),
transform
()
fit
() вычисляет
метрики
,
transform
()
масштабирует
и
возвращает
данные
Пайплайн
1.Разбиение на
train
и
test
, 2.
fit
() для
train
(), 3.
transform
() для
train
(), 4.
transform()
для
test
()
Нужно ли масштабировать
у
?
Нет
, не нужно и может быть
вредно