Заполнить колонки некоторыми значениями или удалить колонки
Удаление колонок
Не нужно беспокоиться, и это очень просто. Но может потеряться признак с важными данными. Имеет смысл, когда много строк NaN
Заполнение значением
Меняем истинность данных, сами выбираем значение, которое должны записать, нужно будет трансформировать все будущие данные
Простой случай заполнения значением
NaN -> нули, если по факту неопределённые значения это нулевые значения
Сложный случай
Применяем статистические методы с использованием других колонок, чтобы заполнить NaN
Статистический метод заполнения
Если не указан возраст, можем использовать информацию о работе или образовании (если человек учится в колледже, ему вполне может быть 20). Но какая вероятность?