系统学习数据清洗流程,处理缺失值、重复项、异常点,并进行特征缩放与编码。
学习 Less 语法特性,包括变量、嵌套、运算和混入,提升 CSS 开发效率。
对比独热、标签、频数、目标、留一法及 CatBoost 编码等类别变量处理方案,根据基数与过拟合风险选择合适的编码策略。
系统学习数据预处理、缺失值处理、特征编码与构造方法,使用 Pandas 和 Scikit-learn 提升机器学习模型性能。