LightGBM 高效提升
利用 LightGBM 的直方图算法和 Leaf-wise 生长,高效处理大规模数据集。
Scikit-learn 机器学习
使用 Scikit-learn 实现分类、回归、聚类,并利用 Pipeline 集成预处理与模型训练。
生成式摘要 BART
使用 BART 及其变体进行生成式摘要,理解其文本去噪预训练目标,并在 CNN/DailyMail 等数据集上微调生成流畅摘要。
自然语言处理 NLP 管道
搭建完整的自然语言处理管道,覆盖分词、词性标注、依存句法分析、命名实体识别等组件,并集成 spaCy 等工业级库。
知识图谱嵌入 TransE
学习经典的 TransE 模型,用头实体+关系=尾实体的平移假设学习知识图谱嵌入,实现链接预测和实体推理。
异构图网络 HGNN
学习处理多类型节点和边的异构图神经网络,通过元路径定义或类型特定注意力编码复杂关系,用于学术网络等异构场景。
GraphSAGE 归纳式图学习
学习 GraphSAGE 如何通过邻居采样和可学习聚合函数生成节点嵌入,摆脱对全图结构的依赖,实现对未见节点的归纳推理。
图嵌入 Node2Vec
掌握 Node2Vec 如何通过 p、q 参数控制 BFS/DFS 偏好随机游走,学习节点的低维嵌入表示,用于节点分类和链路预测。
图算法 PageRank
理解 PageRank 的随机冲浪模型和幂迭代求解,并推广为 Personalized PageRank 应用于社交网络影响力评估等场景。
多臂老虎机 Bandit 算法
学习强化学习的基础范式——多臂老虎机,实现 ε-贪婪、UCB 和 Thompson 采样等策略,解决在线决策中的探索-利用困境。
结构因果模型 SCM
深入 Judea Pearl 的结构因果模型,掌握结构方程、因果图和 do-演算,严格形式化干预和反事实推理。
双重机器学习 DML
学习 Double/Debiased ML 方法,利用正交化和交叉拟合结合任意 ML 模型,在存在高维混杂因素下稳健估计因果效应。
注意力可视化
学习提取和可视化 Transformer 模型的注意力矩阵,分析不同层与注意力头的语言或视觉对齐模式,辅助模型调试与理解。
Grad-CAM 可视化
使用 Grad-CAM 及其变体 Grad-CAM++ 等,对卷积网络最后的卷积层计算梯度加权激活,生成类别判别热力图,直观展示模型关注点。
积分梯度 Integrated Gradients
掌握满足灵敏度和实现不变性公理的积分梯度方法,沿基线到输入的路径累计梯度,为深度网络提供可靠的特征归因。