免费编程教程

最新
目的限制

在训练模型时严格限定数据用途与原始收集声明一致,避免将数据用于未授权的新场景。

3 0 0
2026-06-27
最新
数据最小化原则

遵循数据最小化原则,在 AI 项目中仅采集和使用为实现目的所必需的最少量个人数据。

1 0 0
2026-06-27
最新
用户隐私日志

建立隐私安全的数据访问日志系统,记录和处理个人数据的每一次访问,满足审计与合规需求。

2 0 0
2026-06-27
最新
数据集版权

探讨模型训练数据的版权归属,分析文本与图像数据的抓取、使用和分发中的法律风险。

2 0 0
2026-06-27
最新
大模型开源许可证

辨析主流的大模型开源许可证,了解商用限制、署名要求和道德条款,规避模型集成的法律风险。

7 0 0
2026-06-27
最新
负责任发布模型

学习在公开发布模型前进行红队测试、编写使用限制并选择合适的许可证,防止模型被恶意滥用。

3 0 0
2026-06-27
最新
数据集卡片 Datasheets

遵循 Datasheets for Datasets 框架,记录数据集的创建动机、组成、收集过程和伦理考量。

2 0 0
2026-06-27
最新
模型卡片 Model Cards

编写模型卡片,系统记录模型的目的、训练数据、评估结果和局限,提高模型透明度和负责任使用。

2 0 0
2026-06-27
最新
Hugging Face 模型中心

掌握 Hugging Face Hub 的使用,查找、分享并部署成千上万的预训练 Transformer 模型和数据集。

3 0 0
2026-06-27
最新
TensorFlow Hub

利用 TensorFlow Hub 将预训练模型作为层组合进自定义网络,快速构建文本、图像和视频模型。

4 0 0
2026-06-27
最新
PyTorch Hub 使用

学习使用 PyTorch Hub 的 API,轻松加载官方和社区的预训练模型,快速复现研究并进行微调。

3 0 0
2026-06-27
最新
迁移学习 Hub

了解 PyTorch Hub、TensorFlow Hub 和 Hugging Face Hub 等平台,如何查找、发布和复用预训练模型。

5 0 0
2026-06-27
最新
预训练嵌入使用

将 Word2Vec、GloVe 或 CLIP 等预训练嵌入作为下游任务的固定或微调特征,减少训练成本。

4 0 0
2026-06-27
最新
嵌入特征

学习为商品、用户、单词等离散实体训练低维稠密嵌入向量,作为下游模型的通用输入特征。

2 0 0
2026-06-27
最新
特征哈希

使用哈希函数将海量类别ID压缩为固定大小的向量,以极低存储成本处理流式特征和新出现类别。

3 0 0
2026-06-27
最新
交叉特征组合

学习手动设计多项式特征和通过因子分解机、深度网络自动学习特征组合,提升推荐和广告点击率预测效果。

2 0 0
2026-06-27
最新
滞后特征

创建时间序列的滞后项作为监督学习的输入特征,让模型从历史观测中学习时间依赖关系。

5 0 0
2026-06-27
最新
峰度偏度特征

利用偏度和峰度捕获数据分布相对于正态分布的偏移和尾部厚度,作为区分正常与异常状态的统计特征。

2 0 0
2026-06-27
最新
熵特征

提取时间序列的各种熵值作为特征,衡量信号的随机性和不可预测性,广泛用于生理信号和故障诊断。

3 0 0
2026-06-27
最新
分形特征

通过计算赫斯特指数、分形维度等分形特征,量化时间序列的长程相关性和粗糙度,用于金融与生物信号。

3 0 0
2026-06-27
最新
小波变换特征

利用离散小波变换将信号分解为不同尺度和频率的子带,提取兼具时域和频域信息的鲁棒特征。

2 0 0
2026-06-27
最新
傅里叶变换特征

学习使用快速傅里叶变换提取时间序列的频谱特征,捕捉信号中的周期性模式和频率成分,用于机器学习。

3 0 0
2026-06-27
最新
网络包生成对抗

利用 GAN 生成逼真的网络流量和攻击数据包,扩充入侵检测系统的训练集。

2 0 0
2026-06-27
最新
分子图生成

结合图神经网络和强化学习生成有效、可合成的分子图或 SMILES 字符串,用于药物设计。

1 0 0
2026-06-27
最新
图生成模型深入

对比 GraphRNN、GRAN 和基于扩散的图生成方法,生成具有指定特性(如无标度、小世界)的新图。

2 0 0
2026-06-27
最新
时间序列数据生成

使用 TimeGAN 或条件扩散模型生成逼真的时间序列数据,可用于数据增强和隐私保护。

5 0 0
2026-06-27
最新
表格数据生成 CTGAN

使用 CTGAN 模型对含有混合类型(连续与离散)的表格数据进行建模和合成,用于数据增强。

3 0 0
2026-06-27
最新
差分隐私合成数据

学习使用 DP-SGD 训练 GAN 或 VAE 以生成满足差分隐私的合成表格或图像数据。

3 0 0
2026-06-27
最新
隐私保护合成数据

在生成合成数据时引入差分隐私保证,生成与原数据统计相似但不泄露个体信息的隐私安全数据。

2 0 0
2026-06-27
最新
合成数据多样性评估

设计指标衡量合成数据集在类别、特征空间和子群体上的多样性和代表性,避免数据偏差。

3 0 0
2026-06-27
最新
标注成本优化

在有限标注预算下,综合主动学习、半监督和弱监督策略,优化标注资源分配,最大化模型精度。

6 0 0
2026-06-27
最新
标注一致性分析

使用 Cohen's Kappa、Fleiss' Kappa 等信度指标,衡量多个标注者之间的标注一致性。

2 0 0
2026-06-27
最新
众包标注质量控制

应用 Dawid-Skene 模型等统计方法,从众多标注者的不一致回答中推断最可能的真实标签。

1 0 0
2026-06-27
最新
多噪声标签学习

学习在训练数据标签含有大量错误的情况下,通过损失校正、重加权或样本选择训练出鲁棒模型。

1 0 0
2026-06-27
最新
程序化标注

利用正则表达式、词典、知识库等构建标注函数,通过弱监督方式生成训练所需的标签。

1 0 0
2026-06-27
最新
弱监督学习 Snorkel

使用 Snorkel 框架编写少量标注函数,自动为大规模无标签数据生成概率标签并训练模型。

1 0 0
2026-06-27
最新
人机协同标注

设计人机协同的标注工作流,通过模型预标注和人工修正迭代,高效构建高质量数据集。

3 0 0
2026-06-27
最新
密度加权主动学习

在不确定性采样基础上,用密度信息对样本加权,避免挑选孤立异常点,提升标注效率。

3 0 0
2026-06-27
最新
预期模型改变

根据候选样本对当前模型参数或梯度的影响程度进行排序,选择能使模型发生最大改变的样本。

3 0 0
2026-06-27
最新
委员会查询

维护一个模型委员会,挑选委员会成员预测分歧最大的样本提交人工标注。

3 0 0
2026-06-27
最新
不确定性采样

深入主动学习中基于不确定性的采样方法,选取预测概率最摇摆不定的样本进行人工标注。

2 0 0
2026-06-27
最新
主动学习查询策略

对比最小置信度、边缘采样、熵采样及考虑多样性的查询策略,高效选择样本进行人工标注。

2 0 0
2026-06-27
最新
数据标记质量评估

利用置信度学习、交叉验证和标注者间一致性分析等方法评估和清洗有噪声的数据标签。

3 0 0
2026-06-27
最新
元数据去偏

分析标注员偏差、标注规范等元数据,利用统计模型修正训练集中的系统性标注错误。

2 0 0
2026-06-27
最新
重新加权减轻偏见

在训练前对每个(敏感组,标签)组合赋予不同权重,调整数据分布以缓解模型偏见。

2 0 0
2026-06-27
最新
对抗去偏

通过对抗训练和梯度反转层,逼迫模型的主任务表示与敏感属性无关,从而消除偏见。

2 0 0
2026-06-27
最新
反事实公平

基于因果推理定义公平,要求改变敏感属性的反事实输入不应改变模型决策。

2 0 0
2026-06-27
最新
个体公平性

讨论个体公平性概念,为相似个体设计公平距离度量,确保模型对相近输入给出相近输出。

1 0 0
2026-06-27
最新
人口统计均等

学习人口统计均等这一公平性准则,使不同敏感属性群体的正类预测率保持一致。

2 0 0
2026-06-27
最新
公平性指标 Equalized Odds

掌握均衡胜率公平性定义与实现,保证分类器在各敏感群体上的假阳率和假阴率相等。

2 0 0
2026-06-27
最新
What-If Tool 使用

学习 Google 的 What-If 工具,在无需编程的情况下对模型进行推理、公平性评估和反事实分析。

2 0 0
2026-06-27
最新
AI 可解释性仪表板

构建交互式可视化仪表板,让用户探索特征影响、反事实样本,理解模型在子群体上的表现。

3 0 0
2026-06-27
最新
算法公平性分析工具

使用 IBM AIF360 或微软 Fairlearn 工具包,检测数据集和模型中的偏见,并应用缓解算法。

2 0 0
2026-06-26
最新
AI 政策解读

借助大语言模型自动梳理和解读各国 AI 相关政策与法规,提炼核心要求与合规要点。

2 0 0
2026-06-26
最新
数据合规检查

用 NLP 技术自动分析应用的隐私政策文本,检查其条款是否满足 GDPR 或个人信息保护法要求。

1 0 0
2026-06-26
最新
条款提取

学习序列标注或跨度抽取模型,从复杂的法律文件中定位并提取出指定类型的条款内容。

3 0 0
2026-06-26
最新
法律问答

构建检索增强的法律问答系统,在海量法规和判例中寻找依据,回答用户的法律咨询。

2 0 0
2026-06-26
最新
司法判决预测

根据起诉书或案件描述,使用多任务学习预测适用的法条、罪名和刑期区间。

2 0 0
2026-06-26
最新
合同审核 AI

利用信息抽取和文本分类模型,从合同中自动提取关键日期、金额并标记潜在风险条款。

3 0 0
2026-06-26
最新
法律文书生成

使用大语言模型根据关键信息自动生成标准格式的法律文书草稿,提升法律从业者效率。

5 0 0
2026-06-26