不确定性采样：选择模型最困惑的样本去标注

FreeGuideOnline 最新 2026-06-27

python import numpy as np from sklearn.linear_model import LogisticRegression

假设已有初始标注集 X_initial, y_initial 和未标注池 X_pool

model = LogisticRegression() model.fit(X_initial, y_initial)

probas = model.predict_proba(X_pool)

entropy = -np.sum(probas * np.log(probas + 1e-10), axis=1)

query_idx = np.argsort(entropy)[-10:] samples_to_label = X_pool[query_idx]