Flink ML 二分类评估器 BinaryClassificationEvaluator：AUC、PR-AUC、KS 一次搞懂-编程阁

1. 支持的输入形式

BinaryClassificationEvaluator 的输入表需要包含：

labelCol：真实标签（Number，默认列名"label"）
rawPredictionCol：原始预测（Vector 或 Number，默认列名"rawPrediction"）
weightCol：样本权重（Number，可选，默认 null）

rawPrediction 可以是两种类型

1）double
可以是：

二分类硬预测（0/1）
或者label=1 的概率（更推荐用概率）

2）vector（长度为 2）
表示两个类别的 raw predictions / scores / probabilities，例如：

[score0, score1]
[p(label=0), p(label=1)]

工程建议：如果你的模型能输出概率向量（比如[p0, p1]），尽量用 vector 输入，这样更通用也更符合评估器预期。

2. 输出指标说明

评估器输出表可能包含以下列（取决于你配置了哪些 metricsNames）：

areaUnderROC：ROC 曲线下面积（ROC-AUC）
areaUnderPR：PR 曲线下面积（PR-AUC）
areaUnderLorenz：与 Lorenz 曲线相关的度量（文档描述里与 KS 有关联）
ks：与 KS / Lorenz 相关的度量（文档描述里与 areaUnderLorenz 有对应关系）

小提示：你贴的描述里areaUnderLorenz和ks的解释看起来有点“对调”的味道（一个写 KS，一个写 Lorenz 的面积）。在工程实践里你可以把它们都算出来，再结合你对 KS/Lorenz 的理解确认哪个列对应哪个含义，避免拿错指标去做阈值或准入判断。

指标怎么选

业务更关注整体排序能力、对阈值不敏感：优先看ROC-AUC
正负样本极度不均衡、关注正类识别质量：优先看PR-AUC
风控、评分卡、强分离能力诉求：常用KS（越大通常分离越强）

3. 关键参数（Parameters）

Key	默认值	含义
`labelCol`	`"label"`	标签列名
`weightCol`	null	权重列名
`rawPredictionCol`	`"rawPrediction"`	原始预测列名
`metricsNames`	`[AREA_UNDER_ROC, AREA_UNDER_PR]`	需要输出的指标列表

你可以通过setMetricsNames(...)指定要算哪些指标。

4. Java 示例：计算 PR-AUC、ROC-AUC、KS

你贴的示例是最典型的用法：输入label + rawPrediction(vector)，输出 1 行指标结果。

importorg.apache.flink.ml.evaluation.binaryclassification.BinaryClassificationEvaluator;importorg.apache.flink.ml.evaluation.binaryclassification.BinaryClassificationEvaluatorParams;importorg.apache.flink.ml.linalg.Vectors;importorg.apache.flink.streaming.api.datastream.DataStream;importorg.apache.flink.streaming.api.environment.StreamExecutionEnvironment;importorg.apache.flink.table.api.Table;importorg.apache.flink.table.api.bridge.java.StreamTableEnvironment;importorg.apache.flink.types.Row;publicclassBinaryClassificationEvaluatorExample{publicstaticvoidmain(String[]args){StreamExecutionEnvironmentenv=StreamExecutionEnvironment.getExecutionEnvironment();StreamTableEnvironmenttEnv=StreamTableEnvironment.create(env);DataStream<Row>inputStream=env.fromElements(Row.of(1.0,Vectors.dense(0.1,0.9)),Row.of(1.0,Vectors.dense(0.2,0.8)),Row.of(1.0,Vectors.dense(0.3,0.7)),Row.of(0.0,Vectors.dense(0.25,0.75)),Row.of(0.0,Vectors.dense(0.4,0.6)),Row.of(1.0,Vectors.dense(0.35,0.65)),Row.of(1.0,Vectors.dense(0.45,0.55)),Row.of(0.0,Vectors.dense(0.6,0.4)),Row.of(0.0,Vectors.dense(0.7,0.3)),Row.of(1.0,Vectors.dense(0.65,0.35)),Row.of(0.0,Vectors.dense(0.8,0.2)),Row.of(1.0,Vectors.dense(0.9,0.1)));TableinputTable=tEnv.fromDataStream(inputStream).as("label","rawPrediction");BinaryClassificationEvaluatorevaluator=newBinaryClassificationEvaluator().setMetricsNames(BinaryClassificationEvaluatorParams.AREA_UNDER_PR,BinaryClassificationEvaluatorParams.KS,BinaryClassificationEvaluatorParams.AREA_UNDER_ROC);TableoutputTable=evaluator.transform(inputTable)[0];RowevaluationResult=outputTable.execute().collect().next();System.out.printf("Area under PR: %s\n",evaluationResult.getField(BinaryClassificationEvaluatorParams.AREA_UNDER_PR));System.out.printf("Area under ROC: %s\n",evaluationResult.getField(BinaryClassificationEvaluatorParams.AREA_UNDER_ROC));System.out.printf("KS: %s\n",evaluationResult.getField(BinaryClassificationEvaluatorParams.KS));}}

输出表是什么样？

evaluator.transform(inputTable)[0]返回的 Table 通常只有一行，列名就是你请求的指标名，例如：

areaUnderPR
areaUnderROC
ks
areaUnderLorenz（如果你也加上）

你通过evaluationResult.getField("areaUnderROC")或常量 key 取值即可。

5. 带权重 weightCol 的用法（更贴近生产）

当你遇到样本不均衡、或者希望某些样本更重要时，可以加weightCol：

输入表：("label", "rawPrediction", "weight")
evaluator：.setWeightCol("weight")

示意（结构说明）：

TableinputTable=tEnv.fromDataStream(stream).as("label","rawPrediction","weight");BinaryClassificationEvaluatorevaluator=newBinaryClassificationEvaluator().setWeightCol("weight").setMetricsNames(BinaryClassificationEvaluatorParams.AREA_UNDER_ROC,BinaryClassificationEvaluatorParams.AREA_UNDER_PR);