基準真相

直接觀察提供的資訊

基准真相(英語:Ground truth)又称地面实况,是一个相对概念,是指相对于新的测量方式得到的测量值,作为基准的,由已有的、可靠的测量方式得到的测量值[註 1]。人们往往会利用基准真相,对新的测量方式进行校准,以降低新测量方式的误差和提高新测量方式的准确性。

机器学习领域借用了这一概念。使用训练所得模型对样本进行推理的过程,可以当做是一种广义上的测量行为[註 2]

概述

在广义上,测量是指通过恰当的方法(工具和手段),用数据来描述观察到的现象,对事物作出量化描述的过程;亦即,广义上的测量是对非量化的实体进行量化的过程。在引入新的测量方法时,为了对新的测量方法的准确性进行衡量,就必须引入作为「标准答案」的基准测量方法。基准测量方法对样本的测量结果,就是基准真相。

举例来说,目测距离是一种对距离进行测量的方式。对于一些工作来说,目测是很重要的技能。为了提高目测准确度,人们必须首先有能力衡量目测距离的误差。因此,人们需要引入作为标准答案的基准测量方法,并得出基准真相。对于目测距离来说,人们可以在一块场地上,设置一个观察点,以及在不同位置和距离上放置目标物。而后,人们可以通过激光测距等已有的、可靠的测量方式,测量观察点和各个目标物之间的距离,作为基准真相。之后,通过不断训练、与基准真相进行比对,人们就能提高目测距离的准确度。

由于基准真相也是测量的结果,因此基准真相和实际值之间也会存在误差。因此,按照基准真相进行校准的新測量方法也无法避免这一有基准测量方法带来的误差。

统计与机器学习

若将训练所得模型对样本进行推理的过程作为一种广义上的测量行为,将模型选择过程作为校准过程,则在有监督学习中,基准真相即是用作优化目标的样本集中之标签。

注释

  1. ^ 经验证据
  2. ^ 有监督学习中,ground truth通常指代样本集中的标签