基準真相

直接觀察提供的資訊

基準真相(英語:Ground truth)又稱地面實況,是一個相對概念,是指相對於新的測量方式得到的測量值,作為基準的,由已有的、可靠的測量方式得到的測量值[註 1]。人們往往會利用基準真相,對新的測量方式進行校準,以降低新測量方式的誤差和提高新測量方式的準確性。

機器學習領域借用了這一概念。使用訓練所得模型對範例進行推理的過程,可以當做是一種廣義上的測量行為[註 2]

概述

在廣義上,測量是指通過恰當的方法(工具和手段),用資料來描述觀察到的現象,對事物作出量化描述的過程;亦即,廣義上的測量是對非量化的實體進行量化的過程。在引入新的測量方法時,為了對新的測量方法的準確性進行衡量,就必須引入作為「標準答案」的基準測量方法。基準測量方法對範例的測量結果,就是基準真相。

舉例來說,目測距離是一種對距離進行測量的方式。對於一些工作來說,目測是很重要的技能。為了提高目測準確度,人們必須首先有能力衡量目測距離的誤差。因此,人們需要引入作為標準答案的基準測量方法,並得出基準真相。對於目測距離來說,人們可以在一塊場地上,設置一個觀察點,以及在不同位置和距離上放置目標物。而後,人們可以通過激光測距等已有的、可靠的測量方式,測量觀察點和各個目標物之間的距離,作為基準真相。之後,通過不斷訓練、與基準真相進行比對,人們就能提高目測距離的準確度。

由於基準真相也是測量的結果,因此基準真相和實際值之間也會存在誤差。因此,按照基準真相進行校準的新測量方法也無法避免這一有基準測量方法帶來的誤差。

統計與機器學習

若將訓練所得模型對範例進行推理的過程作為一種廣義上的測量行為,將模型選擇過程作為校準過程,則在有監督學習中,基準真相即是用作最佳化目標的範例集中之標籤。

註釋

  1. ^ 經驗證據
  2. ^ 有監督學習中,ground truth通常指代範例集中的標籤