GrabCut是一個基於電腦視覺中的圖割英語Graph cuts in computer vision理論的圖像分割方法。

在GrabCut中,像素被劃分為ground truth background、ground truth foreground、maybe background、maybe foreground四類標籤。開始時,用戶需要畫出一個完整包含目標物體的邊界框英語bounding box。框內的像素被標記為maybe foreground,而框外的則是ground truth background。

然後演算法使用高斯混合模型(GMM)估計目標物體和背景的色彩分佈。GMM用於在像素標籤上構建馬爾可夫隨機場,其能量函數更喜歡具有相同標籤的連接區域。執行基於圖割(如最小割)的最佳化來推斷位於不確定區域(標籤為maybe background、maybe foreground的像素)的標籤值。此估計比用戶畫出的邊界框的原始估計更準確,因此上述過程將多次重複,直到收斂。

用戶可以通過反覆多次指出錯誤分類的區域,使演算法重新執行最佳化,獲得更佳結果。

OpenCV中已經提供開源實現。

參見

參考資料