[學習筆記] 視覺與大腦 - 人眼視覺見到距離及深度的方式 (Seeing Distance and Depth)

距離 (Distance):
對於物體多遠的認知,由單眼視覺處理。

the sense of how far away somethings is, and is mediated monocularly.
深度 (Depth):
對於三度空間的特殊認知 (稱之為立體視覺),由雙眼視覺處理。

a special sense of three dimensionality (called stereopsis), and is mediated binocularly.

以單眼判斷距離 (Seeing Distance with One Eye)


如下圖所示,單眼根據下列線索判斷距離:

1. 透視 (perspective)
對於相同的物體,較遠的物體看起來比較小,較近的物體看起來比較大。

根據投影幾何 (projective geometry),對於相同的物體,較遠的物體投影到視網膜時對應到較小的區域,較近的物體投影到視網膜時對應到較大的區域。
2. 遮蔽 (occlusion)
較近的物體 (an object in the foreground) 擋住較遠的物體 (an object in the background),稱之為「遮蔽」。
3. 航空透視 (aerial perspective)
較遠的物體看起來較模糊、色調較藍,因為在我們和較遠的物體之間會有較多的藍色天空。

4. 移動視差 (motion parallax)
當我們往左方移動時,物體看起來會往右方移動。

較近的物體的位移 (displacement) 較明顯,較遠的物體的位移較不明顯。


單眼還根據許多其他較不明顯的線索判斷距離,列舉其中 2 項:

specific distance tendency
以下圖為例,以水平視角觀看物體時,認知的距離 (Per) 會比實際的距離 (Phy) 遠一些。

equidistance tendency
以下圖為例,看上方的物體時,認知的距離 (Per) 會比實際的距離 (Phy) 遠一些;看下方的物體時,認知的距離 (Per) 會比實際的距離 (Phy) 近一些。

這些判斷距離的線索都是觀察世界後學習得知的。

如下圖所示,透過數百萬張影像分析,人眼上方、水平、下方的物體出現的機率是不同的,由這樣的資料,可以解釋上述的判斷距離的線索。


以雙眼判斷深度 (Seeing Depth with Two Eyes)


Charles Wheatstone 解釋了為什麼我們以雙眼觀看世界時,會有深度的特殊認知。


如下圖所示,當我們觀看近距離的物體時,左眼和右眼所看到的是有明顯的差異的。


Charles Wheatstone 發明了類似下圖的立體眼鏡 (stereopscope)。


深度的特殊認知有什麼價值呢?

它可以讓掠食動物精準地捕捉到獵物,讓靈長類靈巧地動手操作事物。

如下圖,睜開兩隻眼睛,試著讓兩枝筆的筆尖接觸,會發現很容易做到。但閉上一隻眼睛再試一次,會發現很不容易做到!


Charles Wheatstone 設計了 pseudoscope,如下圖所示,讓左眼看到右眼的視角,右眼看到左眼的視角,當觀看可能被看成不同樣貌的物體 (ambiguous object),例如可切換視角為凸出或凹下的浮雕勳章,看起來會有點錯亂,但觀看一般的物體時,看起來沒有什麼異狀。這顯示用雙眼見物時,同時看到單眼視覺及立體視覺,而立體視覺在單眼視覺的基礎,增加了額外的資訊。


立體視覺的成因 (explaining stereopsis)


如下圖所示,因為兩眼的視野 (view) 不同,我們會把一眼看到的影像點 (image points) 和另一眼看到的影像點進行配適 (matching)。


下圖中,黑色的點是兩眼注視而匯聚的點,雙眼視界 (horopter) 上的點,看起來深度是相同的。

下圖 A,注視黑色點時,較近的淺藍色點分別落在視網膜上的 p 及 q (在視網膜上的外側),大腦需要整合 p 及 q 的資訊成為同一個點。

下圖 B,注視黑色點時,較遠的淺藍色點分別落在視網膜上的 m 及 n (在視網膜上的內側),大腦需要整合 m 及 n 的資訊成為同一個點。


很多動物沒有立體視覺,例如牛和馬,兩眼在頭的兩側,兩眼的視野幾乎沒有交會,因此難以形成立體視覺。掠食者比較需要立體視覺,因為需要精準判斷獵物的距離;而視野較廣對於被掠食者較有利,因為有助於更容易察覺到周遭是否有掠食者。

如下圖所示,在初級視覺皮質 (primary visual cortex) 中的 near cells 對於比雙眼視界近的物體會變得活耀,far cells 對於比雙眼視界遠的物體會變得活耀,tuned excitatory cells 對於雙眼視界上的物體會變得活耀。


亂數點立體圖片及相符問題 (random dot stereograms and the correspondence problem)


Bela Julesz 在 1950 年代開發了亂數點立體圖片。


下圖是亂數點立體圖片範例,若有 free fusion 能力,可看到有物體浮出來。


下圖說明亂數點立體圖片製作的方式,右圖是打算呈現出立體感的區域 (subset selected),左圖是把 subset selected 往左移,


亂數點立體圖片中,只有亂數點,沒有影像資訊,人腦如何進行 image points image,稱為相符問題 (correspondence problem),目前人類仍不了解背後的機制。

雙眼視覺融合 (Binocular Fusion)


雙眼視覺融合是如何發生的? 的雙眼所見的不同影像,是如何拚起來的?

如下圖所示,左眼和右眼所見到的影像,並不是在丘腦 (thalamus) 進行融合,而是進入初級視覺皮層的第 4 層後,在第 1-3 層及第 5-6 層進行融合。


如下圖所示,如果讓左眼看垂直條紋,讓右眼看水平條紋,結果看到的會是像右側的圖形,但不是靜態的,而是動態的,有時候某一區塊看起來是水平條紋,有時候看起來是垂直條紋,這樣的現象稱為雙眼競爭 (binocular rivalry)。


Charles Sherrington (1857-1952),反射生理學家 (reflex physiology),他設計實驗試著找出左眼影像和右眼影像融合的方式。


當我們處於室內時,由於燈光以 60hz (視地區而定) 的交流電供電,燈光會以 60hz 的頻率閃爍,

如果我們讓燈以某種頻率閃爍,舉例來說,一開始是每秒閃 20 次,此時看起來燈會閃爍,當達到大約每秒閃 60 次時,看起來燈一直是亮的,不再閃爍,這樣的頻率稱為 flicker-fusion rate。

如下圖所示,「左眼燈光和右眼燈光同時閃爍」,和「左眼燈光和右眼燈光交錯閃爍」相比,是否交錯閃爍的情況下 flicker-fusion rate會較低?

實驗結果是否定的。

我們並不清楚左右眼的影像是如何融合的。


要點總結


1. 藉由單眼視覺的線索,可認知到距離。這些線索是學習而得知的。

2. 藉由雙眼不同視野的影像,可認知到深度 (雙眼視覺)。

3. 對於雙眼視覺認知的現象,目前我們仍不懂背後的運作機制。

4. 我們並不瞭解雙眼影像是如何融合的。

延伸閱讀


[Coursera] Organization of the Human Visual System - Seeing Distance and Depth, by Dr. Dale Purves, M.D, Duke University.