[學習筆記] 視覺與大腦 - 人眼視覺所見到的亮暗,本質為何? (Seeing Lightness and Darkness)


見到亮暗是視覺最根本的特質。

有些動物看不到色彩,但所有的動物,都看得到亮暗,如果無法見到亮與暗,基本上是失明的。

藉由人眼錯誤地判斷亮暗的情況,加上我們對於人類視覺系統的運作及結構的理解,我們可以推測人類視覺所見到的亮暗,本質為何。

Luminance 和 Lightness 的定義


Luminance
對於光的強度的客觀量度

an objective measurement of light intensity per unit area (e.g. candelas/square meter; physical)
Lightness
對於亮暗的主觀感受

a subjective impression of the intensity of light reflected from an object surface (no units; psychophysical)

Luminance 和 Lightness 的差異


下圖中, 兩個灰色圓形的 luminance 是相同的。


但下圖中, 兩個 luminance 相同的灰色圓形搭配了不同 luminance 的背景之後,呈現出來的 lightness 是不同的。


下圖中,A 看起來比 B 亮。


但 A 實際上 luminance 和 B 相同,如下圖所示,把背景移除後,A 看起來變得和 B 一樣亮。


導致 Luminance 和 Lightness 差異的可能原因


傳統的觀念認為這是生物上偶然的結果,視覺系統不夠完美所致。

近幾十年來的發現,認為這個現象可能和我們對 edge 的興趣有關。

下圖中可以看出 A 圓的 edge (由內至外是由亮到暗) 和 B 圓的 edge (由內至外是由亮到暗) 有明顯的差異。


這個現象或許可以從 receptive field propertities 以及人類視覺對於 edge 的興趣造成的副作用來解釋。

Receptive field 指的是每個神經元 (neuron) 對特定的區域會產生反應。

Propertities 指的是神經元對哪些性質會產生反應,例如亮暗 (lightness, darkness)、色彩 (color)、方位 (orientation)。

1950 年代對於哺乳類的研究發現,V1 (初級視覺皮層) 的 receptive fields 是已 center surround 的形式排列。如下圖所示,當光朝向中央時,神經細胞會較穩定的發射 (如圖中的加號所示),當光朝向周圍時,神經細胞受到抑制較不會發射。


下圖呈現神經細胞 A, B, C, D, E 的 response rate。神經細胞 B 的 response rate 比 A 低一些,因為在亮處更多的光照射到 B 的周圍,使得神經細胞受到抑制的比例增加。神經細胞 C 一半在暗處,一半在亮處,response rate 回到和神經細胞 A 相同的水平。神經細胞 D 和神經細胞 C 相比,周圍的部分受到更多的抑制,但中央的部分完全受到激發,因此 response rate 提高。神經細胞 E 和神經細胞 D 相比,周圍的部分受到更多的抑制,因此 response rate 降低。


再回來看下面這張圖,A圓及 B 圓的 luminance 相同,但我們覺得 B 圓比較暗,這是因為 B 圓的背景較亮,因此增強了對於神經元發射的抑制。


人類的視覺對 boundary 特別有興趣。

如下圖所示,眼睛會移動至對焦在具有反差的邊緣 (例如眼睛),而不是沒有反差的區域 (例如臉頰)。 (the eye moves to focus on contrast boundaries, not on areas)。


但事實上,以 receptive field propertities 以及人類視覺對於 edge 的興趣造成的副作用來解釋這樣的現象並不算充分。

以下提出 3 個反例。

在下圖中,A 和 B luminance 相同,但看起來 A 比 B 亮。根據上述的說法,A 周圍亮的比重較高,因此 A 看起來應該要比 B 暗,和人眼觀察到的結果相反,可見上述的說法並不是充分的,無法適用在這個情況。


在下圖中,A 和 B 相鄰,中間有漸層色,A 和 B luminance 相同,但看起來 A 比 B 亮。


由下圖中可看出,把 A 和 B 中間的漸層色的因素排除, A 和 B 看起來就一樣亮。


在下圖中,A 區較亮,整個 A 區的 luminance 是相同的,B 區的 luminance 線性變化逐漸由亮到暗,C 區的亮度較暗,整個 C 區的 luminance 是相同的。但在 A 區及 B 區的交界,卻會感覺有一個亮度特別亮的區域,在 B 區及 C 區的交界,會感覺有一個亮度特別暗的區域,這兩個區域稱之為 Mach bands。


以下為這些現象提出根據人類經驗所推導的解釋。

首先我們回顧 inverse problem。如下圖所示,光子從光源出發,碰到物體產生反射、漫射,在介質中旅行產生折射或散射,最後進入視網膜,我們只能觀察到最後的結果,我們觀察到的是光源、物體表面的性質、介質的特性加總的結果,無法逆向推得各別的情況。


找出人類如何避開 (get around) inverse problem 而能在世界上生存,有助於理解視覺的運作。

把影像視為整體,對於藉由經驗來學習是不利的。

因為為了學習,必須重複許多次。

但人類的視網膜有數百萬個 photoreceptors,兩個場景除非完全一模一樣 (光源、光源的方位、場景、人眼的方位....),否則幾乎不可能看到兩張完全一樣的影像。

因此比較合理的運作機制是一次只看影像中的一小塊 (patch) (也只有落在視網膜中央窩附近的影像是清晰的),觀察及學習真實世界中的 luminance 和人眼看到的 lightness 的關聯性。

前述的 luminance 和 lightness 的差異,人眼會做出那樣的判斷,主要來自於人眼從真實世界的大量影像取樣及學習的結果。

以下圖為例,試著從各式各樣的自然界的影像,找出在大多數的情況下,如果周圍是較暗的,中央會是什麼樣的亮度,如果周圍是較亮的,中央會是什麼樣的亮度。


根據數百萬張自然界的影像的數百萬個 patches 的分析,大多數的情況,中央 patch 的 luminance 會相似於周圍 patch。

這是因為在大部分的情況,相鄰的 patch 都屬於同一個物體。

因此我們會預期下圖中的兩個中央 patch 亮度有所不同。

如下圖所示,根據分析,大多數的情況,周圍的 patch 較暗時,中央 patch 較暗的機率較高;周圍的 patch 較亮時,中央 patch 較亮的機率較高。


下圖描繪出在周圍的 patch 較暗或較亮時,中央 patch 的 luminance 的累進機率分布 (cumulative probability distribution)。其中 X 軸上標示的 T 指的是中央 patch 的 luminance,左右兩圖的中央 patch 的 luminance 是相同的。從左圖可看出周圍 patch 較暗時,中間 patch 亮度為 T 根據經驗發生的可能性較大,而從右圖可看出周圍 patch 較亮時,中間 patch 亮度為 T 根據經驗發生的可能性較低。


主觀判斷的亮暗是根據相對的亮暗,在左圖,周圍 patch 較暗,根據經驗,我們預期中央 patch 的亮度應該也較暗,但實際上比預期的亮,因此我們覺得左圖中央 patch 的亮度較亮,在右圖,周圍 patch 較亮,根據經驗,我們預期中央 patch 的亮度應該也較亮,但實際上比預期的暗,因此我們覺得右圖中央 patch 的亮度較暗。

由此可導出對於實體世界的一個有趣的觀點: 實體世界的角色只是作為一個提供回饋的舞台,藉由反覆地提供回饋,讓我們了解視覺是否引導到能讓我們在演化上能夠成功的行為。 (the role of the physical world is simply an arena that provides feedback via reproductive rates about the relative success of visual perceptions and visually guided behaviors).

延伸閱讀


[Coursera] Organization of the Human Visual System - Seeing Lightness and Darkness, by Dr. Dale Purves, M.D, Duke University.

(photo via Jeremy Fulton)