在 Robert 的論文發表 30 年後,fMRI 技術被發展出來,神經科學家 Nancy Kanwisher 使用 fMRI 進行實驗觀察,證實人類大腦的確有個腦區專門進行人臉辨識!
研究大腦功能的第一步,並不是直接以各種先進技術量測訊號開始,而是先思考、觀察、做出假設、設計行為實驗、分析實驗結果,然後再以各種腦部訊號觀察來驗證假設!
以下說明幾個非常精彩的關於大腦處理人臉辨識的行為實驗!
人臉倒立效應
根據行為實驗,和辨識倒立 (upside down) 的人臉相比,人類較擅於辨識正立 (upright) 的人臉。
這個現象稱為「人臉倒立效應」(face inversion effect)。
你可以簡單實驗一下,倒數計時 3 秒,看下圖,寫下你可以認出幾個人。
接著,倒數計時 3 秒,看下圖,寫下你可以認出幾個人。
看正立的人臉時,和看倒立的人臉相比,你是否辨識的速度比較快﹑準確率比較高?
Robert Yin 在 1969 年所做的實驗:
先讓受測者觀看沒見過的 20 張正立人臉,每張臉觀看數秒。
然後以每一組兩張的正立人臉測試,問受測者看過其中哪一張人臉。
接著讓受測者觀看沒見過的 20 張倒立人臉,每張臉觀看數秒。
然後以每一組兩張的倒立人臉測試,問受測者看過其中哪一張人臉。
Robert 發現對於正立人臉,平均答錯次數大約 0.9 次,對於倒立人臉,平均答錯次數大約 4.3 次。
但如果據此推論人腦有不同於處理其他物體的機制來處理人臉,證據還不夠充份。
因此 Robert 進一步做了控制實驗,把人臉換成房屋、簡筆畫,做相同的測試。
結果發現對於正立房屋,平均答錯次數大約 2.2 次,對於倒立房屋,平均答錯次數大約 3.4 次。
對於正立簡筆畫,平均答錯次數大約 2.3 次,對於倒立簡筆畫,平均答錯次數大約 3.2 次。
可以看出對於非人臉的物體,inversion effect 的影響小很多。
因此可以合理推測,大腦對於人臉的處理,和對於其他物體的處理,存在某種差異。
Robert 推論,大腦之中可能有一個獨特的腦區專門負責處理人臉。(這個推論在他的實驗完成後的 30 多年後,透過 Nancy Kanwisher 使用 fMRI 進行的實驗觀察,得到了證實)
Thatcher effect 是另一種版本的 face inversion effect。
請看下面這張照片,左右兩張臉有沒有什麼奇怪的地方。
可能不容易發現哪裡怪怪的。
再看下面這張照片。
很容易就可以發現右邊那張臉怪怪的。
這樣的實驗也可以看出我們的大腦比較擅長處理正立的人臉,更勝於處理倒立的人臉。
整體-局部效應
根據行為實驗,當辨認人臉的一部分時 (例如眼睛、鼻子),在提供一整張人臉的情況下,比起只提供人臉的那一部分,辨認的表現會比較好。
這個現象稱為「整體-局部效應」 (whole-part effect)。
Tanaka 和 Farah 在 1993 年所做的實驗:
當年警察辦案時會根據證人的描述手繪人臉。
讓受測者觀看一些手繪人臉。
然後呈現人臉的一部分,例如鼻子,問受測者這是誰的鼻子。
然後呈現整個人臉 (臉的其他部分相同,只有鼻子不同),問受測者這是誰的鼻子。
結果發現,呈現整個人臉,和呈現人臉的一部分相比,受測者辨識的正確率從 62% 提高到 73%。
Tanaka 和 Farah 推論,大腦並不是把人臉拆解成各個部分之後做處理,而是一次完整地處理。
因為如果大腦是把人臉拆解成各個部分之後做處理,只呈現鼻子時,辨識的正確率應該不會低於呈現整個人臉。
但大腦只對於人臉有這樣的特性嗎?
Tanaka 和 Farah 又進行了控制實驗,讓受測者觀看一些手繪房子。
然後呈現房子的一部分,例如門,問受測者這是誰的房子。
然後呈現一整棟房子,問受測者這是誰的房子。
結果發現,呈現一整棟房子,和呈現房子的一部分相比,受測者辨識的正確率從 81% 略為降低到 79%。
因此 Tanaka 和 Farah 推論,大腦只對於人臉有 whole-part effect,對於其他物體並沒有 whole-part effect。
但其實這樣的證據還不足以推論大腦是以整張臉來做處理。
你可以想一下,還需要加入什麼樣的實驗,才有足夠的證據推論大腦是以整張臉來做處理。
Tanaka 和 Farah 又進一步設計了一個控制實驗,給大腦的輸入長得就像人臉一樣,但大腦的處理結果卻又和人臉不同。
這個控制實驗是讓受測者觀看倒立的手繪人臉。
結果發現,對於倒立的人臉,呈現整個人臉,和呈現人臉的一部分相比,受測者辨識的正確率從 65% 略為降低到 64.5%。
大腦只對於正立人臉有 whole-part effect,對於倒立人臉及其他物體並沒有 whole-part effect。
因此可以推論,大腦是以整張直立人臉做處理。
人臉合成效應
根據 Young 的行為實驗,當把一個人的臉的上半部和另一個人的臉的下半部合成一張臉,和把這兩張一半的臉分開,人類大腦會比較容易辨認出被分開的臉。
這個現象稱為「人臉合成效應」(composite-face effect)。
可根據辨認的準確度或反應時間觀察到這樣的效應。
這個實驗說明了人類大腦傾向於一次處理整張臉。
即使你想只看臉的上半部或下半部,以增加辨識率,也是難以做到。
但其實這樣的證據還不足以推論大腦是以整張臉來做處理。
你可以想一下,還需要加入哪些實驗,才有足夠的證據推論大腦是以整張臉來做處理。
還要再加上非人臉的物體以及倒立人臉的控制實驗。
而實驗結果發現,對於非人臉的物體以及倒立人臉,並沒有 composite-face effec。
因此可推論大腦是以整張直立人臉來做處理。
對於不熟悉的人臉的處理
如果大腦是透過臉部特徵 (例如眉毛的形狀、眉毛之間的距離...) 來進行人臉辨識,那麼,對於不熟悉的人臉,應該要能夠透過特徵的相同,識別出是同一個人,以及根據特徵的相異,識別出是不同的人。
Jenkins 在 2011 發表了一個行為實驗,他收集了一些荷蘭政治家 (以確保受測者不認識這些人) 以不同角度拍攝的 40 張臉,請受測者把這些照片分成幾堆,如果受測者認為同一個人就放在同一堆。
結果受測者們認為這些照片裡平均共有 7.5 位不同的人。
而實際上,這些照片裡,只有 2 位不同的人。
如果大腦是透過臉部特徵來進行人臉辨識,應該要能夠正確判斷這些照片裡只有 2 個不同的人。
不過,這樣的證據還不足以推論人類大腦並非透過臉部特徵來進行人臉辨識。
你可以想一下,還要再加上什麼樣的實驗,證據會比較充分?
於是,Jenkins 做了一個控制實驗,他找來荷蘭的受測者 (認識這些荷蘭政治家),發現,幾乎所有的受測者很快就都答對了,他們都判斷那些照片裡只有 2 位不同的人。
因此可以得知,當大腦不熟悉一個人的臉孔時,並不容易透過臉部特徵來辨認出那個人在各種不同情況下的臉孔。
而當大腦熟悉一個人的臉孔時,則可以透過某種方式快速辨認出那個人在各種不同情況下的臉孔。
大腦或許是透過持續觀察一個人在不同情況下的臉孔,來達到快速辨認那個人在各種不同情況下的臉孔的能力。
參考資料
MIT 9.11 The Human Brain (by Nancy Kanwisher)
2.4 - Face Recognition: Clues from Behavioral Experiments - The Face Inversion Effect
2.5 - Face Recognition: Clues from Behavioral Experiments - Holistic Processing
2.7 - Face Recognition: Behavioral evidence against invariant representations of unfamiliar faces