研究人臉辨識的方法:
1. 思考人臉辨識的關鍵問題。
人臉辨識的問題的本質是什麼? (輸入、輸出、運算的挑戰。)2. 設計並進行行為實驗。
人臉表徵 (representation) 的本質是什麼? 人臉表徵和非人臉刺激的表徵之間,是否有重要的差異?
人臉認知是否是獨立於其他視覺認知的一個系統?
人臉認知系統是否包含多個元件?
人臉認知系統 (其中的各個元件) 進行什麼運算?有哪些線索?觀察自己的運作。人、動物、電腦可能如何辨識人臉?
哪些情況下,人臉辨識會變得困難?
舉例來說,熟悉的朋友髮型改變、鬍鬚改變是否不太容易覺察到? 這顯示了我們似乎並不是根據臉部各部位的特徵來做辨識,否則應該很容易覺察到特徵的改變。
舉例來說,看到自己在鏡子上呈現的側臉,是否覺得不太熟悉? 這顯示了人臉辨識似乎並不是透過特徵來進行,否則應該不會覺得不熟悉。在大腦中儲存每個人臉部的 pixels,然後做比對? 但對於同一個人,不同的姿勢、不同的遠近、不同的髮型、不同的光線,pixels 都不一樣。
儲存每個人臉部的特徵 (例如眉毛的特徵、眉毛之間的距離、嘴唇的形狀...),然後做比對這些特徵?
對象: 一般人 (包含嬰兒及幼童)、大腦損傷的人3. 觀察大腦的活動。
先對自己做一些簡單的觀察。
例如,我們看到孰悉的人臉,在極短的時間內就可以辨認出那是誰。
透過 人臉辨識的行為實驗,可觀察到大腦對於人臉的處理,和對於其他物體的處理,存在某種差異。而且大腦是以整張臉的方式來做處理,而不是把臉分拆成各個部分各別分析之後再做整合。
EEG/ERP, MEG, fMRI, PET, ECOG, fNIR, etc.4. 在動物身上實驗及觀察神經系統的反應。
EEG/MEG 的優點是非侵入式、temporal resolution 高 (\(\lt\)1ms);缺點是 spatial resolution 低。
Bentin 在 1996 年透過 EEG 量測實驗,發現大腦在看到人臉的 172ms 之後在 T5 和 T6 的頭皮區域可以觀察到 N170 訊號。
Nancy 在 1999 年透過 MEG 量測實驗,發現在大腦看到人臉的 170ms 之後,在 T5 和 T6 附近的區域,可以觀察到 M170 訊號。對於倒立人臉,則在 170ms 過後 10-20ms 後可以觀察到 M170 訊號,比正立人臉的 M170 訊號強度大一些。
fMRI 的優點是非侵入式、spatial resolution 比 EEG/MEG 高 (1mm);缺點是 temporal resolution 低 (> a few 100ms)、量測的絕對數值是沒有意義的,只有兩個不同情況下的相對數值才有意義、BOLD 訊號的生理基礎還不明確、spatial resolution 低 (每個 voxel 由數十萬個神經元所貢獻)、昂貴 (每小時539美元)。
Nancy 在 1998 年透過 fMRI 量測實驗,發現大腦看到人臉時,梭狀回之中的 fusiform face area (FFA) 會被激活;看到其他物體時,則不會被激活。
顱內量測 (intracranial recording) 的優點是同時有比較高的時間和空間的解析度;缺點是需要開顱手術,通常需要等待有開顱手術的病患,因此資料稀少,難以控制實驗,而且需要排除病患的大腦和正常大腦不同之處。
Nancy 透過 intracranial recording,發現一塊 2-mm 的皮質只對人臉有反應 (看到人臉後 150ms 會有反應),對其他物體完全沒有反應。
參考資料
MIT 9.11 The Human Brain (by Nancy Kanwisher)
2.1 - Face Recognition: What are the Questions?
2.2 - Face Recognition at the level of Computational Theory
2.3 - Face Recognition: Clues from Introspection
2.9 - Event-Related Potentials (ERPs)
2.10 - Magnetoencephalography (MEG)
2.11 - fMRI
2.12 - Intracranial Recording
2.16 - Intercranial Electrical Stimulation