研究大腦的方法，以人臉辨識為例 @ Murphy 的書房

研究人臉辨識的方法:

1. 思考人臉辨識的關鍵問題。

人臉辨識的問題的本質是什麼? (輸入、輸出、運算的挑戰。)

人臉表徵 (representation) 的本質是什麼? 人臉表徵和非人臉刺激的表徵之間，是否有重要的差異?

人臉認知是否是獨立於其他視覺認知的一個系統?

人臉認知系統是否包含多個元件?

人臉認知系統 (其中的各個元件) 進行什麼運算?
有哪些線索?
觀察自己的運作。

哪些情況下，人臉辨識會變得困難?

舉例來說，熟悉的朋友髮型改變、鬍鬚改變是否不太容易覺察到? 這顯示了我們似乎並不是根據臉部各部位的特徵來做辨識，否則應該很容易覺察到特徵的改變。

舉例來說，看到自己在鏡子上呈現的側臉，是否覺得不太熟悉? 這顯示了人臉辨識似乎並不是透過特徵來進行，否則應該不會覺得不熟悉。
人、動物、電腦可能如何辨識人臉?
在大腦中儲存每個人臉部的 pixels，然後做比對? 但對於同一個人，不同的姿勢、不同的遠近、不同的髮型、不同的光線，pixels 都不一樣。

儲存每個人臉部的特徵 (例如眉毛的特徵、眉毛之間的距離、嘴唇的形狀...)，然後做比對這些特徵?

2. 設計並進行行為實驗。

對象: 一般人 (包含嬰兒及幼童)、大腦損傷的人

先對自己做一些簡單的觀察。

例如，我們看到孰悉的人臉，在極短的時間內就可以辨認出那是誰。

透過人臉辨識的行為實驗，可觀察到大腦對於人臉的處理，和對於其他物體的處理，存在某種差異。而且大腦是以整張臉的方式來做處理，而不是把臉分拆成各個部分各別分析之後再做整合。

3. 觀察大腦的活動。

EEG/ERP, MEG, fMRI, PET, ECOG, fNIR, etc.

EEG/MEG 的優點是非侵入式、temporal resolution 高 (\(\lt\)1ms)；缺點是 spatial resolution 低。

Bentin 在 1996 年透過 EEG 量測實驗，發現大腦在看到人臉的 172ms 之後在 T5 和 T6 的頭皮區域可以觀察到 N170 訊號。

Nancy 在 1999 年透過 MEG 量測實驗，發現在大腦看到人臉的 170ms 之後，在 T5 和 T6 附近的區域，可以觀察到 M170 訊號。對於倒立人臉，則在 170ms 過後 10-20ms 後可以觀察到 M170 訊號，比正立人臉的 M170 訊號強度大一些。

fMRI 的優點是非侵入式、spatial resolution 比 EEG/MEG 高 (1mm)；缺點是 temporal resolution 低 (> a few 100ms)、量測的絕對數值是沒有意義的，只有兩個不同情況下的相對數值才有意義、BOLD 訊號的生理基礎還不明確、spatial resolution 低 (每個 voxel 由數十萬個神經元所貢獻)、昂貴 (每小時539美元)。

Nancy 在 1998 年透過 fMRI 量測實驗，發現大腦看到人臉時，梭狀回之中的 fusiform face area (FFA) 會被激活；看到其他物體時，則不會被激活。

顱內量測 (intracranial recording) 的優點是同時有比較高的時間和空間的解析度；缺點是需要開顱手術，通常需要等待有開顱手術的病患，因此資料稀少，難以控制實驗，而且需要排除病患的大腦和正常大腦不同之處。

Nancy 透過 intracranial recording，發現一塊 2-mm 的皮質只對人臉有反應 (看到人臉後 150ms 會有反應)，對其他物體完全沒有反應。

4. 在動物身上實驗及觀察神經系統的反應。

參考資料

MIT 9.11 The Human Brain (by Nancy Kanwisher)

2.1 - Face Recognition: What are the Questions?
2.2 - Face Recognition at the level of Computational Theory
2.3 - Face Recognition: Clues from Introspection
2.9 - Event-Related Potentials (ERPs)
2.10 - Magnetoencephalography (MEG)
2.11 - fMRI
2.12 - Intracranial Recording
2.16 - Intercranial Electrical Stimulation

Murphy 的書房

研究大腦的方法，以人臉辨識為例

參考資料

文章分類

搜尋此網誌

關於「Murphy的書房」