2009年2月9日 星期一

090209 BSS & PCA

Intern做了兩個星期,對上頭交待的任務也算有比較清楚的了解了。學術界上這個問題的稱呼是Blind Source Separation (BSS)。基本上問題可以這麼講:如果我現在是在一個有噪音的情境下(例如party裡)講話,那麼我的聲音要如何被解析出來?問題的困難處在於錄音時音軌是混成的,我的聲音和其他人的聲音通通混在一塊。這是個非常令人印象深刻也很有趣的技術,基本上它出發點的觀察就很有洞見:我的聲音和背景聲音是獨立的。數學上「獨立事件」本身就是一個強大的條件,不得不說第一個想到的人實在太有洞見了!
另外還有一個特徵,也就是在短時間內,比如說一個音節(幾十個msec),聲音的頻譜是相對穩定的,這也是一個很有想法的觀察。

Principle Component Analysis (PCA)算是BSS下面會用到的技術吧,了解它之後再次體會到數學的美妙,至少在操作上十分簡潔。心理學裡稱作factor analysis,想必陳小芭以後也一定會碰到的。

1 則留言:

  1. yap~~ so next time...you will be able to help me !
    oh ya~~~~ :D

    回覆刪除