梁振英僭建被踢爆,從隱瞞到砌詞、認錯、道歉,一榻糊塗。元旦倒梁大遊行,參與市民以不滿特首無誠信,講大話,仿佛理所當然,說來理直氣壯。

【明報專訊】多少人知道,2013年是國際統計年?

登入國際統計年的網站(www.statistics2013.org),劈頭就是如下「什麼是統計?」的簡介:

When many people hear the word“statistics,”

they think of either sports-related numbers

or the college class they took and barely passed.

While statistics can be thought about in these terms,

there is more to the relationship

between you and statistics than you probably imagine.

(當人們聽見「統計」,他們就會想到跟體育或者學業有關的數字。這等是統計,但你跟統計的關係其實大大多於你想像的。)

香港人慣於追逐數字,喜歡引述數字,利用數字統計達到佐證並取信別人的目的。一味愛鬥大。

可是,對於數字背後的理論和調研基礎,卻沒有多大深究爬梳的習慣,甚至可以說,我們好像先天缺乏這個因子。

這天,我被葉兆輝教授考起。

捍衛科學精神

由○三年開始,葉兆輝每年實地估算大型遊行人數,來到二○一三年元旦,報章說,他心淡了。元旦遊行,他不再估算人數。沒有了葉兆輝,民陣和警方當然沒改變什麼,一如既往,各自表述。這天來到他的辦公室,我以為他會面紅耳赤,不過說起近日的爭拗,他的聲線一直是低沉溫厚的。

葉兆輝要捍衛科學精神,這是容易理解的,令人意外的是,這並非情緒的來源。他說,他看見社會內耗至此,很無奈,很沮喪。「點解只為了遊行數字,都要互相指罵?這個社會已缺乏互相信任。若有信任,你給我一個數,我會給你一點尊重。別人提出質疑,他們只拋低一句『我們一向都是這樣數』,卻沒說方法是什麼。講個數字出來,唔使負責任,咁都得?愈開愈大,會物極必反。支持你的人會厭惡你,倒戈相向。我認識一個朋友,痛恨特首沒誠信,可是新年前夕還是去了挺梁遊行,他說他不會站在『撐CY』的示威牌下,但跟着『支持政府施政』一直走。」

他教學生研究方法,最緊要他們學識「show me the data」﹕「任你如何把結果演繹,講到天花龍鳳也沒用,都是那句,讓我看數據。」遊行人數掀起爭拗,不是沒有數據,可是幾個調查的結果分歧愈來愈大,大到一個程度,連這個城巿都被扯開、分裂。

為何誤差 愈擴愈大

○三年,民陣說有五十萬人上街,當時警方估算有三十五萬,港大鍾庭耀是四十六萬,葉兆輝三十五萬。十年來,誤差愈擴愈大,至去年民陣說有四十萬,但其他三個單位的估算,數字最大的鍾庭耀也只有十一萬。四個方法,計了十年,「大家都聲稱計算方法沒變,其中三個方程式是公開的,只有一個還未坦白數據如何得來,而計算出的人數也偏離得愈來愈遠。哪兒出了問題,你說呢?巿民只要靜下來,就能看得清楚」。

原本,遊行人數其實並不如現在社會看得那麼重要,那向來只是一個指標,一個統計。不過,當數字漸漸被看待成為政治籌碼,而看重數字的人又拿不出基本數據,以統計為專業的葉兆輝神經就被挑動,「這是荒謬的」。在學術研究的範疇裏,互相切磋理論看法是等閒事,遊行人數的計算方法,也許沒有一條最準確的公式,但至少統計得來的數字要真實,方法要可靠。

數字之啟示:找出根源

從事統計數據研究,數字不是提供解決問題的妙方,但它揭示實况。問題未發生,從數字可以看到警示;問題發生了,數字也可以給你找出根源啟示。在統計學家的角度看,數字,是社會基本,既能載舟,亦能覆舟;它可以把社會分裂,但同樣亦能把裂痕縫合。葉兆輝說,數據藏有大量資訊,只要正確分析,就成為學問了。香港數據很多,問題是當中有很多錯誤、不可信的數據。「要解決問題,就要回到基本步,show me the data,show me the reliable data。」二○一二年,香港四分五裂,挺梁、反梁,打水貨、反雙非。不過,若可以從紛亂中看清真相,明辨是非,或許矛盾未至於演變為衝突,「你說雙非來港爭資源、拖低人口質素,但事實是,近兩年來港產子的雙非媽媽,七成擁有中學或以上學歷,數字不比香港差。有人說,隔籬屋的內地人沒禮貌、低水平,那可能是真的,但你眼見的,不過是一個例子、兩個例子,不是整個畫面。」

民調呃人?

資訊混亂,民望、民意被騎劫,已經不是什麼新鮮事,「民調界」中當然有害群之馬,修飾、扭曲、造數,而其實政府、傳媒、學者,甚至是我們本身,都有責任。常識要靠基本認識去支撐,要不便是無知,容易受騙。葉兆輝續舉例,官員民望跌1分,搶佔新聞版面顯眼位置,「那只是演繹的人誇大其詞,這1分『微跌』,在統計學上可能被看成『無升跌』」。

這時候,記者一臉詫異,葉兆輝則再次肉緊起來,「這個你不懂嗎?不行,這樣會很易被民調呃。調查的可信度,就是一個調查可接受程度多大的誤差,才叫準確,這因應受訪人數而不同的,人數愈多,調查結果的誤差應該愈小。」隨即他拿起粗筆,在白板上寫起火星文,一邊說道:「誤差的可接受程度,即是調查的可信度,如何計算呢?我們常說的P,其實是用X,即是發生次數,除以N,即是受訪人數,而這個P的可信度,就是加減1.96乘以P乘以1減P……」

我確信,這是我們應該有能力理解的,不過為了把知識以最方便的方法植入腦袋,葉兆輝最後簡而言之﹕「當受訪人數有500人,誤差度會是4.5%。即是說,若調查結果顯示梁振英的評分跌了4分,我們也不足以把這個4分當成與上次『有分別』,只能說這次的結果,與上次的結果沒有分別;而當受訪人數達1000人,誤差度就是3%。」

好吧,至少記住這一課,下次有人將民調結果「作大」,我們這邊作為receving end(接收者)起碼可以一眼看穿,不會被人牽着鼻子。

文 陳嘉文

圖 陳淑安

編輯 蔡曉彤

arrow
arrow
    全站熱搜

    iamSnail 發表在 痞客邦 留言(4) 人氣()