0

1
0

文字

分享

0
1
0

自欺欺人的 「教學品保量化指標」 騙局

洪朝貴
・2013/04/17 ・6253字 ・閱讀時間約 13 分鐘 ・SR值 525 ・七年級

巫醫問: 『怎麼樣, 教授, 準備好要來跟我學一些比 「教學品保量化指標」 更科學的事了嗎?』
巫醫問: 『怎麼樣, 教授, 準備好要來跟我學一些比 「教學品保量化指標」 更科學的事了嗎?』

本文採用線性代數的觀點分析, 指出: 今日許多大學所推動的 「教學品保」 其中的量化指標欠缺實質意義。 例如本系的 「教學品保量化指標」, 最多只有 0.3 位有效數字的意義。 略微改善之後也許可以提高到 0.7 位有效數字, 但受限於「許多數值是主觀判斷」的現實, 這也可能是多數現行 「教學品保量化指標」 的上限。 大學不應在沒有學理背景支持卻有許多爭議聲的情況下, 盲目推動教學品保, 還假裝這是很科學的管理方式。 不然我就想改行當一個巫醫或祈雨師算了。

一、 一組資料實例

一年半前我蒐集了一些 質疑教學品保的文章 並且自己也寫了一篇, 討論 教學品保與創意教學之間的矛盾。 這學期輪到我的課必須繳一份教學品保的報告。 與其把寶貴的生命浪費在一個具有爭議、 沒有學理基礎的盲目政策上面, 還不如認真地寫一篇揭發騙局的文章, 來當做我這學期的教學品保報告 :-) 也稟持著 (已經逐漸流失的) 學術精神, 提供所有相關的數據與檔案, 請大家指正本文的分析。

請下載我去年的科技英文課的教學品保量化指標 ods 檔 以及四個班的問卷結果統計檔: A B C N。 其實讀者可以從比較高的層次去理解它, 並不需要真的跟我一樣探究數學式的細節。 請看設計檔的 「授課大綱」 分頁就好。

首先, 每個系所都有一組自己設定的 「核心能力」。 例如本系的核心能力是:

-----廣告,請繼續往下閱讀-----
  1. 管理知能於組織資源之運用能力
  2. 資訊技能於資訊系統之應用能力
  3. 專業倫理與團隊合作協調能力
  4. 資管相關時事議題認知與自主學習能力

再來, 每門課的授課教師必須設定幾個本課程的 「教學目標」。 例如我的科技英文的教學目標是:

  1. 英文閱讀能力
  2. 網路使用能力
  3. 閱讀習慣
  4. 中翻英能力
  5. 聽力

嗯, 讀者的笑聲我聽到。 這根本就是虛應敷衍下的產品。 後來新的規定是: 一位老師所寫的教學目標, 必須通過學群幾位老師的審核, 所以新版有改善; 而我也失去了更搞怪的機會。 (例如 「指出大學盲從微軟現象」 之類的教學目標) 不過, 我的教學目標寫得好不好並不是重點, 重點是: 它代表著異於 「系所核心能力」 的另一組指標

最後, 請切換到 ods 檔的 「問卷」 分頁。 學生在學期末要填一份問卷。 如果老師沒有特別另外設計的話, 問卷題目就只是直接把教學目標抄過來小幅修改讓文句通順而已。

二、 向量空間模型

教學品保量化指標的投影/座標轉換圖
教學品保量化指標的投影/座標轉換圖

假設每週上課的成果是一個向量 — 難以定義的無限多維向量空間當中的一個向量。 (嗯, 向量空間模型確實並不完全合理。 第五節 「本文分析方式的合理性?」 再回答這個問題。 提醒: 本文也算是 「行動歸謬證明法」。) 那麼在 ods 檔 「授課大綱」 分頁底下始於 A25 那格的對照表, 就是 18 個 「每週向量」 w24111, w24112, … w241118 分別在 「課程目標」 Y2411 這個五度子空間的投影 (的簡化版), 同時進行座標轉換 (改用 Y2411 的向量作為基底) 。 (所謂 “投影, 又進行座標轉換”, 請想像 用 normal equation 求最小方差解; 以下類似) 另外, 在 「完全按照教學目標來設計問卷問題」 的簡單狀況下 — 也就是圖中紅字 (1) 的路線 — 49 份學生問卷結果 q24111, q24112, … q241149 則是學生感受到的教學成果在 Y2411 子空間的投影/座標轉換 (的簡化版)。

-----廣告,請繼續往下閱讀-----

至於 ods 檔同一分頁底下始於 A18 那格的對照表, 則是 「課程目標」 Y2411 五度子空間投影到系所 「核心能力」 Xim 四度子空間的投影矩陣 (的簡化版), 同時進行座標轉換 (改用 Xim 的向量作為基底)。 注意: 在這個 ods 檔的例子裡, 因為極度簡化, 矩陣 Tim2411 只剩下一個 bit (0.3 位有效數字) 的資訊 (”有關聯” 或 “無關聯”),

同一分頁下, 始於 A12 那格的對照表, 其實就是十八週向量和 (或是平均值, 看你要不要把分母的常數考慮進去) 在 Xim 子空間的投影。 它是怎麼算出來的呢? 最複雜的 ods 檔 「相關聯結-關聯度」 分頁, 就是在把 w2411 = w24111 + … w241118 投影到 Xim 並改用它的的基底來呈現。 首先, 始於 B15 的表格拿 w24111 … w241118 來求和。 接著, 始於 J14 的表格拿 Tim2411 把 w2411 換成 Xim 的座標系。 再來, 始於 J4 的矩陣有正規化 (除以 18) 的效果。 最後, 始於 A2 的矩陣則只是把結果改用二維的表格來呈現 4 個 (1-5 共五種結果) 2.3 bit (0.7 位有效數字) 的座標值。 以上皆是指實際矩陣向量乘法的簡化版。 當然, 這些數字並不是 w2411 本身, 而是它在 Xim 的基底向量的投影的座標值。

顯然, 校方對於老師直覺估計所計算出來的 「以 Xim 的座標呈現 w2411 的投影」 不太有把握, 所以在四個班的問卷下方, 你可以看到學生們對同一向量的重新估計 — 也就是圖中紅字 (2) 的部分 — 被拿來跟老師的估計值做比較。

這些投影的目的, 是企圖要把一個系所開設的許多門課的大異其趣 w 向量, 通通投影到 Xim 同一個子空間當中, 採用一致的座標系, 然後才能做後續的量化處理。 如果可以拿到全系的資料、 拿到系報給學校的資料, 相信還是可以用線性空間的模型繼續進一步分析學校層級的 「教學品保量化指標」。

-----廣告,請繼續往下閱讀-----
精簡版的教學品保量化指標的投影/座標轉換圖
精簡版的教學品保量化指標的投影/座標轉換圖

以上複雜的分析是要給教學品保量化指標專家前來本文踢館用的, 裡面其實已經對支持者做了一些讓步。 (把 「十八週授課主題的加總或平均」 跟 「實際授課結果」 當成是不同的向量…諸如此類) 如果您本來就懷疑教學品保量化指標的客觀性與實質意義, 那麼請見 小格讀者 explorer 的精簡分析; 右圖是我依據他的分所所畫的。

三、 國王的新衣: 最多 0.3 位的有效數字

如果你還記得中學理化實驗裡的 「有效數字」 (易懂好文!) 概念, 「教學品保量化指標」 最令人難以下嚥的地方是: 以本系的例子來說, 最終數據的精確度, 不會超過一個 bit (0.3 位有效數字) — 就算我們完全不質疑所有師生一切填寫數據的客觀性、 就算我們假設所有主觀填寫的數字都有無限多位有效數字, 單單是看 Tim2411 就知道: 任何通過它的結果 (每個 「科系」 層次的結果都必須通過它), 最多只能有一個 bit (0.3 位有效數字) 的精確度。

如果數學不是您的領域, 讓我做一個簡化版的比喻: 你要到克林貢星 (Klingon) 旅遊, 當地的導遊預估你需要準備 50000 克林貢幣左右。 但是在全宇宙之間, 克林貢星只跟瓦肯星 (Vulcan) 之間有貿易往來, 而克林貢幣與瓦肯幣之間的匯率, 大約在 30:1 到 60:1 之間。 (就像 Tim2411 一樣不夠精確) 瓦肯星幣跟美金之間的匯率, 有一個大致穩定的盤價。 請問你應該準備多少臺幣? 即使上文沒有詳細描述瓦肯星幣跟美金之間的匯率、 臺幣跟美金之間的匯率, 你也可以確定: 最終答案的不確定性至少將有上下高達兩倍的範圍。 也就是說, 任何有數學常識的人, 都不應該對最終算出來的那個數字存有太多不切實際的幻想。

這次, 國王就算真的有穿新衣, 那套新衣的大小, 恐怕要讓國王不露點都有困難。

-----廣告,請繼續往下閱讀-----

四、 「教學品保量化指標」 更多無法回答問題

除了有效數字太少之外, 教學品保量化指標還有很多問題必須回答。 本文列出幾點, 如果有必要, 以後再另文詳細討論:

  • [NC] 是不是應該要有負關聯性, 才能反應一些 「課程目標與系所核心能力背道而馳」 的事實? 例如某些課程 「Office 證照卓越」 的教學目標跟某些校系 「職業道德」的核心能力, 兩者之間的夾角應該大於 90 度。 (彼此的投影量是負的。) 我知道大學不想承認; 但否認無法改變事實, 只會更加突顯量化指標沒有能力呈現這類大學不願面對的事實。
  • [藍色直線先投影到紅色平面再投影到綠色平面 vs 藍色直線直接投影到綠色平面] 兩者結果不同, 方向甚至相反!
    [藍色直線先投影到紅色平面再投影到綠色平面 vs 藍色直線直接投影到綠色平面
    [MP] (請對照 explorer 簡化版的圖及右圖) 子空間 C 當中的一個向量, 「先投影到 Y 再投影到 X」 vs 「直接投影到 X」 這兩個結果可能大不相同, 甚至可能方向相反 — 即使假設有效數字無限多位也一樣。 例如要把一張問卷結果 q241113 投影到 「系所核心能力」 子空間 Xim 再投影到院核心能力子空間, 如果分兩次算, 最終的結果甚至可能與原始向量夾角超過 90 度 (彼此的投影量是負的); 但如果直接投影, 那就保證不會超過 90 度。
  • [RR] 一門課的實際教學成果, 在 「系所核心能力」 子空間 Xim 的投影, 到底應該用紅字 (1) 再用 Tim2411來求, 還是要直接套用紅字 (2)? 注意: 除了上述 [MP] 的考量之外, 在這裡, 兩者甚至是來自不同人的估計。 如前所述, 紅字 (2) 的路線可能比較有利漂亮的數據。 不僅如此, 因為它來自眾多學生的主觀判斷 (四個班問卷結果下方數據) (而不是單一老師的主觀判斷), 所以還有另外一個好處: 學生人數每擴增成四倍, 就可賺到一個 bit 的有效數字。 但是這樣一來, 老師們應該會抗議自己的專業判斷被學生蓋臺。 奇妙的是, 學校並沒有公佈這個問題的答案, 而老師們完全不知道學校的計算方式, 卻也沒有發出抗議的聲音。
  • [IQ] 不過另一個考量, 會讓上一個問題得到完全相反的答案。 本系剛經過大學評鑑自評, 其中有委員希望我們改進問卷設計。 我不是很確定委員的意思; 不過如果委員的意思是 「問卷不要直接抄教學目標」, 那麼就需要多一層投影/座標轉換, 改走圖中紅字 (3) 的路線, 變成總共進行兩次投影/座標轉換, 前後參考了三個 (!) 不同的基底。 這也許會讓學生的直接回答更有意義, 但另一方面卻會讓投影結果偏離原始向量更遠, 也多增加一個降低有效數字的機會。 此外, 用來描述 「每個問題與每個教學目標之間關聯度高低」 的轉換矩陣 S2411, 當然也必須由每位授課老師自行設計, 沒有人可以代勞。 這應該也會引起老師的抗議。
  • [XB] 如果一位授課老師 (透過填寫 W2411 間接) (謙虛地) 表示: 「我這門課對於系所核心能力 Xim3『倫理合作』 沒有太大幫助啦」 但是學生問卷紅字 (2) 的結果, 卻是大有貢獻, 那麼這算是好事 (”意外的收穫”) 還是壞事 (”偏離教學品保所設定的目標”)? 兩者都不太合理; 但事關教師權益與對應策略設定, 校方應該明確回答這個問題。
  • [IG] 教學品保量化指標完全無法呈現那些 「投影過程中, 被忽略掉的垂直分量」。 也就是說, 教學品保量化指標可能會鼓勵教師放棄那些 「與系所核心能力無關, 但很可能對於教育具有重大意義」 的教學面向。

我個人認為: 教學品保企圖以有限維度的量化指標搭配主觀的關聯性認定, 來描述複雜的人與人教學互動、 來描述主觀設定的各級 (校/院/系/學科) 目標, 這是完全不切實際的事、 這完全是在糟蹋數學, 藉數學之名舉辦的口號複誦大會。 (希望不是藉數學之名行控制教師巫毒術之實的邪惡技倆。) 這也是為什麼上面的問題令人難以回答, 左也不是, 右也不是。

五、 本文分析方式的合理性?

向量空間當然不是最完美的模型, 但它是所有可能模型當中, 一個夠通盤又夠簡單的折衷。

一方面, 它已經通用到足以將絕大多數的 「教學品保量化指標」 計算方式都視為是它的簡化版。 事實上, 我很有興趣蒐集更多各校系教學品保量化指標的計算公式與實例, 來證實以上這句話。 如果提供者同意具名或匿名讓我刊出分析結果, 我很樂意重複上一節的方式, 從向量空間投影/座標轉換的角度, 代為分析貴校貴系的量化指標, 並且指出你所能信賴的有效數字上限。

-----廣告,請繼續往下閱讀-----

另一方面, 向量空間簡單到足以讓所有理、 工、 管理教師採用共同的語言 — 線性代數 — 來討論 「教學品保量化指標」 的困境。 任何教過線性代數、 微分方程、 工程數學、 管理數學、 多變量分析、 … 的老師, 都可以用豐富精確的數學語言來討論 「教學品保量化指標」 的真實意義, 而不再需要像現在各校的教學品保一樣打迷糊仗、 「教學品保量化指標的意義, 長官說了算」。

如果堅持要採用最通用、 最完整、 涵蓋所有可能性的模型來分析, 也許就必須訴諸 metric tensor in curvilinear coordinates (曲線座標系的度規張量)。 我第一個承認這超出我的數學能力範圍。 但即使是用 metric tensor 來分析, 也一樣要面對投影流失資訊等等的問題, 上面所提的準確度問題恐怕只會更嚴重而不會更容易南忽略。 更重要的是: 「教學品保量化指標」 這整套系統當中含有這麼多主觀自由心證判斷所產生的 「相關程度」 數值, 本身已有太多的不確定性, 值得我們拿那麼複雜的數學工具來分析嗎?

有人會指出: 「0.3 位有效數字, 是你們系上的教學品保量化指標沒設計好; 如果設計得好, 可以有更多位的有效數字。」 這句話也許有一部分正確吧。 如果把 ods 檔 「授課大綱」 分頁的 A18 起的對照表改成 1 (低度相關) 到 5 (高度相關) 的 5 個等級, 再重新修改一些算式, 那麼精準度上限也許可以提高到 0.7 位有效數字。 (當然, 老師們也會抗議表格越改越囉嗦。) 至於那些 「比五個等級更細」 的區分法, 不僅不實際, 也很難有說服力好嗎? 再來, 姑且不論其他爭議, 單就提高有效數字的效果來看, 第四節的 [RR] 已指出: 採取紅字 (2) 路線, 有助於提升有效數字。 以64人的班來算, 大約可以得到 3 bits (0.9 位有效數字) 的準確度。 如果有哪一所校系不顧老師的抗議而這麼做, 或是有其他更好的解決方案, 那麼請仿本文, 完整分享你們的高精準度量化指標設計。 (但請不要採用 佈有專利地雷的 xlsx 格式。) 在那之前, 0.7 位有效數字的上限, 可能是所有現行教學品保校系所不得不面對的困窘現實。

但不論任何研究如何改良, 只要 「教學品保量化指標的敘述」 跟 「學生問卷的問題」 之間的轉換必須依靠 (學生/老師/校方) 主觀判斷給分, 有效數字就永遠不可能太高。 相對地, 未經投影與座標轉換、 一次到位的傳統 「學生對老師表現教學評量」 問卷 (或是只涉及長度/重量/貨幣/…等等明確單位轉換的後續處理) 就不會出現本文所指出來的這些問題。

-----廣告,請繼續往下閱讀-----

六、 結論

別忘了, 最終, 「提出一個具有說服力數學模型」 的責任, 落在倡議教學品保的校方 (或是暗中操弄又推卸 accountability 的教育部) 肩上。 如果校方要以管理科學的偉大旗幟來推動教學品保, 那麼就應該先找到足夠的學理支持來背書, 或者最起碼提供一個範例, 說明如何設計一個精確度高於 0.7 位有效數字的量化指標, 並且以同儕評審的學術精神公開範例相關資料, 一方面讓大眾檢驗、 一方面將貴校系的優質設計分享給其他校系學習。 科學實驗與科學方法應該要可以讓讀者模仿重複; 不然就不叫科學了, 對吧?

如果大力推動教學品保的 逢甲大學元智大學銘傳大學長庚大學朝陽科大 等等大學, 對於 「教學品保量化指標 0.7 位有效數字上限」 無法提出一個有效的回應與駁斥, 甚至無法提供一個好的範例, 卻還是堅持繼續推動, 那麼我們大學學術界腐壞失聰失明的狀況, 恐怕遠比彭明輝教授所點出的 「全球大學排名 騙倒一堆校長」 要更可怕。 到時候, 我可能需要考慮改行當巫醫或是祈雨師之類的, 也許還比留在大學當教授更能夠維持理性思考的習慣和科學研究實事求是的精神。 至少這些行業不必透過糟蹋數學來假裝自己很科學。

* * * * *

(留言時, 請用 tex 語法表示上標下標, 例如 w241118 請寫成 「w^{2411}_{18}」。 集合、 矩陣/線性變換用大寫; 個別向量用小寫。)

-----廣告,請繼續往下閱讀-----

(本文轉載自 資訊人權貴ㄓ疑)

文章難易度
洪朝貴
47 篇文章 ・ 1 位粉絲

0

0
0

文字

分享

0
0
0
民眾黨是未來台灣政治的樞紐?
林澤民_96
・2024/01/30 ・3382字 ・閱讀時間約 7 分鐘

一、前言

選後的立法院三黨不過半,但民眾黨有八席不分區立委,足以與民進黨或國民黨結成多數聯盟,勢將在國會居於樞紐地位。無獨有偶的是:民眾黨主席柯文哲在總統大選得到 26.5% 的選票,屈居第三,但因其獲得部分藍、綠選民的支持,在選民偏好順序組態的基礎上,它卻也同樣地居於樞紐地位。這個地位,將足以讓柯文哲及民眾黨在選後的台灣政壇持續激盪。

二、柯文哲是「孔多塞贏家」?

這次總統大選,誰能脫穎而出並不是一個特別令人殷盼的問題,更值得關心的問題是藍白綠「三跤㧣」在選民偏好順序組態中的消長。台灣總統大選採多數決選制,多數決選制英文叫 first-past-the-post(FPTP),簡單來講就是票多的贏,票少的輸。在 10 月中藍白合破局之後,賴蕭配會贏已經沒有懸念,但這只是選制定規之下的結果,換了另一個選制,同樣的選情可能就會險象環生。

從另一個角度想:選制是人為的,而選情反映的是社會現實。政治學者都知道天下沒有十全十美的選制;既定的選制推出了一位總統,並不代表選情的張力就會成為過眼雲煙。當三股社會勢力在制度的帷幕後繼續激盪,台灣政治將無法因新總統的誕生而趨於穩定。

圖/作者自製

如果在「三跤㧣」選舉之下,選情的激盪從候選人的得票多少看不出來,那要從哪裡看?政治學提供的一個方法是把候選人配對 PK,看是否有一位候選人能在所有的 PK 中取勝。這樣的候選人並不一定存在,如果不存在,那代表有 A 與 B 配對 A 勝,B 與 C 配對 B 勝,C 與 A 配對 C 勝的 A>B>C>A 的情形。這種情形,一般叫做「循環多數」(cyclical majorities),是 18 世紀法國學者孔多塞(Nicolas de Condorcet)首先提出。循環多數的存在意涵選舉結果隱藏了政治動盪。

-----廣告,請繼續往下閱讀-----

另一方面,如果有一位候選人能在配對 PK 時擊敗所有的其他候選人,這樣的候選人稱作「孔多塞贏家」(Condorcet winner),而在配對 PK 時均被擊敗的候選人則稱作「孔多塞輸家」(Condorcet loser)。三角嘟的選舉若無循環多數,則一定會有孔多塞贏家和孔多塞輸家,然而孔多塞贏家不一定即是多數決選制中贏得選舉的候選人,而多數決選制中贏得選舉的候選人卻可能是孔多塞輸家。

如果多數決選制中贏得選舉的候選人不是孔多塞贏家,那與循環多數一樣,意涵選後政治將不會穩定。

那麼,台灣這次總統大選,有沒有孔多塞贏家?如果有,是多數決選制之下當選的賴清德嗎?我根據戴立安先生調查規劃的《美麗島電子報》追蹤民調第 109 波(1 月 11 日至 12 日),也是選前最後民調的估計,得到的結果令人驚訝:得票墊後的柯文哲很可能是孔多塞贏家,而得票最多的賴清德很可能是孔多塞輸家。果然如此,那白色力量將會持續地激盪台灣政治!

我之前根據美麗島封關前第 101 波估計,侯友宜可能是孔多塞贏家,而賴清德是孔多塞輸家。現在得到不同的結果,顯示了封關期間的三股政治力量的消長。本來藍營期望的棄保不但沒有發生,而且柯文哲選前之夜在凱道浩大的造勢活動,還震驚了藍綠陣營。民調樣本估計出的孔多塞贏家本來就不準確,但短期內的改變,很可能反映了選情的激盪,甚至可能反映了循環多數的存在。

-----廣告,請繼續往下閱讀-----

三、如何從民調樣本估計孔多塞贏家

根據這波民調,總樣本 N=1001 位受訪者中,如果當時投票,會支持賴清德的受訪者共 355 人,佔 35.4%;支持侯友宜的受訪者共 247 人,佔 24.7%。支持柯文哲的受訪者共 200 人,佔 19.9%。

美麗島民調續問「最不希望誰當總統,也絕對不會投給他的候選人」,在會投票給三組候選人的 802 位支持者中,一共有 572 位對這個問題給予了明確的回答。《美麗島電子報》在其網站提供了交叉表如圖:

根據這個交叉表,我們可以估計每一位明確回答了續問的受訪者對三組候選人的偏好順序,然後再依這 572 人的偏好順序組態來判定在兩兩 PK 的情形下,候選人之間的輸贏如何。我得到的結果是:

  • 柯文哲 PK 賴清德:311 > 261(54.4% v. 45.6%)
  • 柯文哲 PK 侯友宜:287 > 285(50.2% v. 49.8%)
  • 侯友宜 PK 賴清德:293 > 279(51.2% v. 48.8%)

所以柯文哲是孔多塞贏家,賴清德是孔多塞輸家。當然我們如果考慮抽樣誤差(4.1%),除了柯文哲勝出賴清德具有統計顯著性之外,其他兩組配對可說難分難解。但在這 N=572 的小樣本中,三位候選人的得票率分別是:賴清德 40%,侯友宜 33%,柯文哲 27%,與選舉實際結果幾乎一模一樣。至少在這個反映了選舉結果的樣本中,柯文哲是孔多塞贏家。依多數決選制,孔多塞輸家賴清德當選。

-----廣告,請繼續往下閱讀-----

不過以上的分析有一個問題:各陣營的支持者中,有不少人無法明確回答「最不希望看到誰當總統,也絕對不會投給他做總統」的候選人。最嚴重的是賴清德的支持者,其「無反應率」(nonresponse rate)高達 34.5%。相對而言,侯友宜、柯文哲的支持者則分別只有 24.1%、23.8% 無法明確回答。為什麼賴的支持者有較多人無法指認最討厭的候選人?一個假設是因為藍、白性質相近,對許多綠營選民而言,其候選人的討厭程度可能難分軒輊。反過來說,藍、白陣營的選民大多數會最討厭綠營候選人,因此指認較無困難。無論如何,把無法明確回答偏好順序的受訪者歸為「遺失值」(missing value)而棄置不用總不是很恰當的做法,在這裡尤其可能會造成賴清德支持者數目的低估。

補救的辦法之一是在「無法明確回答等於無法區別」的假設下,把「遺失值」平分給投票對象之外的其他兩位候選人,也就是假設他們各有 1/2 的機會是無反應受訪者最討厭的候選人。這樣處理的結果,得到

  • 柯文哲 PK 賴清德:389 > 413(48.5% v. 51.5%)
  • 柯文哲 PK 侯友宜:396 > 406(49.4% v. 50.6%)
  • 侯友宜 PK 賴清德:376 > 426(46.9% v. 53.1%)

此時賴清德是孔多塞贏家,而柯文哲是孔多塞輸家。在這 N=802 的樣本中,三位候選人的得票率分別是:賴清德 44%,侯友宜 31%,柯文哲 25%。雖然依多數決選制,孔多塞贏家賴清德當選,但賴的得票率超過實際選舉結果(40%)。用無實證的假設來填補遺失值,反而造成賴清德支持者數目的高估。

如果擔心「無法明確回答等於無法區別」的假設太勉強,補救的辦法之二是把「遺失值」依有反應受訪者選擇最討厭對象的同樣比例,分給投票對象之外的其他兩位候選人。這樣處理的結果,得到

-----廣告,請繼續往下閱讀-----
  • 柯文哲 PK 賴清德:409 > 393(51.0% v. 49.0%)
  • 柯文哲 PK 侯友宜:407 > 395(50.8% v. 49.2%)
  • 侯友宜 PK 賴清德:417 > 385(52.0% v. 48.0%)

此時柯文哲又是孔多塞贏家,而賴清德又是孔多塞輸家了。這個樣本也是 N=802,三位候選人的得票率分別是:賴清德 44%,侯友宜 31%,柯文哲 25%,與上面的結果一樣。

以上三種無反應處理方法都不盡完美。第一種把無反應直接當遺失值丟棄,看似最不可取。然而縮小的樣本裡,三位候選人的支持度與實際選舉結果幾乎完全一致。後兩種以不同的假設補足了遺失值,但卻過度膨脹了賴清德的支持度。如果以樣本中候選人支持度與實際結果的比較來判斷遺失值處理方法的效度,我們不能排斥第一種方法及其結果。

無論如何,在缺乏完全資訊的情況下,我們發現的確有可能多數決輸家柯文哲是孔多塞贏家,而多數決贏家賴清德是孔多塞輸家。因為配對 PK 結果缺乏統計顯著性,我們甚至不能排除循環多數的存在。此後四年,多數決選制產生的總統能否在三角嘟力量的激盪下有效維持政治穩定,值得我們持續觀察。

四、結語

柯文哲之所以可以是孔多塞贏家,是因為藍綠選民傾向於最不希望對方的候選人當總統。而白營的中間偏藍位置,讓柯文哲與賴清德 PK 時,能夠得到大多數藍營選民的奧援而勝出。同樣的,當他與侯友宜 PK 時,他也能夠得到一部份綠營選民的奧援。只要他的支持者足夠,他也能夠勝出。反過來看,當賴清德與侯友宜 PK 時,除非他的基本盤夠大,否則從白營得到的奧援不一定足夠讓他勝出。民調 N=572 的樣本中,賴清德得 40%,侯友宜得 33%,柯文哲得 27%。由於柯的支持者討厭賴清德(52.5%)遠遠超過討厭侯友宜(23.7%),賴雖然基本盤較大,能夠從白營得到的奧援卻不多。而侯雖基本盤較小,卻有足夠的奧援。柯文哲之所以成為孔多塞贏家,賴清德之所以成為孔多塞輸家,都是這些因素的數學結果。

-----廣告,請繼續往下閱讀-----

資料來源

討論功能關閉中。

林澤民_96
37 篇文章 ・ 241 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

2
1

文字

分享

0
2
1
數學無聊是誰的錯?數學家其實很幽默?——《數盲、詐騙與偽科學》
大牌出版.出版大牌_96
・2024/01/08 ・2441字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

雖然很少有學生小學畢業後還不懂乘法表,但有很多人確實不會算,如果一個人開車的速度是每小時 56 公里,開了 4 小時之後,他就開了 224 公里。要是每公克花生賣 40 美分,而 1 袋花生賣 2.2 美元,那麼,這袋花生裡就有 5.5 公克花生。假如全世界人口中有 1/4 是中國人,其餘的 1/5 是印度人,那麼,印度人在全世界的人口中就占了 3/20,或說是 15%。當然,要理解這些問題,並不像學會算 35×4=140、(2.2)/(0.4)=5.5、1/5×(1–1/4)=3/20=0.15=15% 這麼簡單。對很多小學生來說,這不是自然而然就會的東西,要靠做很多很實用、或是純屬想像的問題,才能進一步學會。

至於估計,學校裡除了教一些四捨五入之外,通常也沒有別的了。四捨五入和合理的估計與真實人生大有關係,但課堂上很少串起這樣的連結。學校不會帶著小學生估計學校砌一面牆要用掉多少塊磚、班上跑最快的人速度多快、班上同學爸爸是禿頭的比例多高、一個人的頭圍與身高之比是多少、要堆出一座高度和帝國大廈等高的塔需要幾枚 5 美分硬幣,還有他們的教室能否容納這些 5 美分硬幣。

幾乎也沒人教歸納推理,也不會用猜測相關性質和規則的角度,來研究數學現象。在小學數學課裡談到非形式邏輯(informal logic)的機率,就跟講到冰島傳說一樣高。當然,也不會有人提到難題、遊戲和謎語。我相信,這是因為很多時候,聰明的 10 歲小孩輕輕鬆鬆就能打敗老師。

數學科普作家葛登能最不遺餘力探索數學和這些遊戲之間的密切關係。他寫了很多極有吸引力的書,也在《科學美國人》撰寫專欄,而這些都是會讓高中生或大學生感到很刺激的課外讀物(前提是有人指定他們去讀的話)。此外,數學家喬治.波利亞(George Polya)的《怎樣解題》(How to Solve It)和《數學與合情判讀》(Mathematics and Plausible Reasoning),或許也屬於這一類。有一本帶有這些人的文風、但屬於較初階的有趣好書,是瑪瑞琳.伯恩斯(Marilyn Burns)所寫的《我恨數學》(The I Hate Mathematics! Book),書裡有很多啟發性的提示,帶領讀者解題與發想各種奇思異想,是小學數學課本裡罕見的內容。

-----廣告,請繼續往下閱讀-----
圖/envato

有太多教科書仍列出太多人名和術語,就算有說明解析,也很少。比方說,教科書上會說加法是一種結合律運算(associative operation),因為(a + b)+ c=a +(b + c)。但很少人會提到非結合律運算,因此,充其量來說,結合律運算的定義是畫蛇添足。不管是結合律或非結合律,你知道了這些資訊之後要怎麼應用?書上還會介紹到其他術語,但除了用粗體字印在書頁中間的小框框裡,看起來很了不起之外,也沒什麼值得提的理由。這些術語滿足了很多人認為,知識就好比一門普通植物學,每種學問都可以在體系中,找到自己的類別和位置。相比之下,把數學當成有用的工具、思維方式或是獲得樂趣的途徑,在多數小學教育課綱中都是很陌生的概念(即使教科書內容不錯也一樣)。

或許有人會認為,在小學階段,可以用電腦軟體,來幫助學生掌握基本的算數原理及相關應用(應用題、估計等等)。可惜的是,目前可用的程式通常是從教科書上擷取無趣的例行練習,轉化成電腦螢幕版本而已。我不知道有任何軟體可用整合、一致且有效的方法,來教算術與解題應用。

小學階段的數學教學品質普遍不佳,最終必會有人怪罪於老師能力不足,而且對數學沒什麼興趣、或不懂欣賞數學。我認為,這當中有一部分又要歸咎於大專院校的師資培養課程中,很少或根本不強調數學。以我自己的教學經驗來說,我教過的學生中,表現最差的是中學生,而不是大學主修數學的學生。準小學老師的數學背景也很糟,很多時候甚至根本沒有相關的數學教學經歷。

而每所小學聘用一、兩位數學專才,在學校裡每天分別到不同班級輔導(或教授)數學,或許可以解決部分問題。有時我認為,如果大學數學教授和小學老師每年可以交換個幾星期,會是個好方法。同樣的,把主修數學的大學生和研究生交到小學老師手裡,不會造成傷害(事實上,後者或許能從前者身上學到一些東西)。而三、四、五年級的小學生則可以在完全適任的老師教導下,接觸到數學謎題與遊戲,將可大大獲益。

-----廣告,請繼續往下閱讀-----
圖/envato

稍微打個岔,謎題與數學之間很有關係,而且相關性會一直延續到大學與研究階段的數學。當然,把謎題換成幽默也通。我在《數學與幽默》(Mathematics and Humor)書中試著說明,數學和幽默都是某種益智遊戲,與猜謎、解題、遊戲和悖論多有共通之處。

數學和幽默都是把概念組合、拆開再拼回來,然後從中得到樂趣。慣用的手法包括並列、歸納、迭代和倒向(比方說「aixelsyd」就是把「dyslexia」﹝閱讀障礙﹞的字序倒過來)。那麼,如果我放寬這個條件,但緊縮另一個條件會怎樣?某一個領域的概念(像是綁辮子),和另一個看來完全不同領域的概念(如某些幾何圖形的對稱性)有什麼共通點?當然,即便不是數盲,可能也不熟悉數學這個面向,因為你必須要先具備一定程度的數學概念,才可以拿來耍弄。其他像獨創性、不協調感以及精簡的表達,對於數學和幽默來說也都同樣重要。

可能有人說過,因為所受訓練之故,數學家有一種特殊的幽默感。他們往往會接受字面意義,但字面上的解讀又常和標準用法的意義不同,因此很好笑。比方說,哪種運動比賽時要蓋臉?答案是,冰上曲棍球以及痲瘋病人拳擊(按:原文「Which two sports have face-offs」,「face-off」其中一個字面意義為「蓋臉」,而這也是冰上曲棍球常用的術語,意指「爭奪球權」)。他們也很沉溺於歸謬法(reductio ad absurdum),或設定極端前提條件然後做邏輯演練,以及各式各樣的字組遊戲。

如果可以透過小學、中學或大學階段的正式數學教育,或是非正式的數學科普書籍,傳達數學有趣的面向。我認為,數盲就不會像現在這麼普遍。

-----廣告,請繼續往下閱讀-----

——本書摘自《數盲、詐騙與偽科學》,2023 年 11 月,大牌出版,未經同意請勿轉載。

討論功能關閉中。

大牌出版.出版大牌_96
3 篇文章 ・ 0 位粉絲
閱讀的大牌不侷限於單一領域, 視野寬廣,知識豐富,思考獨立。

0

0
0

文字

分享

0
0
0
賭博與愛情公式:用數學擬定你的擇偶策略——《數盲、詐騙與偽科學》
大牌出版.出版大牌_96
・2024/01/06 ・2486字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

理解期望值,有助於分析賭場裡的大部分賭局,以及美國中西部和英國的嘉年華會中,常有人玩、但一般人比較不熟悉的賭法:骰子擲好運(chuck-a-luck)。

招攬人來玩「骰子擲好運」的說詞極具說服力:你從 1 到 6 挑一個號碼,莊家一次擲三顆骰子,如果三個骰子都擲出你挑的號碼,莊家付你 3 美元。要是三個骰子裡出現兩個你挑的號碼,莊家付你 2 美元。

假如三個骰子裡只出現一個你挑的號碼,莊家付你 1 美元。如果你挑的號碼一個也沒有出現,那你要付莊家 1 美元。賽局用三個不同的骰子,你有三次機會贏,而且,有時候你還不只贏 1 美元,最多也不過輸 1 美元。

我們可以套用名主持人瓊安.李維絲(Joan Rivers)的名言(按:她的名言是:「我們能聊一聊嗎?」),問一句:「我們能算一算嗎?」(如果你寧願不算,可以跳過這一節。)不管你選哪個號碼,贏的機率顯然都一樣。不過,為了讓計算更明確易懂,假設你永遠都選 4。骰子是獨立的,三個骰子都出現 4 點的機率是 1/6×1/6×1/6=1/216,你約有 1/216 的機率會贏得 3 美元。

-----廣告,請繼續往下閱讀-----

僅有兩個骰子出現 4 點的機率,會難算一點。但你可以使用第 1 章提到的二項機率分布,我會在這裡再導一遍。三個骰子中出現兩個 4,有三種彼此互斥的情況:X44、4X4 或 44X,其中 X 代表任何非 4 的點數。而第一種的機率是 5/6×1/6×1/6=5/216,第二種和第三種的結果也是這樣。三者相加,可得出三個骰子裡出現兩個 4 點的機率為 15/216,你有這樣的機率會贏得 2 美元。

圖/envato

同樣的,要算出三個骰子裡只出現一個 4 點的機率,也是要將事件分解成三種互斥的情況。得出 4XX 的機率為 1/6×5/6×5/6=25/216,得到 X4X 和 XX4 的機率亦同,三者相加,得出 75/216。這是三個骰子裡僅出現一個 4 點的機率,因此也是你贏得 1 美元的機率。

要計算擲三個骰子都沒有出現 4 點的機率,我們只要算出剩下的機率是多少即可。算法是用 1(或是100%)減去(1/216 +15/216 + 75/216),得出的答案是 125/216。所以,平均而言,你每玩 216 次骰子擲好運,就有 125 次要輸 1 美元。

這樣一來,就可以算出你贏的期望值($3×1/216)+($2×15/216)+($1×75/216)+(–$1×125/216)=$(–17/216)=–$0.08。平均來說,你每玩一次這個看起來很有吸引力的賭局,大概就要輸掉 8 美分。

-----廣告,請繼續往下閱讀-----

尋找愛情,有公式?

面對愛情,有人從感性出發,有人以理性去愛。兩種單獨運作時顯然效果都不太好,但加起來⋯⋯也不是很妙。不過,如果善用兩者,成功的機率可能還是大一些。回想舊愛,憑感性去愛的人很可能悲嘆錯失的良緣,並認為自己以後再也不會這麼愛一個人了。而用比較冷靜的態度去愛的人,很可能會對以下的機率結果感興趣。

在我們的模型中,假設女主角——就叫她香桃吧(按:在希臘神話中,香桃木﹝Myrtle﹞是愛神阿芙蘿黛蒂﹝Aphrodite﹞的代表植物,象徵愛與美)有理由相信,在她的「約會生涯」中,會遇到 N 個可能成為配偶的人。對某些女性來說,N 可能等於 2;對另一些人來說,N 也許是 200。香桃思考的問題是:到了什麼時候我就應該接受X先生,不管在他之後可能有某些追求者比他「更好」?我們也假設她是一次遇見一個人,有能力判斷她遇到的人是否適合她,以及,一旦她拒絕了某個人之後,此人就永遠出局。

為了便於說明,假設香桃到目前為止已經見過 6 位男士,她對這些人的排序如下:3—5—1—6—2—4。這是指,在她約過會的這 6 人中,她對見到的第一人的喜歡程度排第 3 名,對第二人的喜歡程度排第 5 名,最喜歡第三個人,以此類推。如果她見了第七個人,她對此人的喜歡程度超過其他人,但第三人仍穩居寶座,那她的更新排序就會變成 4—6—1—7—3—5—2。每見過一個人,她就更新追求者的相對排序。她在想,到底要用什麼樣的規則擇偶,才能讓她最有機會從預估的 N 位追求者中,選出最好的。

圖/envato

要得出最好的策略,要善用條件機率(我們會在下一章介紹條件機率)和一點微積分,但策略本身講起來很簡單。如果有某個人比過去的對象都好,且讓我們把此人稱為真命天子。如果香桃打算和 N 個人碰面,她大概需要拒絕前面的 37%,之後真命天子出現時(如果有的話),就接受。

-----廣告,請繼續往下閱讀-----

舉例來說,假設香桃不是太有魅力,她很可能只會遇見 4 個合格的追求者。我們進一步假設,這 4 個人與她相見的順序,是 24 種可能性中的任何一種(24=4×3×2×1)。

由於 N=4,37% 策略在這個例子中不夠清楚(無法對應到整數),而 37% 介於 25% 與 50% 之間,因此有兩套對應的最佳策略如下:

(A)拒絕第一個對象(4×25%=1),接受後來最佳的對象。

(B)拒絕前兩名追求者(4×50%=2),接受後來最好的求愛者。

如果採取A策略,香桃會在 24 種可能性中的 11 種,選到最好的追求者。採取 B 策略的話,會在 24 種可能性中的 10 種裡擇偶成功。

以下列出所有序列,如同前述,1 代表香桃最偏好的追求者,2 代表她的次佳選擇,以此類推。因此,3—2—1—4 代表她先遇見第三選擇,再來遇見第二選擇,第三次遇到最佳選擇,最後則遇到下下之選。序列後面標示的 A 或 B,代表在這些情況下,採取 A 策略或 B 策略能讓她選到真命天子。

-----廣告,請繼續往下閱讀-----

1234;1243;1324;1342;1423;1432;2134(A);2143(A);2314(A, B);2341(A, B);2413(A, B);2431(A, B);3124(A);3142(A);3214(B);3241(B);3412(A, B);3421;4123(A);4132(A);4213(B);4231(B);4312(B);4321

如果香桃很有魅力,預期可以遇見 25 位追求者,那她的策略是要拒絕前 9 位追求者(25 的 37% 約為 9),接受之後出現的最好對象。我們也可以用類似的表來驗證,但是這個表會變得很龐雜,因此,最好的策略就是接受通用證明。(不用多說,如果要找伴的人是男士而非女士,同樣的分析也成立。)如果 N 的數值很大,那麼,香桃遵循這套 37% 法則擇偶的成功率也約略是 37%。接下來的部分就比較難了:要如何和真命天子相伴相守。話說回來,這個 37% 法則數學模型也衍生出許多版本,其中加上了更合理的戀愛限制條件。

——本書摘自《數盲、詐騙與偽科學》,2023 年 11 月,大牌出版,未經同意請勿轉載。

討論功能關閉中。

大牌出版.出版大牌_96
3 篇文章 ・ 0 位粉絲
閱讀的大牌不侷限於單一領域, 視野寬廣,知識豐富,思考獨立。