2

0
1

文字

分享

2
0
1

用演算法可以揪出大樂透有沒有作弊嗎?又或者是…中獎號碼?

活躍星系核_96
・2017/09/18 ・3342字 ・閱讀時間約 6 分鐘 ・SR值 493 ・六年級

  • 作者 / 超科學貓,本身工作是平面設計師,自學程式語言 10 年,專研人工智慧深度學習領域約 8 年左右,主要研究記憶過程的演算法。仔細的去觀察這世界,就會發現許多奇怪的盲點,但以程式語言帶入去解,卻可以解釋許多問題;只要有記事本,我就可以創造一個世界。

「一券在手希望無窮」,但買大樂透中獎的卻都從來不是我。到底為什麼大樂透那麼難中?難道它真的有作弊嗎?又或是公務員常常中獎的掛並非空穴來風?

你是否也曾經看過一些類似的文章指出大樂透的作弊機制呢?內容大概是在說,明明是在 8 點截止購買,卻在 8 點 30 分才公開當期結果,這消失的 30 分鐘就是台彩在進行分析比對,開出一組沒有人中過、或是給公務人員中獎的號碼。

到底為什麼大樂透那麼難中?圖/By  krzys16 @ Pixabay

我研究人工智慧深度學習領域已有八年餘載,也有自己撰寫的一套人工智慧系統以及一些類似智慧型小軟體來輔助我的生活,這次我決定用我撰寫的人工智慧系統來演算樂透開獎的結果,想不到得到令人驚訝的結果,以下是我一個多月來的研究和分析,或許可以解釋或說明大樂透為什麼這麼難中,他是否真的有作弊呢?要怎麼買才會賺呢?

有可能打出一模一樣的撞球球型嗎?談自然機率與演算法

首先,我先舉幾個例子讓大家了解演算法自然機率

-----廣告,請繼續往下閱讀-----

有打過撞球的人都知道,每次開球後的球型幾乎沒有一次會與曾經開過的球型分佈一模一樣,從物理學來看,會不會有完全一模一樣的機率呢?答案是有的,那為什麼我們遇不到呢?因為他發生的機率實在太小太小了,小到我們在這一生或者幾輩子的時間裡都還遇不到一次,如果在加上空氣的濕度,球桌的毛順度,皮頭的摩擦力等等,在球桌這樣有限的空間範圍裡,16 顆球的碰撞後,出現一模一樣的機率幾乎為 0,但是不能說沒有。

如果上面所說的已經理解,再來看下面可能會比較清楚,有打過撞球的人都會有一種經驗,「怎麼球型又變成這樣!」沒錯,雖然上面說出現一模一樣的機率幾乎為 0,但是出現相似的機率卻高出很多,原因在於幾次碰撞後,由於外在的影響取決於習性,所以會很常出現相似的球型。

每次開球後的球型幾乎沒有一次會與曾經開過的球型分佈一模一樣。圖/By Paul Goyette @ flickr, CC BY-NC-SA 2.0

第三個例子或許有從電視上看過,或者親自被問過,這個問題是這樣的:隨機在 1~50 想一個數字,然後「魔術師」可以猜中你心裡所想的數字。你可能會認為你所想的那一個數字是隨機而來的 By Chance,但其實不然。在幼齡時期腦中的認知中沒有數字的概念時,我們根本無法得出那一個數字;因此這一個看似隨機而來的數字,其實是經由腦中不斷的演算各種環境數值後,求得的最大可能性,這些環境數值大多是在沒有意識到的情況下被記錄下來,但由於環境的參數太多太亂,所以這些資訊很難被演算變成結果,但卻會變成演算的一部分,而這樣的過程視為 By Design。

好,如果上面三個都能理解了,現在我們換成大樂透來看,假設開球的設備就像撞球的球檯,他是一個有限的空間和範圍,讓 49 顆號碼球互相碰撞後,最後取出的 7 個號碼 (含特別號),中頭獎的機率為 1/10,068,347,520,看起來機率非常的小,但實際機率卻不然,我們可以把每次的碰撞視為 By Design 而不是 By Chance,哪顆球與哪顆球會碰撞到,完全可以從演算法中計算出來,當然開獎的結果也可以由演算法得出。

-----廣告,請繼續往下閱讀-----

用演算法可以揪出大樂透有沒有作弊嗎?又或者是…中獎號碼?

演算的概念為,此次開獎的數組,是由過去相似模型中取得最大可能性的模型排列;簡單的說,你的身高樣貌等等,是由你的父母基因,還有父母的父母基因,一直追溯到最源頭;而你的父母、父母的父母,就會成為推算出你身高樣貌的數據,從最源頭的祖先累積下來的基因,就會變成龐大的數據。

以這樣的概念做為出發點,我做了為期一個月的實驗,這個實驗分成了三個部分;

  1. 確認大樂透是否作弊
  2. 以隨機數程式碼 Math.random() 模擬電腦隨機選號的機率
  3. 算出最大中獎率的投資報酬率

在第一個實驗中,我以我撰寫的人工智慧演算法套入截至目前 1,406 組的開獎結果,並且逐一預測每次開獎的結果和中獎次數;並且以前次、前前次,甚至可以推到前 10 次來演算這次的號碼。

令人驚訝的是,由演算法推算出下一次7個號碼(含特別號)預測中的機率約為70~72%左右(不過這裡指的不是中獎率,而是中1~6碼的機率)。但也不用高興的太早,因為這邊的機率為中 1 個號碼到中 6 個號碼的全部機率,如果要說是投資報酬率,就要以大樂透的規則中三碼以上才有獎金的結果來看;中三碼以上的機率其實只有 6%~7% 左右。接著為了確認是否有可能會有人為操作,於是再以開獎順序、大小順序來進行演算,或者調整 P 值當中的數據,將近三組的演算最高、最低做重新組合再演算;而這樣得出的結果幾乎都大同小異。

-----廣告,請繼續往下閱讀-----

而且各個位置開出來中的機率也幾乎平均在 20% 左右;從這邊可以得出,若在人為操縱的情況下,某個位置或者某一號碼,也可能是為了避開多人選的中獎號碼而選擇機率較低的情況,中獎的樹狀圖應該不會呈現平均。

在這邊舉一個簡單的例子:投擲硬幣出現正反面的機率為 1:1,若以此機率來看,投擲十次出現的機率應該約為 5:5 或 4:6,若今天有人為操作,當你投擲 100次的時候就會發現,正反面的比數會非常的大,可能是 20:80;而且不管是更換硬幣,或者更換投擲者,只要在人為操作的情況下,比例幾乎都會失衡。所以從各種情況下的演算過的機率幾乎相同的結果來看,台彩作弊的嫌疑甚低。

在第二個實驗中,以隨機數程式碼 Math.random() 隨機從 1~49 個號碼中選出 6 個不重覆的號碼進行比對的平均值。結果更令人驚訝,居然與第一個實驗的機率大致相同!於是基於好奇心,我決定以一組隨機 7 碼(含特別號)當做開獎結果,再算一筆隨機 6 碼當作電腦選號,結果也與上面相似。

第二個實驗結束後,幾乎可以得到幾個結論:

-----廣告,請繼續往下閱讀-----
  1. 演算法仰賴大數據,而 1,406 組的數據樣本太少,在虛無假設正確率過低的情況下,就算在乘上最大機率的演算結果,最後的機率仍然偏低。我這邊舉個例子,使用保險套能避孕的機率為 98%,但是這是在 100% 正確使用的情況下的機率,這裡的 100% 就是虛無假設,若在不正常的情況下使用,就會降低虛無假設的機率,若機率降為 80%,則成功避孕的機率為 0.8*98=78.4,所以就沒有原本的 98% 成功率來的高。
  2. 若在自然機率的情況下,演算法的機率應該會大過於隨機數。但在這裡卻沒有,原因可能為無法預測的情況。在撞球的例子當中有提到,若空氣的濕度、球檯的毛順度都會影響甚至改變演算的結果,而上面的演算法是在一個沒有其他干擾的情況下碰撞演算出來的,如果每次開獎前,都將號碼球經由不同的人弄亂,又或者每次都用不同的號碼球,這樣演算出了的結果就幾乎等於隨機數的結果了,這點從第二個實驗中的更改版中可以得到證實。若把中三碼以上的原始機率設為 y,則中獎的機率算法是 y*(n*(1/x+1)),n 代表不同的因素,x 代表各種因素中的重覆次數;因此可能是造成演算法的機率大大下降的原因。
圖/By  Bclaus_indesign @ Pixabay

第三個實驗為中獎的投資報酬率,從上面的兩個研究結果中已知單筆的中獎率為 7%,所以我以一次開出 300 組隨機數代表電腦選號來進行比對,扣除購買成本 50(元)*300(組)* 1406(次開獎)=21,090,000(元),以三碼為 400、四碼為 1,000、五碼 50,000 來換算,結果還是會賠本約為 2/3 的錢。但是平均卻有 1~2 次中 6 碼,大樂透只要 6 碼全中至少保證 1 億元,扣除2 千萬的成本似乎是可以投資的;但先別高興的太早,樂透中有一個機制叫做特別號,如果中的 6 碼是 5 碼+特別號,獎金只有約一百萬左右。

其實用很粗淺的方式換算的話每期只要銷售個大約一千五百多組以上,這樣就算有人中了頭獎台灣彩券也不太會賠本。加上原本中頭獎的機率就低,台彩就算在不作弊的情況下也不會賠錢,所以他不怕你中頭獎,以上面研究總結來看,大樂透作弊的機率甚低。不過「有夢最美,希望相隨」畢竟大樂透還是造就了許多億萬富翁,但是各位還是得依自己的狀況,依自己能力有限的範圍來做小額投資,千萬別走火入魔、傾家蕩產了。

-----廣告,請繼續往下閱讀-----
文章難易度
所有討論 2
活躍星系核_96
778 篇文章 ・ 130 位粉絲
活躍星系核(active galactic nucleus, AGN)是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍,在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。 本帳號發表來自各方的投稿。附有資料出處的科學好文,都歡迎你來投稿喔。 Email: contact@pansci.asia

0

1
1

文字

分享

0
1
1
生活中的數理應用:節能、冷卻與機率思考
賴昭正_96
・2025/08/21 ・5603字 ・閱讀時間約 11 分鐘

隨著科技的快速進步及生活水準的不斷提高,人類在日常生活使用的工具越來越複雜。面對推陳出新,源源不絕的各種新式工具,要如何有效地使用它們呢?看到這麼多的廣告,又要如何判斷它們的真偽呢?

這些應用科學的工具固然帶來許多便利性,但是使用者在不了解背後科學原理的情況下,也可能發生誤解,造成一些錯誤觀念以訛傳訛,反而促成不必要的浪費。本文便是筆者以日常生活中的見聞,來探討生活用品背後的一些物理原理與數學,期望能釐清一些迷思,讓讀者能夠撥雲見日。

電熱水瓶

在「日常生活範式的轉變:從紙筆到 AI」一文裡,筆者提到了許多改變我們日常生活的現代科技,卻忘了非常重要的網路購物!事實上,除了菜市場外,筆者現在幾乎已不在任何商店買東西了。網路購物有一個很大的優點,那就是很容易比較不同品牌的商品。例如 2020 年筆者決定換個熱水瓶時,在美國最大的網路市場亞馬遜(Amazon)碰到一個問題:一般的熱水瓶(如松下)大約只要美金 100 左右,唯獨像印(Zojirushi)卻有高達美金 200 元以上的熱水瓶;仔細比較一下,唯一的大不同是後者有真空保溫的外層。一向節儉慣的筆者幾經思考後決定購買 4 公升裝的松下。

在透過提高裝貨運送速度、實施更嚴格的賣家驗證流程來應對假冒產品的擔憂後,中國大陸的「全球速賣通」(AliExpress) 似乎已重返美國市場,筆者最近兩、三年也開始敢在其網站購物了。數月前看到它廣告只要美金 150 元的像印真空保溫熱水瓶,一向喜歡佔小便宜的筆者就買了一隻,讓筆者有實際的數據來比較像印的高價是否值得。像印的規格資料謂保持在 90℃ 的平均功率是 24 瓦特;美國聖荷西市的電費是每一度(千瓦小時)0.39 美元,因此每年用在保溫的電費為

-----廣告,請繼續往下閱讀-----

松下的規格資料謂保持在 88℃ 的平均功率是 39 瓦特,因此每年用在保溫的電費是

即像印熱水瓶每年可節省約 51 美元的保溫費!值不值得高價買像印熱水瓶那就看讀者準備要用多久了。筆者的松下熱水瓶用了 4 年多,因此後悔當初沒有買比較貴的像印真空保溫熱水瓶了!

一般電熱水瓶均有所謂的「節能定時器功能」:因為晚上睡覺時不用熱水,所以在睡覺前將熱水瓶關掉,可以設定幾小時後,再自動加熱,讓讀者起來時立即有熱水泡茶或沖咖啡。這看起來是很方便,但真的節能嗎?

讓我們在這裡來分析一下吧。如果有科學儀器幫忙,分析將是輕而易舉;但事實上即使沒有,我們還是可以做很多有意義之分析的。我們關掉熱水瓶的電後,其溫度將類似圖一的紅線下降(註一),「最後」到達室溫。理論上「最後」應是慢慢逼近,永遠不可能達到室溫的。

-----廣告,請繼續往下閱讀-----
圖一: x 軸為特徵時間(相對值),y 軸為溫度。紅線為熱水瓶依據牛頓冷卻定律所畫出的降溫曲線,藍線代表熱水瓶維持保溫狀態。

但在實應上,我們可以說到達 1.5 之 x 座標時已經是室溫。而 1.5 到底是多少小時,則因電熱水瓶的設計及室溫之不同而異。如果設定的節能定時 x ≤ 1.5,那麼熱水瓶所散的熱正好由重新啟動的加熱補上,所以根本沒有節能;如果設定的 x > 1.5,則因熱水瓶在 x 1.5 後就已經不再散熱了,而沒有關掉的熱水瓶仍必須繼續保溫(圖一藍線),所以關掉熱水瓶是值得的、有節能的效果。

松下熱水瓶只有一個 6 小時的定時,筆者夏天做了一個實驗,發現 7 小時後還是室溫,所以沒用過它的「節能定時器功能」;像印松下熱水瓶在 6-12 小時間有 6 個定時。

便攜式空調

聖荷西夏天很熱的時間不長,因此筆者一直想買容易移動的「便攜式空調」(portable air conditioner),以便炎暑一過就可以收起來。以「portable air conditioner」搜尋亞馬遜網路市場,發現有價格差異很大的兩種空調:一種大約在美金 100 元以下,另一種則大約在 200 元以上。

仔細「研究」發現其差異是前者不必要往外面排熱氣,後者必須有管子通到外面以便排掉熱氣。我們知道能量不滅定律,如果用電產生的熱不往外排掉,那熱只能留在房間內,房間只會越來越熱,不可能變冷的!所以這類的「冷氣機」(圖二)只能像電扇一樣,讓你在電扇前面感到涼爽而已!

-----廣告,請繼續往下閱讀-----

事實上比電扇好一點的都加了一個水箱,利用蒸發水會吸熱,讓你感到的風比電扇更冷一點,所以價錢比普通電扇高一點。這種電扇在乾燥的地方事實上是一雙箭雕:除了吹冷風外,同時可以增加空氣的濕度;但是在濕度很高的台灣,其結果可能讓人感到更悶、更難受。

為什麼要使用水呢?除了是最常見的物質之外,水俱有許多其它物質所沒有的性質(參見「奇妙的水分子」),例如氣化熱(一克的水蒸發成一克的氣體所需的熱)、比熱(將一克的水提高溫度一度所需的熱)等等均比其它物質高出許多,所以我們馬上將看到水也常來當冷卻劑。

前面所談到之兩種空調在外表上的不同是「往外面排熱氣的管子」,在內部構造上則是「壓縮機的有無」。壓縮機將氣態冷媒擠壓成液態時會產生大量的熱,冷氣機必須透過「熱交換」將它們丟到外面去,這就是為什麼「真正的冷氣機」需要有通到外面的排氣管。被壓縮的冷媒到了壓力較低的地方會立即透過「熱交換」吸熱膨脹成氣態的冷媒。前者「熱交換」的媒體主要是室外的空氣(為了提高效力,大冷氣機會用水),後者則是室內的空氣(見圖二)。

沒有排氣管的冷氣機

所以真正的冷氣機應該要有排氣管,但筆者在網路上逛店時卻發現有壓縮機、但沒有排氣管的冷氣機!例如有一款「HANLIN HS02 移動冷氣 行動空調」廣告謂:「商業級強勁壓縮機秒速制冷,快速降溫,讓酷暑瞬間消散;……。免排水高溫自蒸發系統,內建水箱設計,開機預設開啟,免排水冷凝水,高溫排風自動霧化」。從產品特色看來,壓縮機所產生的熱量應該是用來蒸發(霧化)「水箱」的水(見圖三)。讓我們在這裡利用能量不滅定律來看看是否可行。

-----廣告,請繼續往下閱讀-----

該產品的規格謂其冷氣量為 1400 瓦特,即每秒鐘可以從室內拿掉1400焦耳的能量。前面提到水的汽化熱很高,約為每公克 2260 焦耳;因此該機器每秒鐘能蒸發掉約 0.62 公克(1400/2260)的水。也就是說為了保持室溫不變,一小時必須蒸發掉 2230 公克(2.23 公升)的水。因此除非水箱是 24 公升大,「12 小時預約定時,可設定開關機時間,方便您的生活」是絕對不可能的!還有,這些蒸發的水氣很快就會達到飽和點、結合成液態水,釋放出其剛吸收的汽化熱到室內,不可能降低室內溫度的!在廣告中他們特別介紹了「外出露營帳篷使用方法」,相信那才是該冷氣機可以真正發揮功能的地方;而商品配件中的「排水管」應該是用來「勸」我們在室內使用吧?

所以用蒸發水來冷卻壓縮機似乎是不可行的,但因為水的比熱較空氣高多了,循環「水箱」的水來冷卻壓縮機效益應該比空氣更高(見圖三),可行嗎?

DIKE 多功能移動式瞬涼水冷氣 HLE700WT就是基於這種想法的一個產品。其廣告謂:創新「無排熱管」冰風機,採用水冷循環及高效壓縮機製冷,出風降溫至 14℃,搭配獨立除溼、送風三合一功能四季都適用!前面涼快,後面涼快,無須排熱風管免窗戶施工。…製冷前需先將水箱加水,維持水循環運作,水箱裝滿 4 公升時可持續製冷 8 到 12小 時,一整天都涼爽。因為水是熱交換媒,因此廣告特別強調「大容量水箱」,讓我們在這裡也利用能量不滅定律來看看是否可行。

廣告中沒有提到冷氣量,讓我們在這裡假設與前面那款冷氣機一樣(1400瓦特)吧,即每秒鐘可以從室內拿掉1400焦耳的能量,或每小時可以拿掉5040千焦耳的能量。前面提到水的比熱很高,將1公克的水提升溫度一度需4.2焦耳;因此4公升(4000克)的水從30°C提升到100°C 水滾前可以拿掉1176千焦耳(4.2 x 4000 x 70)的熱,也就是說僅能夠拿掉冷氣機0.23小時的壓縮熱能(1176/5040)!

-----廣告,請繼續往下閱讀-----

彩券選擇題

美國有許多州聯合起來的「百萬大獎」(Mega Millions):玩家可以從兩個獨立的數字池中挑選六個數字——從 1 到 70 中的五個不同數字(白球)和從 1 到 25 中的一個數字(金色百萬富翁球)。學過排列組合的讀者應該可以算出其得獎或然率是 302,575,350 之一(註二)。

美國的人口約為 335 百萬,估計絕對不會有半數以上的人買,所以其設計是每次有人中獎的機會不大,獎金下移累積,因此三不五時會出現一個大獎來製造大新聞。例如有一次大獎是 12.2 億美元,而每張「百萬大獎」券才 2 元;這麼高的「益本比」確實是相當吸引人,因此到處出現大排長龍購買,讀者會加入行列嗎?

數學及經濟學上有一稱為「預期價值」(expected value)——隨機變數可能的值,乘上其機率的總和——來幫助我們決定是否值得投資。例如假設拋硬幣正面的或然率為 2/3,反面的或然率為 1/3 ;如果擲出正面,您輸掉 $6,反面您贏得 $10;您賭嗎?這遊戲的「預期價值」為:

即平均而言,每次玩此遊戲大約會輸掉 $0.67,所以不值得玩。我們就用這個方法來看看是否值得去排長龍買「百萬大獎」吧。因為一定要買才能中獎,所以嚴格說來,在這裡不能用「預期價值」。但因為中獎幾率可以說是零,所以在這裡假設沒必要買,只是去選號碼,沒中獎時才交$2.00:

-----廣告,請繼續往下閱讀-----

也就是說即使每次都是大獎,我們每次只要去排隊選號就可以得到$2.00。筆者雖然退休了,沒什麼大事可做,還是不會浪費時間去排隊購買的;當然,如果是因為愛國,那就另當別論了!

但是如果有 $302,575,350 將所有的組合都買下來,那不是一定可以中獎得到 $12.2 億嗎?筆者謹在此建議「泛科學」讀者成立「美國愛國獎券基金會」,募款 $302,575,350 讓我們一起發財吧(註三)!

除了投資及愛國獎券外,「預期價值」在日常生活中事實上還有一個非常有用的地方:那就是決定考試選擇題的策略。早在 1977 年當筆者還不知道什麼是投資時,就已經用常識分析了這個問題:

現行(大學入學分科測驗)倒扣的計算方法(如五選一,答對 1 分,答錯扣 0.25 分),任何只要具備簡單或然率知識的人均能算出:如果考生「完全瞎猜」,則得分數與倒扣分數剛好互相抵消。

-----廣告,請繼續往下閱讀-----

上面這種稱為「邁可生倒扣公式」的預期價值是

在這種倒扣方法下,最佳戰略應該如何決定?顯然地,如果在五個答案中,我已經知道一個或一個以上的答案是錯的,那我應該答,因為得分的或然率已高於倒扣分的或然率:

但是如果我很不幸地「完完全全不知」呢?那因為答了也不吃虧,所以也應該答!!!總而言之,不管怎麼樣,每題都應該答!記住,每題都應該答!

「倒扣」的記分方法原有遏止考生投機的用意,可是根據上面的分析,邁可生倒扣公式不僅達不到遏止投機的目的,反而會助長之;所以,如果要避免考生猜題,倒扣比例應該提高。現在讀者應該不難算出:如果倒扣為 0.30 分,那麼邁可生倒扣公式之預期價值便變成 -0.04,就不值得瞎猜了!

結論

像印牌熱水瓶使用真空保溫,散熱率較低,也因之價格較高,但長期使用下來還是值得的。熱水瓶的「節能定時器功能」是否節能得看環境及定時長短。

「真正的冷氣機」一定要具有能「往外面排熱氣的管子」,否則因為能量不滅的關係,所有的熱只能留在室內,或許可以讓站在出風口處的人感到冷風或冷氣,但是絕對不可能使室溫下降的。事實上根本不需要分析,簡單的邏輯告訴我們:不拿熱到外面的任何機器都不可能讓室內冷下來的!筆者最後還是買了一款定價高一點、體積大很多、有管子通往外面、不怎麼方便的「便攜式空調」(註四),其冷氣量高達 4100 瓦特,為「HANLIN HS02 移動冷氣」的3倍!

美國之「百萬大獎」的「益本比」雖然可以上十億,但投資報酬率(預期價值)似乎太低,不值得浪費時間排隊去買的。如果考試選擇題採用的是「邁可生倒扣公式」,那即是完全不知道答案,也應該每題都要回答!

附註

(註一)只要透過基本微積分就可以導出來。熱水瓶的溫度(T)下降速率應該正比於散熱係數(σ)及裡外溫差(T-To):

式中的 To 為室外溫度,解得

式中的 Tw 為熱水瓶的設定溫度(即 t=0 時的溫度)。


(註二)選一「白球」的方法有 C(70, 5) ,選五「金色百萬富翁球」的方法有 C(25, 1) , 所以選一「白球」及五「金色球」的方法有:


(註三)筆者尚不知如何買下所有的 302,575,350 組合,請讀者提供高見。


(註四)事實上是冷暖兩用機:圖三中的室內、室外互換即成暖氣機。當暖氣機用時,因為要從室外拿熱進來,其效率比一般只在室內用電加熱的「純電熱器」高(2.7:1)。

延伸閱讀

  • 「奇妙的水分子」,科學月刊,1979年1月。
  • 「聯考與選擇題」,科學月刊,1977年8月。
  • 「日常生活中的物理與化學」,科學月刊,2010年12月。
  • 日常生活範式的轉變:從紙筆到 AI」,泛科學,2023/03/08。
  • 我愛科學》,華騰文化有限公司,2017年12月出版;內含「奇妙的水分子」、「聯考與選擇題」、「日常生活中的物理與化學」。
-----廣告,請繼續往下閱讀-----

討論功能關閉中。

賴昭正_96
50 篇文章 ・ 61 位粉絲
成功大學化學工程系學士,芝加哥大學化學物理博士。在芝大時與一群留學生合創「科學月刊」。一直想回國貢獻所學,因此畢業後不久即回清大化學系任教。自認平易近人,但教學嚴謹,因此獲有「賴大刀」之惡名!於1982年時當選爲 清大化學系新一代的年青首任系主任兼所長;但壯志難酬,兩年後即辭職到美留浪,IBM顧問研究化學家退休 。晚期曾回台蓋工廠及創業,均應「水土不服」而鎩羽而歸。正式退休後,除了開始又爲科學月刊寫文章外,全職帶小孫女(半歲起);現已成七歲之小孫女的BFF(2015)。首先接觸到泛科學是因爲它轉載我的科學月刊上的一篇文章「愛因斯坦的最大的錯誤一宇宙論常數」。

0

1
0

文字

分享

0
1
0
數智驅動未來:從信任到執行,AI 為企業創新賦能
鳥苷三磷酸 (PanSci Promo)_96
・2025/01/13 ・4938字 ・閱讀時間約 10 分鐘

本文由 鼎新數智 與 泛科學 共同規劃與製作

你有沒有想過,當 AI 根據病歷與 X 光片就能幫你診斷病症,或者決定是否批准貸款,甚至從無人機發射飛彈時,它的每一步「決策」是怎麼來的?如果我們不能知道 AI 的每一個想法步驟,對於那些 AI 輔助的診斷和判斷,要我們如何放心呢?

馬斯克與 OpenAI 的奧特曼鬧翻後,創立了新 AI 公司 xAI,並推出名為 Grok 的產品。他宣稱目標是以開源和可解釋性 AI 挑戰其他模型,而 xAI 另一個意思是 Explainable AI 也就是「可解釋性 AI」。

如今,AI 已滲透生活各處,而我們對待它的方式卻像求神問卜,缺乏科學精神。如何讓 AI 具備可解釋性,成為當前關鍵問題?

-----廣告,請繼續往下閱讀-----
AI 已滲透生活各處,而我們對待它的方式卻像求神問卜,缺乏科學精神。如何讓 AI 具備可解釋性,成為當前關鍵問題?圖/pexels

黑盒子模型背後的隱藏秘密

無法解釋的 AI 究竟會帶來多少問題?試想,現在許多銀行和貸款機構已經使用 AI 評估借貸申請者的信用風險,但這些模型往往如同黑箱操作。有人貸款被拒,卻完全不知原因,感覺就像被分手卻不告訴理由。更嚴重的是,AI 可能擅自根據你的住所位置或社會經濟背景給出負面評價,這些與信用風險真的相關嗎?這種不透明性只會讓弱勢群體更難融入金融體系,加劇貧富差距。這種不透明性,會讓原本就已經很難融入金融體系的弱勢群體,更加難以取得貸款,讓貧富差距越來越大,雪上加霜。

AI 不僅影響貸款,還可能影響司法公正性。美國部分法院自 2016 年起使用「替代性制裁犯罪矯正管理剖析軟體」 COMPAS 這款 AI 工具來協助量刑,試圖預測嫌犯再犯風險。然而,這些工具被發現對有色人種特別不友好,往往給出偏高的再犯風險評估,導致更重的刑罰和更嚴苛的保釋條件。更令人擔憂的是,這些決策缺乏透明度,AI 做出的決策根本沒法解釋,這讓嫌犯和律師無法查明問題根源,結果司法公正性就這麼被悄悄削弱了。

此外,AI 在醫療、社交媒體、自駕車等領域的應用,也充滿類似挑戰。例如,AI 協助診斷疾病,但若原因報告無法被解釋,醫生和患者又怎能放心?同樣地,社群媒體或是 YouTube 已經大量使用 AI 自動審查,以及智慧家居或工廠中的黑盒子問題,都像是一場越來越複雜的魔術秀——我們只看到結果,卻無法理解過程。這樣的情況下,對 AI 的信任感就成為了一個巨大的挑戰。

為什麼人類設計的 AI 工具,自己卻無法理解?

原因有二。首先,深度學習模型結構複雜,擁有數百萬參數,人類要追蹤每個輸入特徵如何影響最終決策結果,難度極高。例如,ChatGPT 中的 Transformer 模型,利用注意力機制(Attention Mechanism)根據不同詞之間的重要性進行特徵加權計算,因為機制本身涉及大量的矩陣運算和加權計算,這些數學操作使得整個模型更加抽象、不好理解。

-----廣告,請繼續往下閱讀-----

其次,深度學習模型會會從資料中學習某些「特徵」,你可以當作 AI 是用畫重點的方式在學習,人類劃重點目的是幫助我們加速理解。AI 的特徵雖然也能幫助 AI 學習,但這些特徵往往對人類來說過於抽象。例如在影像辨識中,人類習慣用眼睛、嘴巴的相對位置,或是手指數量等特徵來解讀一張圖。深度學習模型卻可能會學習到一些抽象的形狀或紋理特徵,而這些特徵難以用人類語言描述。

深度學習模型通常採用分佈式表示(Distributed Representation)來編碼特徵,意思是將一個特徵表示為一個高維向量,每個維度代表特徵的不同方面。假設你有一個特徵是「顏色」,在傳統的方式下,你可能用一個簡單的詞來表示這個特徵,例如「紅色」或「藍色」。但是在深度學習中,這個「顏色」特徵可能被表示為一個包含許多數字的高維向量,向量中的每個數字表示顏色的不同屬性,比如亮度、色調等多個數值。對 AI 而言,這是理解世界的方式,但對人類來說,卻如同墨跡測驗般難以解讀。

假設你有一個特徵是「顏色」,在傳統的方式下,你可能用一個簡單的詞來表示這個特徵,例如「紅色」或「藍色」。但是在深度學習中,這個「顏色」特徵可能被表示為一個包含許多數字的高維向量,向量中的每個數字表示顏色的不同屬性,比如亮度、色調等多個數值。圖/unsplash

試想,AI 協助診斷疾病時,若理由是基於醫生都無法理解的邏輯,患者即使獲得正確診斷,也會感到不安。畢竟,人們更相信能被理解的東西。

打開黑盒子:可解釋 AI 如何運作?我們要如何教育 AI?

首先,可以利用熱圖(heatmap)或注意力圖這類可視化技術,讓 AI 的「思維」有跡可循。這就像行銷中分析消費者的視線停留在哪裡,來推測他們的興趣一樣。在卷積神經網絡和 Diffusion Models 中 ,當 AI 判斷這張照片裡是「貓」還是「狗」時,我需要它向我們展示在哪些地方「盯得最緊」,像是耳朵的形狀還是毛色的分布。

-----廣告,請繼續往下閱讀-----

其次是局部解釋,LIME 和 SHAP 是兩個用來發展可解釋 AI 的局部解釋技術。

SHAP 的概念來自博弈,它將每個特徵看作「玩家」,而模型的預測結果則像「收益」。SHAP 會計算每個玩家對「收益」的貢獻,讓我們可以了解各個特徵如何影響最終結果。並且,SHAP 不僅能透過「局部解釋」了解單一個結果是怎麼來的,還能透過「全局解釋」理解模型整體的運作中,哪些特徵最重要。

以實際的情景來說,SHAP 可以讓 AI 診斷出你有某種疾病風險時,指出年齡、體重等各個特徵的影響。

LIME 的運作方式則有些不同,會針對單一個案建立一個簡單的模型,來近似原始複雜模型的行為,目的是為了快速了解「局部」範圍內的操作。比如當 AI 拒絕你的貸款申請時,LIME 可以解釋是「收入不穩定」還是「信用紀錄有問題」導致拒絕。這種解釋在 Transformer 和 NLP 應用中廣泛使用,一大優勢是靈活且計算速度快,適合臨時分析不同情境下的 AI 判斷。比方說在醫療場景,LIME 可以幫助醫生理解 AI 為何推薦某種治療方案,並說明幾個主要原因,這樣醫生不僅能更快做出決策,也能增加患者的信任感。

-----廣告,請繼續往下閱讀-----

第三是反事實解釋:如果改變一點點,會怎麼樣?

如果 AI 告訴你:「這家銀行不會貸款給你」,這時你可能會想知道:是收入不夠,還是年齡因素?這時你就可以問 AI:「如果我年輕五歲,或者多一份工作,結果會怎樣?」反事實解釋會模擬這些變化對結果的影響,讓我們可以了解模型究竟是如何「權衡利弊」。

最後則是模型內部特徵的重要性排序。這種方法能顯示哪些輸入特徵對最終結果影響最大,就像揭示一道菜中,哪些調味料是味道的關鍵。例如在金融風險預測中,模型可能指出「收入」影響了 40%,「消費習慣」占了 30%,「年齡」占了 20%。不過如果要應用在像是 Transformer 模型等複雜結構時,還需要搭配前面提到的 SHAP 或 LIME 以及可視化技術,才能達到更完整的解釋效果。

講到這裡,你可能會問:我們距離能完全信任 AI 還有多遠?又或者,我們真的應該完全相信它嗎?

-----廣告,請繼續往下閱讀-----

我們終究是想解決人與 AI 的信任問題

當未來你和 AI 同事深度共事,你自然希望它的決策與行動能讓你認可,幫你省心省力。因此,AI 既要「可解釋」,也要「能代理」。

當未來你和 AI 同事深度共事,你自然希望它的決策與行動能讓你認可,幫你省心省力。圖/unsplash

舉例來說,當一家公司要做一個看似「簡單」的決策時,背後的過程其實可能極為複雜。例如,快時尚品牌決定是否推出新一季服裝,不僅需要考慮過去的銷售數據,還得追蹤熱門設計趨勢、天氣預測,甚至觀察社群媒體上的流行話題。像是暖冬來臨,厚外套可能賣不動;或消費者是否因某位明星愛上一種顏色,這些細節都可能影響決策。

這些數據來自不同部門和來源,龐大的資料量與錯綜關聯使企業判斷變得困難。於是,企業常希望有個像經營大師的 AI 代理人,能吸收數據、快速分析,並在做決定時不僅給出答案,還能告訴你「為什麼要這麼做」。

傳統 AI 像個黑盒子,而可解釋 AI (XAI)則清楚解釋其判斷依據。例如,為什麼不建議推出厚外套?可能理由是:「根據天氣預測,今年暖冬概率 80%,過去三年數據顯示暖冬時厚外套銷量下降 20%。」這種透明解釋讓企業更信任 AI 的決策。

-----廣告,請繼續往下閱讀-----

但會解釋還不夠,AI 還需能真正執行。這時,就需要另一位「 AI 代理人」上場。想像這位 AI 代理人是一位「智慧產品經理」,大腦裝滿公司規則、條件與行動邏輯。當客戶要求變更產品設計時,這位產品經理不會手忙腳亂,而是按以下步驟行動:

  1. 檢查倉庫物料:庫存夠不夠?有沒有替代料可用?
  2. 評估交期影響:如果需要新物料,供應商多快能送到?
  3. 計算成本變化:用新料會不會超出成本預算?
  4. 做出最優判斷,並自動生成變更單、工單和採購單,通知各部門配合執行。

這位 AI 代理人不僅能自動處理每個環節,還會記錄每次決策結果,學習如何變得更高效。隨時間推移,這位「智慧產品經理」的判斷將更聰明、決策速度更快,幾乎不需人工干預。更重要的是,這些判斷是基於「以終為始」的原則,為企業成長目標(如 Q4 業績增長 10%)進行連續且動態地自我回饋,而非傳統系統僅月度檢核。

這兩位 AI 代理人的合作,讓企業決策流程不僅透明,還能自動執行。這正是數智驅動的核心,不僅依靠數據驅動決策,還要能解釋每一個選擇,並自動行動。這個過程可簡化為 SUPA,即「感知(Sensing)→ 理解(Understanding)→ 規劃(Planning)→ 行動(Acting)」的閉環流程,隨著數據的變化不斷進化。

偉勝乾燥工業為例,他們面臨高度客製化與訂單頻繁變更的挑戰。導入鼎新 METIS 平台後,偉勝成功將數智驅動融入業務與產品開發,專案準時率因此提升至 80%。他們更將烤箱技術與搬運機器人結合,開發出新形態智慧化設備,成功打入半導體產業,帶動業績大幅成長,創造下一個企業的增長曲線。

-----廣告,請繼續往下閱讀-----

值得一提的是,數智驅動不僅帶動業務增長,還讓員工擺脫繁瑣工作,讓工作更輕鬆高效。

數智驅動的成功不僅依賴技術,還要與企業的商業策略緊密結合。為了讓數智驅動真正發揮作用,企業首先要確保它服務於具體的業務需求,而不是為了技術而技術。

這種轉型需要有策略、文化和具體應用場景的支撐,才能讓數智驅動真正成為企業持續增長的動力。

還在猶豫數智驅動的威力?免費上手企業 AI 助理!👉 企業 AI 體驗
現在使用專屬邀請碼《 KP05 》註冊就享知:https://lihi.cc/EDUk4
訂閱泛科學獨家知識頻道,深入科技趨勢與議題內容。

👉立即免費加入

-----廣告,請繼續往下閱讀-----

0

2
1

文字

分享

0
2
1
AI 能像人類一樣思考?諾貝爾物理學獎研究助力人工智慧模擬人類大腦
PanSci_96
・2024/11/14 ・2117字 ・閱讀時間約 4 分鐘

即使再怎麼模仿,AI 終究無法以與生物相同的方式思考吧?畢竟電腦的電子元件和我們大腦中的神經細胞結構截然不同。再怎麼模仿,AI 終究無法以與生物相同的方式思考吧?

錯,可以。

2024 年諾貝爾物理學獎跌破所有專家的眼鏡,頒給了兩位研究機器學習的科學家——約翰·霍普菲爾德(John Hopfield)和傑佛瑞·辛頓(Geoffrey Hinton)。他們以「人工」的方法打造了類神經網路,最終模擬出生物的「智慧」,奠定了當代深度學習的基礎。

為什麼解決人工智慧發展瓶頸的,竟然會是物理學?物理要怎麼讓 AI 更像人類?

-----廣告,請繼續往下閱讀-----
歡迎訂閱 Pansci Youtube 頻道 獲取更多深入淺出的科學知識!

從巴甫洛夫的狗到赫布理論:理解學習的基礎

為了解答這個疑問,我們需要一些背景知識。

20 世紀初,俄羅斯心理學家巴甫洛夫發現,狗在食物還沒入口前,就會開始分泌唾液。他進行了一系列實驗,改變食物出現前的環境,比如讓狗習慣在聽到鈴聲後馬上得到食物。久而久之,狗只要聽到鈴聲,就會開始分泌唾液。

大約 50 年後,神經科學家赫布(Donald Hebb)提出了一個假說:大腦中相近的神經元,因為經常同時放電,會產生更強的連結。這種解釋稱為「赫布理論」,不僅奠定了神經心理學的發展,更成為現代深度學習的基礎。

然而,赫布理論雖然描述了鄰近神經元的關係,卻無法解釋大腦如何建構出如此複雜的聯想網路。

-----廣告,請繼續往下閱讀-----

霍普菲爾德網路:物理學家對神經網路的貢獻

然而,赫布理論雖能描述神經元之間的關係,卻缺乏數學模型。物理學家約翰·霍普菲爾德從數學家約翰·康威(John Conway)的「生命遊戲」(Game of Life)中獲得靈感,試圖建立一個可以在電腦上運行的記憶系統。

霍普菲爾德受「生命遊戲」啟發,嘗試建立電腦記憶系統。圖/envato

「生命遊戲」由數學家康威(John Conway)發明,玩家開始時有一個棋盤,每個格子代表一個細胞,細胞可以是「活」或「死」的狀態。根據特定規則,細胞會根據鄰居的狀態決定下一次的生存狀態。康威的目的是展示複雜的系統不一定需要複雜的規則。

霍普菲爾德發現,這個遊戲與赫布理論有強大的關聯性。大腦中的大量神經元,在出生時處於初始狀態,經過刺激後,神經元間的連結會產生或斷裂,形成強大的記憶系統。他希望利用這些理論,創造一個能在電腦上運行的記憶系統。

然而,他面臨一個難題:赫布理論沒有明確的數學模型來決定神經元連結的規則。而在電腦上運行,必須要有明確的數學規則。

-----廣告,請繼續往下閱讀-----

物理學的啟發:易辛模型

霍普菲爾德從物理學的研究中找到了類似的模型:易辛模型(Ising Model)。這個模型用於解釋鐵磁性物質的磁性特性。

在鐵磁性物質中,電子具有「自旋」,自旋產生磁矩。電子的自旋方向只有「向上」或「向下」,這就像生命遊戲中細胞的「生」或「死」。鄰近的電子會影響彼此的自旋方向,類似於細胞之間的互動。

易辛模型能用數學描述電子間的相互影響,並通過計算系統能量,得出自旋狀態的分佈。霍普菲爾德借用了這個概念,將神經元的互動視為電子自旋的互動。

他結合了康威生命遊戲的時間演化概念、易辛模型的能量計算,以及赫布理論的動態連結,創造了「霍普菲爾德網路」。這讓電腦能夠模擬生物大腦的學習過程。

-----廣告,請繼續往下閱讀-----

突破瓶頸:辛頓與波茲曼機

約翰·霍普菲爾德於1982年發明聯想神經網路,即「霍普菲爾網路」。圖/wikimedia

然而,霍普菲爾德網路並非完美。它容易陷入「局部最小值」的問題,無法找到系統的全局最優解。為了解決這個問題,加拿大計算機科學家傑佛瑞·辛頓(Geoffrey Hinton)提出了「波茲曼機」(Boltzmann Machine)。

辛頓將「模擬退火」的概念引入神經網路,允許系統以一定的機率跳出局部最小值,尋找全局最優解。他還引入了「隱藏層」的概念,將神經元分為「可見層」和「隱藏層」,提高了網路的學習能力。

受限波茲曼機(Restricted Boltzmann Machine)進一步簡化了模型,成為深度學習的基礎結構之一。這些創新使得 AI 能夠更有效地模擬人類的思維和學習過程。

AI 的未來:跨學科的融合

霍普菲爾德和辛頓的工作,將物理學的概念成功應用於人工智慧。他們的研究不僅解決了 AI 發展的瓶頸,還奠定了深度學習的基礎,對現代 AI 技術產生了深遠的影響。因此,2024 年諾貝爾物理學獎頒給他們,並非意外,而是對他們在跨學科領域的重大貢獻的肯定。

-----廣告,請繼續往下閱讀-----

AI 的發展,離不開物理學、生物學、數學等多學科的融合。霍普菲爾德和辛頓的工作,正是這種融合的典範。未來,隨著科學技術的進步,我們有理由相信,AI 將越來越接近人類的思維方式,甚至可能超越我們的想像。

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

PanSci_96
1274 篇文章 ・ 2673 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。