0

文字

繁 | 简

0

專欄

提昇大數據可信度，統計學用機率和抽樣優化分析模型－專訪典通公司總經理楊雅惠

陳妤寧・2016/05/24 ・2883字・閱讀時間約 6 分鐘・SR值 557

・八年級

相關標籤：

熱門標籤：

採訪編輯 / 陳妤寧

大數據如果要化為能在市場上提供服務的產品，除了在要科技上持續突破，也需要能解決真實世界中的消費者、企業或政府決策者、等等不同使用者的難題。

典通股份有限公司多年來以民意和市場調查為主要經營項目，隨著大數據的興起，典通也轉投資新公司「Dataa」－浚鴻數據開發股份有限公司，以典通厚植的市場研究經驗為基礎，提供大數據解決方案。他們建議客戶，大數據和傳統民調不可偏廢，兩者應該扮演相輔相成的效果，這是為什麼？

輿情分析和民意調查，兩者相輔相成

成功的大數據服務商業模式，就如同過去股民手上拿的股票機一樣，廠商把上千支的股票資料進行分析，最後推薦用戶哪幾支股票的表現值得推薦。而在這個媒體發達、資訊爆炸的時代，公眾人物、公關從業者或是需要了解民意方向的地方首長，都需要了解大眾現在最關心的新聞是什麼？態度是正面是負面？哪些媒體對自己比較友善？這些運籌帷幄的智囊，如今都存乎於像典通這樣的公司提供的輿情分析服務中，一切的關鍵在於解決使用者的需求和問題。

-----廣告，請繼續往下閱讀-----

但典通的總經理楊雅惠單刀直入地說，如果單純爬梳網路上所有論壇和社群媒體上的意見就直接做出情勢判斷，是存在風險的。「不是所有的人都會在網路上發言，而我們正在分析的這些網路發文，會不會北部人遠多於南部人？會不會高學歷者多於教育程度偏低者？會不會除了少數意見領袖之外，還有太多的網友只有『潛水』瀏覽、而沒有發表意見？」為了確保輿情分析的結果能夠具有代表性（換言之，等於參考價值），楊雅惠主張過去的抽樣調查也必須同步進行，作為判讀輿情分析結果的輔助。

以典通自身為例，一方面透過內建的會員平台進行民調施測，由於平台不對外開放，得以控制會員年齡、性別、地理區域等特性分布的均質性，避免開放式民調平台無法控制同一人重複填答的問題。另一方面，典通也以傳統的電話訪問調查年齡層偏高的族群，以有別於出生長大都在網路發達環境的「網路原生代」。雖然樣本相對少，然而嚴謹確保代表性的做法，卻能夠和利用大數據進行輿情分析的結果互相參照、相輔相成，「如果兩者的顯示結果落差很大，那麼就值得深入研究其中蹊蹺。」

資訊工程和統計分析結合，同時洞悉趨勢和掌握因果

本身是統計學專業背景的楊雅惠從學門的角度分析，認為大數據以資訊工程和演算法為領頭，目標為「快」和「廣」，如何解釋因果關係反而不是重點。「例如我們的客戶中有產險公司，希望能夠建立一套如何判定『拒絕誰來投保』的機制，所以重點是從過去累積的海量資料中分析出規律，最後的結果很可能是費人思索的，例如身高體重等等無法立刻得到解釋的各種變數。但在此情況中，得知因果並不如準確洞悉大趨勢來的重要。」

但在其他情境很可能就恰好相反了，以醫療領域來說，確認因果關係就非常重要，也需要更多特定領域的專家加入分析判讀。而統計學以機率為基礎，雖然運算方式較為複雜，使得運算速度不如以「0 和 1」為邏輯的演算法來的快速，但更能深入研究因果關係。「時至今日，其實我們利用 R 語言建立迴歸分析，矩陣演算的速度也已大幅提昇。」楊雅惠細細解釋，當我們談到模型時，一是指產生統計指標的函數模型，二則是指整合不同統計指標、產出一個立體象限的決策模型，後者更靠近客戶直接做出決定的端點。

-----廣告，請繼續往下閱讀-----

雖然如此劃分兩種學門擔當的角色，楊雅惠認為兩者之間並非對立的關係。「大數據可以解決資料端的問題，統計分析則能在尋求因果解釋時突破片面，兩者互補合作，是對於客戶較為完整的解決方案。」在商業應用的世界中，一切終究需要回歸到客戶的需求：當科技和新技術持續推陳出新，哪些能夠為客戶的問題帶來解決方案？

提昇數據代表性，統計也能優化輿情分析模型

話說回輿情分析，難道「大」數據就沒有精緻化的可能嗎？其實透過深入研究大眾在網路上發表意見的行為模式，可以在分析過程中持續調整權重、減少代表性偏差、優化分析模型。舉例來說，如果同一個發言者連續且大量發言，這種情況就需要調降其權重，避免分析時擴大了單獨一個人的重要性；同樣的，發文者是一般大眾？意見領袖？還是試圖影響輿論的媒體？這些角色如果能分離，也能得出更細緻準確的分析結果。

在正評負評的情緒分析中，可以透過分析一般人使用語言的習慣，找出除了統計正負面的詞語數量之外的分析方法。例如同樣一篇文章標題，後面接的是問號還是驚嘆號，想要傳達的立場可能就完全不同。而許多媒體報導可能為了力求中立，在文章前半段平鋪直敘，直到最後一段才直抒其意，因此文章中的最後一段權重調高，也有助於更良好的判斷網路輿論的正負評聲量。

個人隱私及未統一的數據標準，醫療資料價值服務尚有挑戰

醫療領域的大數據，和其他領域相比有什麼特性？專長在醫療資料分析的楊雅惠表示，最大的癥結點仍在於個資和隱私問題，使得醫療資料的商業模式雖然明確，但利用上仍有諸多挑戰。「例如遠距醫療在技術上已經變成可能，許多穿戴式智慧裝置也都能蒐集個人化的生理資訊，但醫事法規定，醫師必須見到病患本人才能做出診斷。」

-----廣告，請繼續往下閱讀-----

楊雅惠表示，其實法令在今年已經有初步開放，在特定用戶同意的情況下，醫療服務的系統商可以介接健保資料庫的API，存取該特定用戶的健保資料，結合穿戴式智慧裝置記錄的個人生理資訊，協助判斷用戶的身體狀況並提供疾病警訊。

而「非個人化」的醫療資料分析其實已經存在，處於開放初期的健保資料庫，將去個人化的批量資料開放予研究單位，分析國人的健康趨勢。「資料庫會規範最細的分析單位，避免交叉分析造成個人醫療隱私的暴露風險。但可以研究各種預測疾病的模型，一旦個人化的資料到位，模型就能實現為多元的服務應用。」

目前除了醫療資料的隱私問題，另一個挑戰在於各家廠商所推出的個人化穿戴裝置規格不一，醫界對於如何採用這些裝置所記錄的生理數據尚無一致的標準。「例如現行的血壓計，醫界對於在什麼環境、什麼規格所測量出來的數據是否可信是具有共識的；然而現在各種新興的運動手環，可能還不足以成為醫生敢採信的正式醫療數據。」

從市場端的角度分析，楊雅惠認為掌握客戶需求，才能在資料之中問出好問題，進而做出具有代表性的數據分析。反而大數據的定義並不一定是筆數多，以基因資料庫為例，雖然人次不多，但每個人的基因蘊含的變數都很大，整體分析的複雜度也就會隨之提高。最重要的是，隨著機器設備和演算能力的進步、相關平台和工具出現開放的來源，研究大數據的門檻降低，有越來越多的小型團隊得以投入，即使不用昂貴的設備，也能共同開發大數據的未來。

-----廣告，請繼續往下閱讀-----

（本文由科技部補助「新媒體科普傳播實作計畫－智慧生活與前沿科技科普知識教育推廣」執行團隊撰稿）

責任編輯：鄭國威

大數據專題報導系列：

-----廣告，請繼續往下閱讀-----

發表意見

文章難易度

剛好

太難

所有討論 0

登入與大家一起討論

陳妤寧

38 篇文章・ 1 位粉絲

熱愛將知識拆解為簡單易懂的文字，喜歡把一件事的正反觀點都挖出來思考，希望用社會科學的視角創造更宏觀的視野。

TRENDING 熱門討論

即時熱門

0

文字

0

為什麼越累越難睡?當大腦想下班，「腸道」卻還在加班！

鳥苷三磷酸 (PanSci Promo) ・2026/04/30 ・2519字・閱讀時間約 5 分鐘

相關標籤：

熱門標籤：

本文與益福生醫合作，泛科學企劃執行

昨晚，你又在床上翻來覆去、無法入眠了嗎？這或許是現代社會最普遍的深夜共鳴。儘管換了昂貴的乳膠枕、拉上百分之百遮光的窗簾，甚至在腦海中數了幾百隻羊，大腦的那個「睡眠開關」卻彷彿生鏽般卡住。這種渴望休息卻睡不著的過程，讓失眠成了一場耗損身心的極限馬拉松。

皮質醇：你體內那位「永不熄滅」的深夜警報器

要理解失眠，我們得先認識身體的一套精密防衛系統：下視丘-垂體-腎上腺軸（HPA axis） 。這套系統原本是演化給我們的禮物，讓我們在面對劍齒虎或突如其來的危險時，能迅速進入「戰鬥或快逃」的備戰狀態。當這套系統啟動，腎上腺就會分泌皮質醇 (壓力荷爾蒙)，這種荷爾蒙能調動能量、提高警覺性，讓我們在危機中保持清醒。

然而，現代人的「劍齒虎」不再是野獸，而是無止盡的專案進度、電子郵件與職場競爭。對於長期處於高壓或高強度工作環境的人們來說，身體的警報系統可能處於一種「切換不掉」的狀態。

-----廣告，請繼續往下閱讀-----

在理想的狀態下，人類的生理時鐘像是一場精確的接力賽。入夜後，身體會進入「修復模式」，此時壓力荷爾蒙「皮質醇」的濃度應該降至最低點，讓「睡眠荷爾蒙」褪黑激素（Melatonin）接棒主導。褪黑激素不僅負責傳遞「天黑了」的訊號，它還能抑制腦中負責維持清醒的食慾素（Orexin）神經元，幫助大腦順利關閉覺醒開關。

對於長期處於高壓或高強度工作環境的人們來說，身體的警報系統可能處於一種「切換不掉」的狀態 / 圖片來源：envato

然而，當壓力介入時，這場接力賽就會變成跑不完的馬拉松賽。研究指出，長期的高壓環境會導致 HPA 軸過度活化，使得夜間皮質醇異常分泌。這不僅會抑制褪黑激素的分泌，更會讓食慾素在深夜裡持續活化，強迫大腦維持在「高覺醒狀態（Hyperarousal）」。這種令人崩潰的狀態就是，明明你已經累到不行，但大腦卻像停不下來的發電機！

長期的睡眠不足會導致體內促發炎細胞激素上升，而發炎反應又會進一步活化 HPA 軸，分泌更多皮質醇來試圖消炎，高濃度的皮質醇會進一步干擾深層睡眠與快速動眼期（REM），導致睡眠品質變得低弱又破碎，最終形成「壓力－發炎－失眠」的惡行循環。也就是說，你不是在跟睡眠上的意志力作對，而是在跟失控的生理長期鬥爭。

從腸道重啟好眠開關：PS150 菌株如何調校你的生理時鐘

面對這種煞車失靈的失眠困局，科學家們將目光投向了人體內另一個繁榮的生態系：腸道。腸道與大腦之間存在著一條雙向通訊的高速公路，這就是「菌-腸-腦軸 (Microbiome-Gut-Brain Axis, MGBA)」，而某些特殊菌株不僅能幫助消化、排便，更能透過神經與內分泌途徑與大腦對話，直接參與調節我們的壓力調節與睡眠節律。這種菌株被科學家稱為「精神益生菌」（Psychobiotics）。

-----廣告，請繼續往下閱讀-----

腸道與大腦之間存在著一條雙向通訊的高速公路，這就是「菌-腸-腦軸 (Microbiome-Gut-Brain Axis, MGBA)」/圖片來源：益福生醫

在眾多研究菌株中，發酵乳桿菌 Limosilactobacillus fermentum PS150 的表現格外引人注目。PS150菌株源於亞洲益生菌權威「蔡英傑教授」團隊的專業研發，累積多年功能性菌株研發經驗的科學成果。針對臨床常見的「初夜效應」（First Night Effect, FNE），也就是現代人因出差、換床或環境改變導致的入睡困難，俗稱認床。科學家在進行實驗時發現，補充 PS150 菌株能顯著恢復非快速動眼期（NREM）的睡眠長度，且入睡更快，起床後也更容易清醒。更重要的是，不同於常見的藥物助眠手段（如抗組織胺藥物 DIPH）容易造成快速動眼期（REM）剝奪或導致睡眠破碎化，PS150 菌株展現出一種更為「溫和且自然」的調節力，它能有效縮短入睡所需的時間，並恢復睡眠中代表深層修復的「Delta 波」能量。

科學家發現，即便將 PS150 菌株經過特殊的熱處理（Heat-treated），轉化為不具活性但保有關鍵成分的「後生元」（Postbiotics），其生物活性依然能與活菌媲美。HT-PS150 技術解決了益生菌在儲存與攝取過程中容易失去活性的痛點，讓這些腸道通訊員能更穩定地發揮作用。

在臨床實驗中，科學家觀察到一個耐人尋味的現象：當詢問受試者的主觀感受時，往往會遇到強大的「安慰劑效應」，無論是服用 HT-PS150 還是安慰劑的人，主觀上大多表示睡眠變好了。這種「體感上的進步」有時會掩蓋真相，讓人分不清是心理作用還是真實效益。

然而，客觀的生理數據（Biomarkers）卻揭開了關鍵的差異。在排除主觀偏誤後，實驗數據顯示 HT-PS150 組有更高比例的人（84.6%）出現了夜間褪黑激素分泌增加，且壓力荷爾蒙（皮質醇）顯著下降，這證明了菌株確實啟動了體內的睡眠調控系統，而不僅僅是心理安慰。

-----廣告，請繼續往下閱讀-----

最值得關注的是，對於那些失眠指數較高（ISI ≧ 8）的族群，這種「生理修復」與「主觀體感」終於達成了一致。這群人在補充 HT-PS150 後，不僅生理標記改善，連原本嚴重困擾的主觀睡眠效率、持續時間，以及焦慮感也出現了顯著的進步。

了解更多PS150助眠益生菌：https://lihi3.me/KQ4zi

重新定義深層睡眠：構建全方位的深夜修復計畫

睡眠從來就不只是單純的休息，而是一場生理功能的全面重整。想要重獲高品質的睡眠，關鍵在於為自己建立一個全方位的修復生態系。

這套系統的基石，始於良好的生活習慣。從減少睡前數位螢幕的干擾、優化室內環境，到作息調整。當我們透過規律作息來穩定神經系統，並輔以現代科學對於 PS150 菌株的調節力發現，身體便能更順暢地啟動睡眠開關，回歸自然的運作節律。

-----廣告，請繼續往下閱讀-----

與其將失眠視為意志力的抗爭，不如將其看作是生理機能與腸道微生態的深度溝通。透過生活作息的調整與科學實證的支持，每個人都能擁有掌控睡眠的主動權。現在就從優化生活型態開始，為自己按下那個久違的、如嬰兒般香甜的關機鍵吧。

與其將失眠視為意志力的抗爭，不如將其看作是生理機能與腸道微生態的深度溝通 / 圖片來源 : envato

-----廣告，請繼續往下閱讀-----

發表意見

文章難易度

剛好

太難

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)

247 篇文章・ 319 位粉絲

充滿能量的泛科學品牌合作帳號！相關行銷合作請洽：contact@pansci.asia

TRENDING 熱門討論

即時熱門

104

0

文字

0

104

0

肺部為何會「結疤」？揭開比癌症更致命的「菜瓜布肺」，科學家如何找到破解惡性循環的新契機

鳥苷三磷酸 (PanSci Promo) ・2026/05/08 ・2041字・閱讀時間約 4 分鐘

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

本文由肺纖維化(菜瓜布肺)社團衛教合作，泛科學撰文

在現代醫學的警示清單裡，乳癌、大腸癌這些疾病大家都不陌生；但有一個「隱蔽且致命」的威脅卻常被忽視，那就是「肺纖維化」。其中最常見的類型「特發性肺纖維化」（IPF），其預後往往不太樂觀，確診後的五年存活率甚至比許多常見的癌症還低。

首先，我們得先破解一個迷思：肺纖維化並不是單一疾病，而是許多種間質性肺病的共同表現。當我們聽到「肺纖維化」，腦中常浮現「菜瓜布肺」的形象，患者的肺部外觀充滿一個個空洞與疤痕，像極了乾燥的絲瓜。這精準描繪了肺部組織逐漸硬化、失去彈性的過程。

更重要的是，IPF 這類肺纖維化的威脅在於「不可逆」的特性，一旦形成就很難逆轉。這跟部分 COVID-19 康復者身上、仍有機會復原的肺纖維化，是兩種完全不同的概念。

-----廣告，請繼續往下閱讀-----

IPF 這類肺纖維化的威脅在於「不可逆」的特性，一旦形成就很難逆轉 / 圖示來源：shutterstock

肺部為何會變成「菜瓜布」？

為什麼好端端的肺會變成菜瓜布？這其實是一場身體修復機制失控的結果。

「纖維化」的組織，就是肺部間質組織（interstitium）的疤痕化。間質是圍繞在肺泡周圍，包含血管與支持肺部結構的結締組織。在正常情況下，肺部損傷後會啟動修復機制，並再生健康組織。但在肺纖維化的患者體內，這套修復機制卻「當機」了。

身體會不斷地發出訊號，導致負責修復工作的「纖維母細胞」（fibroblasts）被過度活化，進而失控地沉積膠原蛋白疤痕組織，最終在肺部形成永久性的纖維化。

科學家發現，這個過程之所以棘手，在於它是一個「惡性循環」，肺部同時存在著「發炎反應」與「纖維化」這兩條路徑，它們相互加乘，演變成難以阻斷的強大破壞力。

-----廣告，請繼續往下閱讀-----

雖然特發性肺纖維化 (IPF) 的具體成因不明，但已知某些特定族群的風險更高。例如抽菸，特定年齡與性別(50歲以上男性)、長期暴露於粉塵環境的工作者(農業、畜牧業、採礦業…)、胃食道逆流者。此外，患有自體免疫疾病（如類風濕性關節炎、乾燥症、硬皮症、皮肌炎/多發性肌炎，）的患者，他們併發肺纖維化的機率遠高於一般人，必須特別警覺。

雖然特發性肺纖維化 (IPF) 的具體成因不明，但已知某些特定族群的風險更高。/ 圖示來源：shutterstock

打斷惡性循環的挑戰，為何只對抗「纖維化」還不夠？

面對這個不可逆的疾病，醫學界長年束手無策，直到 2014 年才迎來一道曙光。美國 FDA 批准了兩種機制不同的新藥：Nintedanib 和 Pirfenidone。這兩種藥物的出現是治療史上的分水嶺，首度被證實能夠「延緩」IPF 患者肺功能的惡化速度。

然而，這場戰役尚未結束。現有的治療雖然帶來了希望，卻也凸顯了「未被滿足的醫療需求」。從機制上來看，這些藥物主要抑制的是「纖維化路徑」。

這讓科學界開始思考這個未被滿足的棘手問題：既然疾病的本質是「發炎」與「纖維化」的雙重打擊，那麼，我們是否能找到「同時抑制」這兩條路徑的全新策略，從而更有效地打斷這個惡性循環？

-----廣告，請繼續往下閱讀-----

找到同時調控「發炎」與「纖維化」的新靶點

為了解決難題，科學家將目光鎖定在一個細胞內的酵素：磷酸二酯酶 4B（PDE4B）。

為什麼鎖定它？讓我們看看它的「雙重作用」機制：

關鍵位置： PDE4B 同時存在於免疫細胞（與發炎有關）與纖維母細胞（與纖維化有關）當中。
作用機制： PDE4B 的主要工作是降解細胞內一種叫 cAMP（環磷酸腺苷） 的訊號分子。cAMP 可以被視為細胞內的「穩定信號」。
雙重抑制： 當我們使用藥物抑制了 PDE4B 的活性，細胞內的 cAMP 就不會被分解，濃度會隨之升高。高濃度的 cAMP 能穩定免疫細胞和纖維母細胞，同時產生抗發炎與抗纖維化的雙重效應。

簡單來說，鎖定並抑制 PDE4B，就像是同時抑制了免疫風暴與纖維化的工程，有望從雙從抑制打擊這個惡性循環。

全球臨床試驗帶來的新希望

近十年來，全球在肺纖維化領域投入了大量的臨床試驗，我們相信，在科學家逐步破解肺纖維化惡性循環的複雜難題後，期盼未來能為無數患者爭取到更安全、健康的生活與未來。

-----廣告，請繼續往下閱讀-----

最後，我們必須再次提醒，特發性肺纖維化（IPF）與漸進性肺纖維化（PPF）是極具破壞性、且不可逆的疾病。面對這個比癌症更致命的對手，雖然現有的治療手段能延緩惡化，但無法逆轉已經形成的肺部疤痕組織，因此「早期診斷、早期治療」仍是對抗肺纖維化最重要的黃金時刻。

必須再次提醒，特發性肺纖維化（IPF）與漸進性肺纖維化（PPF）是極具破壞性、且不可逆的疾病。/ 圖示來源：

-----廣告，請繼續往下閱讀-----

發表意見

文章難易度

剛好

太難

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)

247 篇文章・ 319 位粉絲

充滿能量的泛科學品牌合作帳號！相關行銷合作請洽：contact@pansci.asia

TRENDING 熱門討論

即時熱門

1

3

0

文字

1

3

0

數據塑造生活與社會，讓人既放心但又不安？——《 AI 世代與我們的未來》

聯經出版・2022/12/28 ・2760字・閱讀時間約 5 分鐘

相關標籤：

熱門標籤：

數位世界已經改變了我們日常生活的體驗，一個人從早到晚都會接受到大量數據，受益於大量數據，也貢獻大量數據。這些數據龐大的程度，和消化資訊的方式已經太過繁多，人類心智根本無法處理。

與數位科技建立夥伴關係

所以人會本能地或潛意識地倚賴軟體來處理、組織、篩選出必要或有用的資訊，也就是根據用戶過去的偏好或目前的流行，來挑選要瀏覽的新項目、要看的電影、要播放的音樂。自動策劃的體驗很輕鬆容易，又能讓人滿足，人們只會在沒有自動化服務，例如閱讀別人臉書塗鴉牆上的貼文，或是用別人的網飛帳號看電影時，才會注意到這服務的存在。

有人工智慧協助的網路平臺加速整合，並加深了個人與數位科技間的連結。人工智慧經過設計和訓練，能直覺地解決人類的問題、掌握人類的目標，原本只有人類心智才能管理的各種選擇，現在能由網路平臺來引導、詮釋和記錄（儘管效率比較差）。

網路平臺收集資訊和體驗來完成這些任務，任何一個人的大腦在壽命期限內都不可能容納如此大量的資訊和體驗，所以網路平臺能產出看起來非常恰當的答案和建議。例如，採購員不管再怎麼投入工作，在挑選冬季長靴的時候，也不可能從全國成千上萬的類似商品、近期天氣預測、季節因素、回顧過去的搜尋記錄、調查物流模式之後，才決定最佳的採購項目，但人工智慧可以完整評估上述所有因素。

-----廣告，請繼續往下閱讀-----

因此，由人工智慧驅動的網路平臺經常和我們每個人互動，但我們在歷史上從未和其他產品、服務或機器這樣互動過。當我們個人在和人工智慧互動的時候，人工智慧會適應個人用戶的偏好（網際網路瀏覽記錄、搜尋記錄、旅遊史、收入水準、社交連結），開始形成一種隱形的夥伴關係。

個人用戶逐漸依賴這樣的平臺來完成一串功能，但這些功能過去可能由郵政、百貨公司，或是接待禮賓、懺悔自白的人和朋友，或是企業、政府或其他人類一起來完成。

個人、網路平臺和平臺用戶之間的關係，是一種親密關係與遠距聯繫的新穎組合。人工智慧網路平臺審查大量的用戶數據，其中大部分是個人數據（如位置、聯絡資訊、朋友圈、同事圈、金融與健康資訊）；網路會把人工智慧當成嚮導，或讓人工智慧來安排個人化體驗。

人工智慧如此精準、正確，是因為人工智慧有能力可以根據數億段類似的關係，以及上兆次空間（用戶群的地理範圍）與時間（集合了過去的使用）的互動來回顧和反應。網路平臺用戶與人工智慧形成了緊密的互動，並互相學習。

-----廣告，請繼續往下閱讀-----

網路平臺的人工智慧使用邏輯，在很多方面對人類來說都難以理解。例如，運用人工智慧的網路平臺在評估圖片、貼文或搜尋時，人類可能無法明確地理解人工智慧會在特定情境下如何運作。谷歌的工程師知道他們的搜尋功能若有人工智慧，就會有清楚的搜尋結果；若沒有人工智慧，搜尋結果就不會那麼清楚，但工程師沒辦法解釋為什麼某些結果的排序比較高。

要評鑑人工智慧的優劣，看的是結果實用不實用，不是看過程。這代表我們的輕重緩急已經和早期不一樣了，以前每個機械的步驟或思考的過程都會由人類來體驗（想法、對話、管理流程），或讓人類可以暫停、檢查、重複。

人工智慧陪伴現代人的生活

例如，在許多工業化地區，旅行的過程已經不需要「找方向」了。以前這過程需要人力，要先打電話給我們要拜訪的對象，查看紙本地圖，然後常常在加油站或便利商店停下來，確認我們的方向對不對。現在，透過手機應用程式，旅行的過程可以更有效率。

這些應用程式不但可以根據他們「所知」的交通記錄來評估可能的路線與每條路線所花費的時間，還可以考量到當天的交通事故、可能造成延誤的特殊狀況（駕駛過程中的延誤）和其他跡象（其他用戶的搜尋），來避免和別人走同一條路。

-----廣告，請繼續往下閱讀-----

從看地圖到線上導航，這轉變如此方便，很少人會停下來想想這種變化有多大的革命性意義，又會帶來什麼後果。個人用戶、社會與網路平臺和營運商建立了新關係，並信任網路平臺與演算法可以產生準確的結果，獲得了便利，成為數據集的一部分，而這數據集又在持續進化（至少會在大家使用應用程式的時候追蹤個人的位置）。

在某種意義上，使用這種服務的人並不是獨自駕駛，而是系統的一部分。在系統內，人類和機器智慧一起協作，引導一群人透過各自的路線聚集在一起。

持續陪伴型的人工智慧會愈來愈普及，醫療保健、物流、零售、金融、通訊、媒體、運輸和娛樂等產業持續發展，我們的日常生活體驗透過網路平臺一直在變化。

當用戶找人工智慧網路平臺來協助他們完成任務的時候，因為網路平臺可以收集、提煉資訊，所以用戶得到了益處，上個世代完全沒有這種經驗。這種平臺追求新穎模式的規模、力量、功能，讓個人用戶獲得前所未有的便利和能力；同時，這些用戶進入一種前所未有的人機對話中。

-----廣告，請繼續往下閱讀-----

運用人工智慧的網路平臺有能力可以用我們無法清楚理解，甚至無法明確定義或表示的方式來形塑人類的活動，這裡有一個很重要的問題：這種人工智慧的目標功能是什麼？由誰設計？在哪些監管參數範圍裡？

類似問題的答案會繼續塑造未來的生活與未來的社會：誰在操作？誰在定義這些流程的限制？這些人對於社會規範和制度會有什麼影響？有人可以存取人工智慧的感知嗎？有的話，這人是誰？

如果沒有人類可以完全理解或查看數據，或檢視每個步驟，也就是說假設人類的角色只負責設計、監控和設定人工智慧的參數，那麼對人工智慧的限制應該要讓我們放心？還是讓我們不安？還是既放心又不安？

——本文摘自《 AI 世代與我們的未來：人工智慧如何改變生活，甚至是世界？》，2022 年 12 月，聯經出版公司，未經同意請勿轉載。

-----廣告，請繼續往下閱讀-----

發表意見

所有討論 1

登入與大家一起討論

#1

狐禪 2023/12/04

方便好人的也會方便，限制壞人的也會限制好人。AI於此無解，因為它不知好壞。

聯經出版

27 篇文章・ 20 位粉絲

聯經出版公司創立於1974年5月4日，是一個綜合性的出版公司，為聯合報系關係企業之一。三十多年來已經累積了近六千餘種圖書，範圍包括人文、社會科學、科技以及小說、藝術、傳記、商業、工具書、保健、旅遊、兒童讀物等。

TRENDING 熱門討論

即時熱門

文字

0

提昇大數據可信度，統計學用機率和抽樣優化分析模型－專訪典通公司總經理楊雅惠

陳妤寧・2016/05/24 ・2883字・閱讀時間約 6 分鐘・SR值 557

・八年級

相關標籤：

熱門標籤：

採訪編輯 / 陳妤寧

大數據如果要化為能在市場上提供服務的產品，除了在要科技上持續突破，也需要能解決真實世界中的消費者、企業或政府決策者、等等不同使用者的難題。

典通股份有限公司多年來以民意和市場調查為主要經營項目，隨著大數據的興起，典通也轉投資新公司「Dataa」－浚鴻數據開發股份有限公司，以典通厚植的市場研究經驗為基礎，提供大數據解決方案。他們建議客戶，大數據和傳統民調不可偏廢，兩者應該扮演相輔相成的效果，這是為什麼？

輿情分析和民意調查，兩者相輔相成

成功的大數據服務商業模式，就如同過去股民手上拿的股票機一樣，廠商把上千支的股票資料進行分析，最後推薦用戶哪幾支股票的表現值得推薦。而在這個媒體發達、資訊爆炸的時代，公眾人物、公關從業者或是需要了解民意方向的地方首長，都需要了解大眾現在最關心的新聞是什麼？態度是正面是負面？哪些媒體對自己比較友善？這些運籌帷幄的智囊，如今都存乎於像典通這樣的公司提供的輿情分析服務中，一切的關鍵在於解決使用者的需求和問題。

-----廣告，請繼續往下閱讀-----

但典通的總經理楊雅惠單刀直入地說，如果單純爬梳網路上所有論壇和社群媒體上的意見就直接做出情勢判斷，是存在風險的。「不是所有的人都會在網路上發言，而我們正在分析的這些網路發文，會不會北部人遠多於南部人？會不會高學歷者多於教育程度偏低者？會不會除了少數意見領袖之外，還有太多的網友只有『潛水』瀏覽、而沒有發表意見？」為了確保輿情分析的結果能夠具有代表性（換言之，等於參考價值），楊雅惠主張過去的抽樣調查也必須同步進行，作為判讀輿情分析結果的輔助。

以典通自身為例，一方面透過內建的會員平台進行民調施測，由於平台不對外開放，得以控制會員年齡、性別、地理區域等特性分布的均質性，避免開放式民調平台無法控制同一人重複填答的問題。另一方面，典通也以傳統的電話訪問調查年齡層偏高的族群，以有別於出生長大都在網路發達環境的「網路原生代」。雖然樣本相對少，然而嚴謹確保代表性的做法，卻能夠和利用大數據進行輿情分析的結果互相參照、相輔相成，「如果兩者的顯示結果落差很大，那麼就值得深入研究其中蹊蹺。」

資訊工程和統計分析結合，同時洞悉趨勢和掌握因果

本身是統計學專業背景的楊雅惠從學門的角度分析，認為大數據以資訊工程和演算法為領頭，目標為「快」和「廣」，如何解釋因果關係反而不是重點。「例如我們的客戶中有產險公司，希望能夠建立一套如何判定『拒絕誰來投保』的機制，所以重點是從過去累積的海量資料中分析出規律，最後的結果很可能是費人思索的，例如身高體重等等無法立刻得到解釋的各種變數。但在此情況中，得知因果並不如準確洞悉大趨勢來的重要。」

但在其他情境很可能就恰好相反了，以醫療領域來說，確認因果關係就非常重要，也需要更多特定領域的專家加入分析判讀。而統計學以機率為基礎，雖然運算方式較為複雜，使得運算速度不如以「0 和 1」為邏輯的演算法來的快速，但更能深入研究因果關係。「時至今日，其實我們利用 R 語言建立迴歸分析，矩陣演算的速度也已大幅提昇。」楊雅惠細細解釋，當我們談到模型時，一是指產生統計指標的函數模型，二則是指整合不同統計指標、產出一個立體象限的決策模型，後者更靠近客戶直接做出決定的端點。

-----廣告，請繼續往下閱讀-----

雖然如此劃分兩種學門擔當的角色，楊雅惠認為兩者之間並非對立的關係。「大數據可以解決資料端的問題，統計分析則能在尋求因果解釋時突破片面，兩者互補合作，是對於客戶較為完整的解決方案。」在商業應用的世界中，一切終究需要回歸到客戶的需求：當科技和新技術持續推陳出新，哪些能夠為客戶的問題帶來解決方案？

提昇數據代表性，統計也能優化輿情分析模型

話說回輿情分析，難道「大」數據就沒有精緻化的可能嗎？其實透過深入研究大眾在網路上發表意見的行為模式，可以在分析過程中持續調整權重、減少代表性偏差、優化分析模型。舉例來說，如果同一個發言者連續且大量發言，這種情況就需要調降其權重，避免分析時擴大了單獨一個人的重要性；同樣的，發文者是一般大眾？意見領袖？還是試圖影響輿論的媒體？這些角色如果能分離，也能得出更細緻準確的分析結果。

在正評負評的情緒分析中，可以透過分析一般人使用語言的習慣，找出除了統計正負面的詞語數量之外的分析方法。例如同樣一篇文章標題，後面接的是問號還是驚嘆號，想要傳達的立場可能就完全不同。而許多媒體報導可能為了力求中立，在文章前半段平鋪直敘，直到最後一段才直抒其意，因此文章中的最後一段權重調高，也有助於更良好的判斷網路輿論的正負評聲量。

個人隱私及未統一的數據標準，醫療資料價值服務尚有挑戰

醫療領域的大數據，和其他領域相比有什麼特性？專長在醫療資料分析的楊雅惠表示，最大的癥結點仍在於個資和隱私問題，使得醫療資料的商業模式雖然明確，但利用上仍有諸多挑戰。「例如遠距醫療在技術上已經變成可能，許多穿戴式智慧裝置也都能蒐集個人化的生理資訊，但醫事法規定，醫師必須見到病患本人才能做出診斷。」

-----廣告，請繼續往下閱讀-----

楊雅惠表示，其實法令在今年已經有初步開放，在特定用戶同意的情況下，醫療服務的系統商可以介接健保資料庫的API，存取該特定用戶的健保資料，結合穿戴式智慧裝置記錄的個人生理資訊，協助判斷用戶的身體狀況並提供疾病警訊。

而「非個人化」的醫療資料分析其實已經存在，處於開放初期的健保資料庫，將去個人化的批量資料開放予研究單位，分析國人的健康趨勢。「資料庫會規範最細的分析單位，避免交叉分析造成個人醫療隱私的暴露風險。但可以研究各種預測疾病的模型，一旦個人化的資料到位，模型就能實現為多元的服務應用。」

目前除了醫療資料的隱私問題，另一個挑戰在於各家廠商所推出的個人化穿戴裝置規格不一，醫界對於如何採用這些裝置所記錄的生理數據尚無一致的標準。「例如現行的血壓計，醫界對於在什麼環境、什麼規格所測量出來的數據是否可信是具有共識的；然而現在各種新興的運動手環，可能還不足以成為醫生敢採信的正式醫療數據。」

從市場端的角度分析，楊雅惠認為掌握客戶需求，才能在資料之中問出好問題，進而做出具有代表性的數據分析。反而大數據的定義並不一定是筆數多，以基因資料庫為例，雖然人次不多，但每個人的基因蘊含的變數都很大，整體分析的複雜度也就會隨之提高。最重要的是，隨著機器設備和演算能力的進步、相關平台和工具出現開放的來源，研究大數據的門檻降低，有越來越多的小型團隊得以投入，即使不用昂貴的設備，也能共同開發大數據的未來。

-----廣告，請繼續往下閱讀-----

（本文由科技部補助「新媒體科普傳播實作計畫－智慧生活與前沿科技科普知識教育推廣」執行團隊撰稿）

責任編輯：鄭國威

大數據專題報導系列：

-----廣告，請繼續往下閱讀-----

發表意見

文章難易度

剛好

太難

所有討論 0

登入與大家一起討論

陳妤寧

38 篇文章・ 1 位粉絲

熱愛將知識拆解為簡單易懂的文字，喜歡把一件事的正反觀點都挖出來思考，希望用社會科學的視角創造更宏觀的視野。

TRENDING 熱門討論

即時熱門

提昇大數據可信度，統計學用機率和抽樣優化分析模型－專訪典通公司總經理楊雅惠

輿情分析和民意調查，兩者相輔相成

資訊工程和統計分析結合，同時洞悉趨勢和掌握因果

提昇數據代表性，統計也能優化輿情分析模型

個人隱私及未統一的數據標準，醫療資料價值服務尚有挑戰

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

皮質醇：你體內那位「永不熄滅」的深夜警報器

從腸道重啟好眠開關：PS150 菌株如何調校你的生理時鐘

重新定義深層睡眠：構建全方位的深夜修復計畫

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

肺部為何會變成「菜瓜布」？

打斷惡性循環的挑戰，為何只對抗「纖維化」還不夠？

找到同時調控「發炎」與「纖維化」的新靶點

全球臨床試驗帶來的新希望

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

與數位科技建立夥伴關係

人工智慧陪伴現代人的生活

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

輿情分析和民意調查，兩者相輔相成

資訊工程和統計分析結合，同時洞悉趨勢和掌握因果

提昇數據代表性，統計也能優化輿情分析模型

個人隱私及未統一的數據標準，醫療資料價值服務尚有挑戰

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

發表意見

發表意見

發表意見

發表意見

發表意見