0

1
2

文字

分享

0
1
2

想要重版出來?數據告訴你怎麼做出暢銷書

研之有物│中央研究院_96
・2017/04/10 ・3686字 ・閱讀時間約 7 分鐘 ・SR值 545 ・八年級

-----廣告,請繼續往下閱讀-----

「數據分析」結合「機器學習」,探勘書市商機

誰在買書?買什麼書?這是規劃出版與行銷計畫時,需考量的因素,過去僅能用專業經驗判斷,現在透過資料分析與機器學習,可以用客觀的科學輔佐主觀的決策。中央研究院資訊科學研究所陳昇瑋研究員,帶領資料洞察實驗室,找出書籍銷售數據中潛藏的商機。

資料科學:先搞懂如何發生,再讓它發生

資料分析的四個階段:描述、診斷、預測、指示。圖/Gartner 提供;張語辰改編

資料分析並非輸入數據、按下 Enter 鍵,就能得到立即性的結果,其工作至少可分為四個層次:

1. 描述:瞭解眼前發生了什麼,例如讀者是什麼樣貌
2. 診斷:用電腦來診斷眼前這件事為何發生,例如某些書籍的銷售為什麼特別好
3. 預測:未來會不會發生某件事,例如預測新書的銷售表現
4. 指示:如何促進某件事在未來發生,例如建置自動薦購系統或上架小工具,幫助提升新書銷售;或是幫書籍做更合適的命名以及封面設計

資料分析跟淘金一樣困難,若沒有以正確的方式使用合適的工具,什麼價值也淘不出來。

分析原始資料就像在砂礫中淘金,雖然不用冒著日曬雨淋的痛苦,但需長時間與電腦折騰,結合數學、統計、機器學習、資料探勘與資料視覺化的專業,整理資料的邏輯,找出隱藏在數據中的含意。若遇到非結構化的資料,在分析前尚需花額外的心力半自動或手動地將之轉換為結構化資料,才能使用分析技術來處理。但正因資料分析可以找出隱藏在數據中的洞察、輔助人類的思維,是一門值得投資心力的科學。

中研院陳昇瑋團隊與博客來合作,將 2014 年 12 月 至 2016 年 3 月間的匿名購書資料,結合政府資料開放平臺的數據,包含各個地區的綜合所得稅申報情況、教育程度、2016 年總統大選得票數等,探討購書行為和讀者生活型態的相關性,將不同購書客群之間的「差異性」數據化,藉以回答誰在買書、買什麼書、什麼書會暢銷……等問題,進而將資料科學的思維引入出版界,讓出版人不用再只是憑著經驗及感覺選書及做書。

-----廣告,請繼續往下閱讀-----

什麼人在買什麼書?

博客來各類購書讀者:性別 x 年齡(資料區間為 2014 年 12 月 至 2016 年 3 月間)。圖/陳昇瑋提供

從博客來的匿名消費資料,顯示讀者基本樣貌與購書興趣為:男性較多購買自然科普、電腦資訊和商業理財的書籍,女性較多購買親子教養、飲食、童書和青少年文學。長輩較多購買童書、宗教命理和醫療保健的書籍,而年輕人較多購買輕小說、漫畫和語言學習的書籍。

一樣米養百樣人,一種書也能吸引百種讀者

在規劃出版與行銷策略時,有一個盲點常被忽略:

不能將同一個書籍類別的讀者,都視為同樣一個族群。

過往看銷售報表與會員資料時,經常會把讀者視為只有一種樣貌:例如財經讀者就是白領階級。但陳昇瑋與團隊定義「差異式讀者樣貌分析」,一層一層深入子類別探勘資料,證實同一個書籍類別亦存在「多重客群」。

以「小說」這個大類別為例,愛看「小說」的不會只是同一群人,例如都是戴著眼鏡的文青。同性愛小說和愛情小說的讀者主要是年輕人,而歷史武俠和文學研究的小說,讀者群以長輩為主。若進一步深入分析武俠小說中的「金庸」這個子類別,更存在兩種主要客群: 15 歲以下的青少年和 40 ~ 50 歲的中年人。

-----廣告,請繼續往下閱讀-----

這反應出一個課題:出版與行銷規劃需更分眾、更精準,無論是溝通的宣傳語言、購買的行銷版位,皆需考慮多重客群的存在。

博客來讀者樣貌差異:文學小說類別(資料區間為 2014 年 12 月 至 2016 年 3 月間)。圖/陳昇瑋提供

從購書數據一窺社會現象

世間男女情愛糾葛,李組長眉頭一皺發現事情並不單純,這種社會議題不只在電視劇或新聞中出現,也顯現於購書行為中。

在商業理財的類別,存在許多教導如何成功的書,數據顯示 25 歲以前偏好購買「生涯規劃」類的成功經驗書籍,而 30 歲之後改買如何「致富」的成功指導書籍,顯示 30 歲大關是人生覺悟的交叉點,與其花時間規劃生涯卻前途迷茫,快速致富還比較實際,但也可能因為 30 歲之後除了養自己也要養家人,肩膀壓力更重了。

另一方面,低收入族群偏向購買「投資理財」、「網路創業開店」的書籍,高收入族群則偏向購買「傳記」、「快樂學」的書籍,顯現 M 型社會下兩種不同人生方向與思維,有錢人需要學習如何快樂,而中產階級正朝著累積財富努力。

-----廣告,請繼續往下閱讀-----

「外遇離婚」相關的書籍,會購買的族群大多年收入超過 70 萬,年收入越高,購買者越多,箇中含意不便多加著墨。

若將男性與女性消費者購買的書籍類別和數量,以書籍關鍵字作成文字雲,明顯看出男女想法大不同。在「心理勵志」這個書籍類別中,男性多關注「把妹、正妹、搭訕」,書中自有顏如玉是從古至今不變的智慧。而女性多關注「幸福、療癒、女人」,顯示現今女人越來越懂得要愛自己,是個樂見其成的社會風氣。

博客來讀者性別偏好的差異:心理勵志類為例(資料區間為 2014 年 12 月 至 2016 年 3 月間)。圖/陳昇瑋提供
博客來讀者性別偏好的差異:飲食類為例(資料區間為 2014 年 12 月 至 2016 年 3 月間) 。圖/陳昇瑋提供

無論是賣書或餐飲業,都值得注意年輕人與長輩的喜好差異。「甜點、雞尾酒、廚藝、咖啡」相關書籍熱銷,與近來市場上年輕族群的甜點學校、咖啡開店熱潮相輔相成。而長輩較喜歡「健康、養生、好吃」相關書籍,對於市場而言,開發同時符合健康及好吃需求的餐飲,是顯著的商機。

「養生」這個書名關鍵字,在「飲食類」受到長輩歡迎,但在「醫療保健類」在銷量上並沒有同樣得到大眾的青睞。

陳昇瑋與團隊以「書名關鍵字」,找出關鍵字與暢銷書之間的相關性。在醫療保健類發現,「養生」這個關鍵字不受到讀者歡迎,反而是「名醫、改善、療法、奇蹟」這類關鍵字能抓住讀者的眼球與荷包。也許這反應出一個醫療保健現況:在一秒鐘幾十萬上下的今日,人們不注重花費時間經營的健康之本──日常養生,而是在症狀出現時追求速效的醫療結果。

-----廣告,請繼續往下閱讀-----
書名關鍵字與銷量的相關性:以博客來醫療保健類別為例(資料區間為 2014 年 12 月 至 2016 年 3 月間)。圖/陳昇瑋提供
書名關鍵字與銷量的相關性:以「輕鬆」為例(資料區間為 2014 年 12 月 至 2016 年 3 月間)。圖/陳昇瑋提供

「文字」在不同環境中,會發揮不同力量。同一個書籍關鍵字,在不同書籍類別中,會產生不同的銷售表現。例如,「輕鬆」這個字是行銷時常使用的關鍵字,彷彿在告訴消費者一旦買了這個產品,就能豪不費力地享受好處。對於「輕鬆投資、輕鬆存錢、輕鬆提升業績」這類輕鬆致富的願景,讀者們的想法是「反正我是信了」。但如果在不努力就沒有收穫的語言學習類別,就算告訴讀者「輕鬆說英語、輕鬆搞定文法、輕鬆學日文」,銷量顯示讀者們不會買單。

哪些書會暢銷?除了財神,也能問問電腦

以上內容尚處於資料分析的「描述」和「診斷」階段,真正有意義是分析的第三階段「預測分析」,藉由機器學習技術自動歸納出書籍銷量與各式書籍屬性的相關性,進而建立銷售表現的預測模型。

「機器學習」的作法為,讓程式自動學習哪些因子是重要的,預測某本書成為暢銷書的機率。

書籍銷售表現的預測模型。圖/陳昇瑋提供;張語辰設計

在「預測分析」這個工作階段中,陳昇瑋團隊運用「書籍屬性」、「書名關鍵字」及「上市前的市場狀況」來發展暢銷書預測的模型,以文學小說類別測試,其暢銷書的預測準確度可以接近八成。預測分析的最終目的為「指示型分析」,也就是資料分析的第四個工作階段,透過程式的指示提供最佳化建議,例如書名及副標怎麽下、書介如何編排、預覽圖片要放哪幾張、如何訂價及折扣……等等,協助拉近書籍與目標消費者的距離。

有時資料分析的結果很殘酷,會顯示過去在編輯與行銷上的直覺是不符合現實的,有時則能佐證某些觀察的可信度。資料科學及人工智慧技術,並非為了取代人類而生,最重要的觀念是:從經驗導向的世界換位思考,以客觀的資料事實及科學方法,輔助決策的進行,提高決策的正確機率。

-----廣告,請繼續往下閱讀-----

現在,無論在出版業、零售業或電子商務領域的你,準備好用「資料科學」突破過往的認知了嗎?

延伸閱讀:

  • 執行編輯|林婷嫻 美術編輯|張語辰

本著作由研之有物製作,以創用CC 姓名標示–非商業性–禁止改作 4.0 國際 授權條款釋出。

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度
研之有物│中央研究院_96
296 篇文章 ・ 3914 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

0

0
0

文字

分享

0
0
0
為什麼越累越難睡?當大腦想下班,「腸道」卻還在加班!
鳥苷三磷酸 (PanSci Promo)_96
・2026/04/30 ・2519字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

本文與  益福生醫 合作,泛科學企劃執行

昨晚,你又在床上翻來覆去、無法入眠了嗎?這或許是現代社會最普遍的深夜共鳴。儘管換了昂貴的乳膠枕、拉上百分之百遮光的窗簾,甚至在腦海中數了幾百隻羊,大腦的那個「睡眠開關」卻彷彿生鏽般卡住。這種渴望休息卻睡不著的過程,讓失眠成了一場耗損身心的極限馬拉松 。

皮質醇:你體內那位「永不熄滅」的深夜警報器

要理解失眠,我們得先認識身體的一套精密防衛系統:下視丘-垂體-腎上腺軸(HPA axis) 。這套系統原本是演化給我們的禮物,讓我們在面對劍齒虎或突如其來的危險時,能迅速進入「戰鬥或快逃」的備戰狀態。當這套系統啟動,腎上腺就會分泌皮質醇 (壓力荷爾蒙),這種荷爾蒙能調動能量、提高警覺性,讓我們在危機中保持清醒 。

然而,現代人的「劍齒虎」不再是野獸,而是無止盡的專案進度、電子郵件與職場競爭。對於長期處於高壓或高強度工作環境的人們來說,身體的警報系統可能處於一種「切換不掉」的狀態。

-----廣告,請繼續往下閱讀-----

在理想的狀態下,人類的生理時鐘像是一場精確的接力賽。入夜後,身體會進入「修復模式」,此時壓力荷爾蒙「皮質醇」的濃度應該降至最低點,讓「睡眠荷爾蒙」褪黑激素(Melatonin)接棒主導。褪黑激素不僅負責傳遞「天黑了」的訊號,它還能抑制腦中負責維持清醒的食慾素(Orexin)神經元,幫助大腦順利關閉覺醒開關。

對於長期處於高壓或高強度工作環境的人們來說,身體的警報系統可能處於一種「切換不掉」的狀態 / 圖片來源:envato

然而,當壓力介入時,這場接力賽就會變成跑不完的馬拉松賽。研究指出,長期的高壓環境會導致 HPA 軸過度活化,使得夜間皮質醇異常分泌。這不僅會抑制褪黑激素的分泌,更會讓食慾素在深夜裡持續活化,強迫大腦維持在「高覺醒狀態(Hyperarousal)」。 這種令人崩潰的狀態就是,明明你已經累到不行,但大腦卻像停不下來的發電機!

長期的睡眠不足會導致體內促發炎細胞激素上升,而發炎反應又會進一步活化 HPA 軸,分泌更多皮質醇來試圖消炎,高濃度的皮質醇會進一步干擾深層睡眠與快速動眼期(REM),導致睡眠品質變得低弱又破碎,最終形成「壓力-發炎-失眠」的惡行循環。也就是說,你不是在跟睡眠上的意志力作對,而是在跟失控的生理長期鬥爭。

從腸道重啟好眠開關:PS150 菌株如何調校你的生理時鐘

面對這種煞車失靈的失眠困局,科學家們將目光投向了人體內另一個繁榮的生態系:腸道。腸道與大腦之間存在著一條雙向通訊的高速公路,這就是「菌-腸-腦軸 (Microbiome-Gut-Brain Axis, MGBA)」,而某些特殊菌株不僅能幫助消化、排便,更能透過神經與內分泌途徑與大腦對話,直接參與調節我們的壓力調節與睡眠節律。這種菌株被科學家稱為「精神益生菌」(Psychobiotics)。

-----廣告,請繼續往下閱讀-----
腸道與大腦之間存在著一條雙向通訊的高速公路,這就是「菌-腸-腦軸 (Microbiome-Gut-Brain Axis, MGBA)」/圖片來源:益福生醫

在眾多研究菌株中,發酵乳桿菌 Limosilactobacillus fermentum PS150 的表現格外引人注目。PS150菌株源於亞洲益生菌權威「蔡英傑教授」團隊的專業研發,累積多年功能性菌株研發經驗的科學成果。針對臨床常見的「初夜效應」(First Night Effect, FNE),也就是現代人因出差、換床或環境改變導致的入睡困難,俗稱認床。科學家在進行實驗時發現,補充 PS150 菌株能顯著恢復非快速動眼期(NREM)的睡眠長度,且入睡更快,起床後也更容易清醒。更重要的是,不同於常見的藥物助眠手段(如抗組織胺藥物 DIPH)容易造成快速動眼期(REM)剝奪或導致睡眠破碎化,PS150 菌株展現出一種更為「溫和且自然」的調節力,它能有效縮短入睡所需的時間,並恢復睡眠中代表深層修復的「Delta 波」能量。

科學家發現,即便將 PS150 菌株經過特殊的熱處理(Heat-treated),轉化為不具活性但保有關鍵成分的「後生元」(Postbiotics),其生物活性依然能與活菌媲美 。HT-PS150 技術解決了益生菌在儲存與攝取過程中容易失去活性的痛點,讓這些腸道通訊員能更穩定地發揮作用 。

在臨床實驗中,科學家觀察到一個耐人尋味的現象:當詢問受試者的主觀感受時,往往會遇到強大的「安慰劑效應」,無論是服用 HT-PS150 還是安慰劑的人,主觀上大多表示睡眠變好了。這種「體感上的進步」有時會掩蓋真相,讓人分不清是心理作用還是真實效益。

然而,客觀的生理數據(Biomarkers)卻揭開了關鍵的差異。在排除主觀偏誤後,實驗數據顯示 HT-PS150 組有更高比例的人(84.6%)出現了夜間褪黑激素分泌增加,且壓力荷爾蒙(皮質醇)顯著下降,這證明了菌株確實啟動了體內的睡眠調控系統,而不僅僅是心理安慰。

-----廣告,請繼續往下閱讀-----

最值得關注的是,對於那些失眠指數較高(ISI ≧ 8)的族群,這種「生理修復」與「主觀體感」終於達成了一致。這群人在補充 HT-PS150 後,不僅生理標記改善,連原本嚴重困擾的主觀睡眠效率、持續時間,以及焦慮感也出現了顯著的進步。

了解更多PS150助眠益生菌:https://lihi3.me/KQ4zi

重新定義深層睡眠:構建全方位的深夜修復計畫

睡眠從來就不只是單純的休息,而是一場生理功能的全面重整。想要重獲高品質的睡眠,關鍵在於為自己建立一個全方位的修復生態系。

這套系統的基石,始於良好的生活習慣。從減少睡前數位螢幕的干擾、優化室內環境,到作息調整。當我們透過規律作息來穩定神經系統,並輔以現代科學對於 PS150 菌株的調節力發現,身體便能更順暢地啟動睡眠開關,回歸自然的運作節律。

-----廣告,請繼續往下閱讀-----

與其將失眠視為意志力的抗爭,不如將其看作是生理機能與腸道微生態的深度溝通。透過生活作息的調整與科學實證的支持,每個人都能擁有掌控睡眠的主動權。現在就從優化生活型態開始,為自己按下那個久違的、如嬰兒般香甜的關機鍵吧。

與其將失眠視為意志力的抗爭,不如將其看作是生理機能與腸道微生態的深度溝通 / 圖片來源 : envato

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
247 篇文章 ・ 319 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

6
3

文字

分享

0
6
3
植物口渴就喊:「啵、啵、啵~」
胡中行_96
・2023/04/06 ・2956字 ・閱讀時間約 6 分鐘

久旱不雨,植物悲鳴,[1, 2]類似教育部《臺灣閩南語常用詞辭典》所謂「因飢餓而吵鬧」的「哭枵」(khàu-iau)。[3]別問為何沒聽過,也不怪天地寡情,人類無義,從來漠不關心。植物叫那種超音波,傳至咱們耳裡就只剩寧靜。幸好靠著以色列科學家幫忙,轉換到常人的聽覺範圍,並分享於 2023 年 3 月底的《細胞》(Cell)期刊,才廣為周知。[1]

轉換到人類聽力範圍的番茄「叫聲」。音/參考資料 1,Audio S1(CC BY 4.0)

傾聽植物的聲音

面臨乾旱或草食動物的威脅,植物會做出多種反應,例如:改變外貌,或是以揮發性有機化合物影響鄰居等。[1]過去的文獻指出,缺水引發空蝕現象(cavitation),使植物負責輸送水份的木質部,因氣泡形成、擴張和破裂而震動。[1, 4]現在科學家想知道,這是否也會產生在特定距離內,能被其他物種聽見的聲音。[1]

受試的對象是番茄菸草,分別拆成乾旱、修剪和對照 3 組。對照組又有常態生長的一般對照、有土卻無植物的盆器,以及每株植物實驗前的自體對照 3 種。實驗大致有幾個階段:首先,在隔音箱裡,距離每個受試對象 10 公分處,各立 2 支麥克風收音。將聲音的紀錄分類後,拿去進行機器學習。接著移駕溫室,讓訓練好的模型,分辨雜音和不同情況下植物的聲音。再來,觀察乾旱程度與植物發聲的關係。最後,也測試其他的植物和狀態。[1]

麥克風對著乾旱、修剪和對照組的植物收音。圖/參考資料 1,Graphical Abstract局部(CC BY 4.0)

植物錄音與機器學習

隔音箱裡常態生長的植物,每小時平均發聲少於一次;而沒植物的盆器當然完全無聲。相對地,遭受乾旱或修剪壓力的實驗組植物,反應則十分劇烈:[1]

-----廣告,請繼續往下閱讀-----
 平均值(單位)番茄菸草
乾旱發聲頻率(次/小時)35.4 ± 6.111.0 ± 1.4
 音量(聲壓分貝;dBSPL)61.6 ± 0.165.6 ± 0.4
 聲波頻率(千赫茲;kHz)49.6 ± 0.454.8 ± 1.1
修剪發聲頻率(次/小時)25.2 ± 3.215.2 ± 2.6
 音量(聲壓分貝;dBSPL)65.6 ± 0.263.3 ± 0.2
 聲波頻率(千赫茲;kHz)57.3 ± 0.757.8 ± 0.7

隔音箱中實驗組的錄音,被依照植物品種以及所受的待遇,歸納為 4 個組別,各組別再彼此配對比較,例如:乾旱的番茄對修剪的番茄等。以此資料訓練出來的機器學習模型,判別配對中各組別的準確率為 70%。第二階段在溫室中進行,自然較隔音箱嘈雜。科學家拿空蕩溫室的環境錄音,來教模型分辨並過濾雜訊。訓練後,令其區別乾旱與對照組番茄的聲音,結果 84% 正確。[1]既然能聽得出基本的差別,下一步就是了解水量對番茄發聲的影響。

體積含水量

為了操縱體積含水量(volumetric water content,縮寫VWC),即水份與泥土體積的比值或百分比,[1, 5]科學家狠下心,連續幾天都不給溫室裡的番茄植栽喝水。一邊觀察 VWC 的變化;一邊錄下它們的聲音。起先水份充足,番茄不太吵鬧;4、5 天下來,發聲的次數逐漸增加至高峰;然後應該是快渴死了,有氣無力,所以次數又開始減少。此外,番茄通常都在早上 8 點(圖表較像 7 點)到中午 12 點,以及下午 4 點至晚上 7 點,這兩個時段出聲。[1]科學家覺得這般作息,可能與規律的氣孔導度(stomatal conductance),也就是跟光合作用的換氣以及蒸散作用的水份蒸發,兩個透過氣孔進行的動作有關。[1, 6]

大部份的聲音都是在 VWC < 0.05 時出現;當 VWC > 0.1,水份還足夠,就幾乎無聲。科學家將比較的條件進一步分成 VWC < 0.01 與 VWC > 0.05、VWC < 0.05 跟 VWC > 0.05,以及 VWC < 0.01、VWC > 0.05 和淨空溫室的聲音。機器學習模型分辨起來,都有七、八成的準確率。[1]

縱軸為每日發聲次數;橫軸為缺乏灌溉的天數。圖/參考資料 1,Figure 3A(CC BY 4.0)
乾旱狀態下,番茄發聲的時段。縱軸為每小時發聲次數;橫軸為 24 小時制的時間。圖/參考資料 1,Figure 3B(CC BY 4.0)

植物發聲的原理

實驗觀察所得,都將植物發聲的機制,指向木質部導管中氣體的運動,也就是科學家先前預期的空蝕現象[1]下面為支持這項推論的理由:

-----廣告,請繼續往下閱讀-----
  1. 木質部導管的口徑,與植物被錄到的聲波頻率相關:寬的低;而窄的高。[1]
  2. 乾旱與修剪所造成的聲音不同:在木質部導管中,前者氣泡形成緩慢,發聲時數較長;而後者則相當迅速,時數較短。[1]
  3. 聲音是由植物的莖,向四面八方傳播。[1]
  4. 空蝕現象造成的震動,跟記錄到的超音波,部份頻率重疊;而沒有重疊的,其實已經超出其他物種的聽力以及麥克風收音的範圍。[1]
葡萄、菸草和番茄木質部導管的水平橫截面。圖/參考資料 1,Figure S4B(CC BY 4.0)
葡萄(綠色)、菸草(灰色)和番茄(橙色)的差異:縱軸為聲波頻率;橫軸是木質部導管的平均口徑。圖/參考資料 1,Figure S4A(CC BY 4.0)

問誰未發聲

觀察完番茄和菸草之後,科學家不禁好奇,別的植物是否也會為自己的處境發聲?還是它們都默默受苦,無聲地承擔?研究團隊拿小麥玉米卡本內蘇維濃葡萄(Cabernet Sauvignon grapevine)、奇隆丸仙人掌(Mammillaria spinosissima)與寶蓋草(henbit)來測試,發現它們果然有聲音。不過,像杏仁樹之類的木本植物,還有木質化的葡萄藤就沒有了。另外,科學家又監聽感染菸草嵌紋病毒(tobacco mosaic virus)的番茄,並錄到它們的病中呻吟。[1]

你敢有聽著咱的歌

之前有研究指出,海邊月見草(Oenothera drummondii)暴露於蜜蜂的聲音時,會產出較甜的花蜜。[2]若將角色對調過來:植物在乾旱、修剪或感染等壓力下釋出的超音波,頻率約在 20 至 100 kHz 之間,理論上 3 到 5 公尺內的某些哺乳動物或昆蟲,例如:蝙蝠、老鼠和飛蛾,應該聽得到。[1, 2]以色列科學家認為幼蟲會寄住在番茄或菸草上的飛蛾,或許能辨識植物的聲波,並做出某些反應。同理,人類可以用機器學習模型,分辨農作物的聲音,再給予相應的照顧。如此不僅節省水源,精準培育,還能預防氣候變遷所導致的糧食危機。[1]

  

備註

本文最後兩個子標題,借用音樂劇《Les Misérables》歌曲〈Do You Hear the People Sing?〉的粵語和臺語版曲名。[7]

-----廣告,請繼續往下閱讀-----

參考資料

  1. Khait I, Lewin-Epstein O, Sharon R. (2023) ‘Sounds emitted by plants under stress are airborne and informative’. Cell, 106(7): 1328-1336.
  2. Marris E. (30 MAR 2023) ‘Stressed plants ‘cry’ — and some animals can probably hear them’. Nature.
  3. 教育部「哭枵」臺灣閩南語常用詞辭典(Accessed on 01 APR 2023)
  4. McElrone A J, Choat B, Gambetta GA, et al. (2013) ‘Water Uptake and Transport in Vascular Plants’. Nature Education Knowledge, 4(5):6.
  5. Datta S, Taghvaeian S, Stivers J. (AUG 2018) ‘Understanding Soil Water Content and Thresholds for Irrigation Management’. OSU Extension of Oklahoma State University.
  6. Murray M, Soh WK, Yiotis C, et al. (2020) ‘Consistent Relationship between Field-Measured Stomatal Conductance and Theoretical Maximum Stomatal Conductance in C3 Woody Angiosperms in Four Major Biomes’. International Journal of Plant Sciences, 181, 1.
  7. FireRock Music.(16 JUN 2019)「【問誰未發聲】歌詞 Mix全民超長版 粵+國+台+英 口琴+小童+學生+市民 Do you hear the people sing?」YouTube.
-----廣告,請繼續往下閱讀-----
胡中行_96
169 篇文章 ・ 68 位粉絲
曾任澳洲臨床試驗研究護理師,以及臺、澳劇場工作者。 西澳大學護理碩士、國立台北藝術大學戲劇學士(主修編劇)。邀稿請洽臉書「荒誕遊牧」,謝謝。

0

2
1

文字

分享

0
2
1
AI 的 3 種學習形式:不同的目標功能,不同的訓練方式——《 AI 世代與我們的未來》
聯經出版_96
・2022/12/27 ・2368字 ・閱讀時間約 4 分鐘

搭配不同的任務,人工智慧的應用方式也不一樣,所以開發人員用來創造人工智慧的科技也不一樣。這是部署機器學習時最基礎的挑戰:不同的目標和功能需要不同的訓練技巧。

機器學習最基礎的挑戰:不同目標和功能需配合不同訓練技巧。圖/Pexels

不過,結合不同的機器學習法,尤其是應用神經網路,就出現不同的可能性,例如發現癌症的人工智慧。

機器的 3 種學習形式

在我們撰寫本章的時候,機器學習的三種形式:受監督式學習、不受監督式學習和增強式學習,都值得注意。

受監督式學習催生了發現海利黴素的人工智慧。總結來說,麻省理工學院的研究人員想要找出有潛力的新抗生素,在資料庫裡放入二千種分子來訓練模型,輸入項目是分子結構,輸出項目是抑菌效果;研究人員把分子結構展示給人工智慧看,每一種結構都標示抗菌力,然後讓人工智慧去評估新化合物的抗菌效果。

-----廣告,請繼續往下閱讀-----

這種技巧稱為受監督式學習,因為人工智慧開發人員利用包含了輸入範例(即分子結構)的資料集,在這裡面,每一筆數據都單獨標示研究人員想要的輸出項目或結果(即抗菌力)。

開發人員已經把受監督式學習的技巧應用於許多處,例如創造人工智慧來辨識影像。為了這項任務,人工智慧先拿已經標示好的圖像來訓練,學著把圖像和標籤,例如把貓的照片和「貓」的標籤,聯想在一起,人工智慧把圖片和標籤的關係編碼之後,就可以正確地辨識新圖片。

貓貓!圖/Pexels

因此,當開發人員有一個資料集,其中每個輸入項目都有期望的輸出項目,受監督式學習就能有效地創造出模型,根據新的輸入項目來預測輸出項目。

不過,當開發人員只有大量資料,沒有建立關係的時候,他們可以透過不受監督式學習來找出可能有用的見解。因為網際網路與資料數位化,比過去更容易取得資料,現在企業、政府和研究人員都被淹沒在資料中。

-----廣告,請繼續往下閱讀-----

行銷人員擁有更多顧客資訊、生物學家擁有更多資料、銀行家有更多金融交易記錄。當行銷人員想要找出客戶群,或詐騙分析師想要在大量交易中找到不一致的資訊,不受監督式學習就可以讓人工智慧在不確定結果的資訊中找出異常模式。

這時,訓練資料只有輸入項目,然後工程師會要求學習演算法根據相似性來設定權重,將資料分類。舉例來說,像網飛(Netflix)這樣的影音串流服務,就是利用演算法來找出哪些觀眾群有類似的觀影習慣,才好向他們推薦更多節目;但要優化、微調這樣的演算法會很複雜:因為多數人有好幾種興趣,會同時出現在很多組別裡。

影音串流服務利用演算法,進而推薦使用者可能喜歡的節目。圖/Pexels

經過不受監督式學習法訓練的人工智慧,可以找出人類或許會錯過的模式,因為這些模式很微妙、數據規模又龐大。因為這樣的人工智慧在訓練時沒有明定什麼結果才「適當」,所以可以產生讓人驚豔的創新見解,這其實和人類的自我教育沒什麼不同——無論是人類自學或是人工智慧,都會產生稀奇古怪、荒謬無理的結果。

不管是受監督式學習法或不受監督式學習法,人工智慧都是運用資料來執行任務,以發現新趨勢、識別影像或做出預測。在資料分析之外,研究人員想要訓練人工智慧在多變的環境裡操作,第三種機器學習法就誕生了。

-----廣告,請繼續往下閱讀-----

增強式學習:需要理想的模擬情境與回饋機制

若用增強式學習,人工智慧就不是被動地識別資料間的關聯,而是在受控的環境裡具備「能動性」,觀察並記錄自己的行動會有什麼反應;通常這都是模擬的過程, 把複雜的真實世界給簡化了,在生產線上準確地模擬機器人比較容易,在擁擠的城市街道上模擬就困難得多了。

但即使是在模擬且簡化的環境裡,如西洋棋比賽,每一步都還是會引發一連串不同的機會與風險。因此,引導人工智慧在人造環境裡訓練自己,還不足以產生最佳表現,這訓練過程還需要回饋。

西洋棋比賽中的每一步會引發一連串機會與風險。圖/Pexels

提供反饋和獎勵,可以讓人工智慧知道這個方法成功了。沒有人類可以有效勝任這個角色:人工智慧因為在數位處理器上運作,所以可以在數小時或數日之內就訓練自己幾百次、幾千次或幾十億次,人類提供的回饋相比之下根本不切實際。

軟體工程師將這種回饋功能自動化,謹慎精確地說明這些功能要如何操作,以及這些功能的本質是要模擬現實。理想情況下,模擬器會提供擬真的環境,回饋功能則會讓人工智慧做出有效的決定。

-----廣告,請繼續往下閱讀-----

阿爾法元的模擬器就很簡單粗暴:對戰。阿爾法元為了評估自己的表現,運用獎勵功能,根據每一步創造的機會來評分。

增強式學習需要人類參與來創造人工智慧的訓練環境(儘管在訓練過程中不直接提供回饋):人類要定義模擬情境和回饋功能,人工智慧會在這基礎上自我訓練。為產生有意義的結果,謹慎明確地定義模擬情境和回饋功能至關重要。

——本文摘自《 AI 世代與我們的未來:人工智慧如何改變生活,甚至是世界?》,2022 年 12 月,聯經出版公司,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----
聯經出版_96
27 篇文章 ・ 20 位粉絲
聯經出版公司創立於1974年5月4日,是一個綜合性的出版公司,為聯合報系關係企業之一。 三十多年來已經累積了近六千餘種圖書, 範圍包括人文、社會科學、科技以及小說、藝術、傳記、商業、工具書、保健、旅遊、兒童讀物等。