0

0
0

文字

分享

0
0
0

刊登要錢、訂閱也要錢,做研究就是要被期刊出版社剝削?學術界奮起抵抗出版巨商的血淚史

活躍星系核_96
・2019/09/17 ・4272字 ・閱讀時間約 8 分鐘 ・SR值 576 ・九年級

-----廣告,請繼續往下閱讀-----

  • 鄭婷宇/編譯
圖/改自 2013 (CC) julochka, “amazon haul” @ flickr, CC BY-SA 2.0.

在研究過程之中,學者需要閱讀大量的參考資料,並時常需要更新、交流最新發布的文獻以跟上知識產出的腳步,但面對一個由少數大型出版商集團寡占的學術出版市場,全球各地的圖書館都面臨無力負擔高昂訂閱費用的窘境

面對節節高升的訂閱費用,臺大圖書館在 2016 年 12 月 6 日開出第一槍,發出明年起停止訂閱 Elsevier Science Direct 的公告,清大、交大等大學也隨後跟上。

對學術研究來說,此資料庫涵蓋理工與生醫領域的許多文獻,退訂的決定將對師生造成重大影響,但唯有聯合的抵制運動,方能有一絲爭取合理價格的機會。事實上,抵制 Elsevier 的運動早已在世界各地發生。

期刊逐漸由六大廠商集中出版

世界上第一本科學期刊誕生於 1665 年,分別是法國的 Journal des Sçavans (智者雜誌)和英國皇家學會出版的 Philosophical Transactions of the Royal Society (皇家學會哲學會刊)。在期刊系統出現以前,學者們大多藉由私人信件的往返、各式會議及專書中討論彼此的研究,訊息傳播的範圍與效率都受限。科學期刊的創立,幫助科學家擴大資訊接收的範圍,並得以定期交流研究成果,同行評審的原則也由此奠定。

從期刊問世到第二次世界大戰之前,雖然商業出版的期刊比例不低,傳播效率也較高,但大多數的出版業務仍由各學會負責。不過, 1990 年代中期的資料顯示,出版界的情勢出現了逆轉——商業出版的比例佔期刊總數的 40% 、學術與專業學會出版比例佔 25% 、大學與教育出版佔 16% 。在 1994-1998 年間出版的論文當中,出自 Elsevier 的比例就已高達20%。

-----廣告,請繼續往下閱讀-----

Larivière 的研究分析了於 1973-2013 年出版的 4 千 500 萬份的科學論文,證明了在自然暨醫學科學與社會科學暨人文學等領域,發現文獻出版集中於六大出版商的現象日益顯著。這六大出版商分別為 Reed-Elsevier 、 Wiley-Blackwell 、Springer 、Taylor & Francis、 The American Chemical Society 以及 Sage ,其中前四家身兼兩大領域的龍頭, Sage 僅在社會科學暨人文學中躋身前五大出版商, The American Chemical Society 亦僅在自然暨醫學科學佔有前五大之一的地位,並且是上述出版社中唯一的學術學會,其餘五家全都是商業出版商。

數位科技的應用,非但沒有使得知識的傳播更加普及與自由,反而讓大型的商業出版集團獲利更多。

在自然暨醫學科學領域, 1973 年之前,前五大只佔該領域約 20% 的論文出版比例,到了 2013 年激增到 53% ,其中 Reed-Elsevier 、  Springer 和  Wiley-Blackwell 三家就囊括了 47% 的比例,足見出版比例分配的不均。社會科學暨人文學領域, 1973 至 1990 年間,前五大商業出版商所出版的論文比例佔該領域不到 10% ,卻在2013年時飆升至 51% 。

換句話說,在這兩個領域做研究的學者在查詢資料時,大概每兩篇文獻,就會有一篇名列於這六大家出版商的資料庫之中(圖一)。

2013年前五大學術出版社在兩領域的期刊出版比例。資料來源:The Oligopoly of Academic Publishers in the Digital Era / Vincent Larivière。製圖:鄭婷宇。

高昂的文章處理費與訂閱費,逼研究者起身抗議

呈現寡占狀態的學術出版市場,衍生出文獻集中化的現象,加上不合理的商業模式,使各大圖書館漸漸無力負擔出版商不斷提高的訂閱費用。早期,當學者想出版研究成果時,只能無償交付出版商,後續學者本身因不再擁有著作權利,以致不得自行散播著作、與同業交流,除非圖書館付出大筆費用買回期刊,納稅資助國家研究的公民也無法閱讀這些最新的知識。有感於期刊出版商以販賣他人研究成果獲取利潤的商業模式,對研究者、圖書館與納稅民眾都不公平,開放近用的新型商業模式在一連串摸索中逐漸成形(詳情可參考)。在開放近用的出版形式中,期刊出版商轉而向學者或其所屬的機構索取文章處理費,刊出後的論文將可免費釋出給所有人取用。

在混合型期刊 (Hybrid journals) 中,資料庫的取得須透過訂購,但支持文章以開放近用的方式投稿,此部分便會向作者所屬機構索取文章處理費,以「彌補」該文提供給任何人免費取用所減損的經濟收益。期刊 Lingua 的前主編 Johan Rooryck ,批評混合型期刊是「雙重收費」,不僅向作者索取高達每篇 1800 美元的文章處理費,期刊的訂購也要價不菲。即使 Lingua 所屬的 Elsevier 表示已收取文章處理費的文章是免費開放,但許多研究者仍對於期刊訂立的高昂文章處理費與訂購費感到不滿,認為自己無償勞動所產出的學術貢獻,成為出版商獲取高額利潤的來源。畢竟 Elsevier 、 Springer 和 Taylor&Francis 等幾家大型出版商的獲利率皆高達 35% ,這可是比 Facebook 獲利率 27% 還驚人的利潤。

-----廣告,請繼續往下閱讀-----

期刊大盤商索取的高昂費用,對學術成果的流通與近用性皆造成傷害。研究者的怨念在 2015 年爆發開來,要求 Elsevier 降低文章處理費、讓作者保留其著作權等。在 Elsevier 拒絕後, Lingua 的六位編輯與 31 位編輯委員集體辭職以示抗議。這群編輯另創一個新的開放近用期刊── Glossa ,只向作者收 400 美元的文章處理費,並取消對無資金之投稿者的收費。

認知科學的社群則在 2016 年接續了這場對 Elsevier 的抗議運動。一群研究者向 Elsevier 請願,要求降低 Elsevier 在該領域的權威期刊── Cognition 的文章處理費。由 David Barner 發起的聯署請願,在一週內就集結了超過 1200 位附議,其中包括至少十位 Cognition 的編輯委員會成員。截至目前為止,該網站共收集了 1661 位科學家的連署。

期刊訂閱費用節節高升,大學圖書館紛紛抵制

在期刊與出版商彼此合併或兼併之後,學術出版市場被少數幾家廠商寡占的情形,使圖書館更無議價的空間。根據美國研究圖書館 (Association of Research Libraries) 之統計,自 1986 年至 2012 年以來,期刊價格已上漲 456% ,約為同期間消費者物價指數 (CPI) 上漲幅度的四倍,期刊價格居高不下,穩坐圖書館開支最高的寶座多年。

面對不斷上漲的資料庫訂閱費用,各國學術機構的採購經費日漸捉襟見肘。

2012 年,英國劍橋大學數學家 Timothy Gowers 在其部落格發表一篇「知識的代價」(The Cost of Knowledge) 的文章,呼籲學界共同抵制 Elsevier 剝削研究者與社會的商業模式,加入拒絕向 Elsevier 擁有之期刊投稿、協助審閱或編輯的行列,目前已累計有 16,484 人響應。以 Gowers 的文章為序幕,一場向 Elsevier 抗議的「學術之春」 (Academic Spring) 開始在世界各地的學術機構蔓延而起。加州、哈佛等名校先後譴責 Elsevier 資料庫售價高額的漲幅,停止訂閱。

-----廣告,請繼續往下閱讀-----

儘管 Gowers 的登高一呼獲得熱烈迴響,但這場杯葛似乎缺乏後續的威力與參與動能。

根據 Tom Heyman 等人於 2016 年追蹤化學、心理領域約 500 名參與聯署的科學家後續動向的研究指出,有 23% 簽名的科學家仍在 Elsevier 發表論文(圖二)。對科學家來說,要遵守「不發表」的承諾所必須付出的代價不小,面對學術工作環境崇尚的高影響力指標,科學家常有投稿主流且高影響力期刊的壓力與誘惑。

抵制 Elsevier 承諾跳票的科學家。資料來源:On the Cost of Knowledge: Evaluating the Boycott against Elsevier / Tom Heyman, Pieter Moors, Gert Storms.。製圖:鄭婷宇

荷蘭是 Elsevier 的發源與總部所在地,當地的學術圈同樣對沉重的訂購費用感到不滿。 2015 年,荷蘭教科文部次長 Sander Dekker 出面與 Elsevier 談判,加上 14 所公立研究型大學聯合發動杯葛計畫,威脅集體辭去於 Elsevier 編輯等職務,甚至投稿。這場由政府帶頭、學界團結對抗壟斷的學術出版集團的運動,在 Elsevier 的妥協下落幕。雖然荷蘭學界提出的條件被打了些折扣,但仍成功爭取到更好的開放近用條件。

為了抗議 Elsevier 不透明的商業模式,德國 DEAL Project 計畫共有多達60所大學及研究機構共同抵制 Elsevier ,全面停訂 Elsevier 期刊的決定將自 2017 年 1 月起生效。

臺灣各大學對出版商的反擊

臺灣也在這波抵制 Elsevier 的浪潮中挺身而出。臺灣全國每年花費於購置 Elsevier Science Direct 電子期刊的費用不斷攀升, 2016 年的費用較 2008 年增加了 53% ,達到 2700 萬美元,占目前大專校院的年度電子資源採購經費近 1/3 。經全國學術電子資訊資源共享聯盟 (CONCERT) 小組與 Elsevier 討論後,因 Elsevier 堅持其計價模式及內容, CONCERT 小組決定延緩續訂,並呼籲各圖書館考量全體會員的利益,集體停訂以促使 Elsevier 與臺灣簽訂合理的合約。

-----廣告,請繼續往下閱讀-----

各校圖書館長年承受不斷調漲的資料庫訂閱費用壓力,即使是資源豐厚的臺灣大學也難以承受。 Elsevier Science Direct 的驚人訂價,排擠圖書館引進其他期刊資源的經費。臺灣大學於首先發出明年起停止訂閱 Elsevier Science Direct 期刊的公告,緊接著清華大學、交通大學、成功大學、中興大學、臺灣師範大學、臺灣科技大學、勤益科技大學、實踐大學等學校先後發表停止訂閱的聲明(圖三)。

Elsevier Science Direct 採購經費與效益不成比例。資料來源:臺灣大學、清華大學、交通大學三校圖書館之公告。製圖:鄭婷宇

推動、取得開放近用論文的其他管道

對抗大型期刊出版商壟斷之運動前途未卜,學者與研究機構是否能夠團結面對是關鍵所在。

除了抵制訂閱、投稿、編輯大型商業期刊之外,還有其他可行的實際行動可推動學術出版環境的開放。

Ginsparg 架設的 arXiv ,提供科學家上傳自己論文發表前的預印本的平台,開放所有人瀏覽與下載,讓最新的研究成果能迅速且更大範圍的交流。 Alexandra Elbakyan 創立的 Sci-Hub 提供用戶免費下載論文的服務,遇到付費論文時,該網站會自動登錄志願者提供的已訂閱帳號進行下載,並自動備份論文,方便下個用戶的使用。

當知識成為可以估價的商品,研究成果的流通範圍及可近性勢必會受限。長久以來,期刊出版商以學者產出的論文為獲利基礎來源,在收取高昂文章處理費、訂購費的狀況下,年年賺得豐厚利潤的商業模式,一直引起研究者與學術機構的怨懟。儘管開放近用的概念在學術界已漸次推廣開來,大型商業集團壟斷學術出版市場的情形,讓許多研究及教育機構在面對年年抬升的期刊資料庫價格面前,幾無議價能力。當知識成為一項價格難以負擔的商品、資訊的流通被付費高牆阻隔,難以取得參考資料的研究將停滯,對整體社會也將會是弊大於利的悲劇。

-----廣告,請繼續往下閱讀-----

本文轉載自 台灣創用CC計畫 ,原文為〈失衡的期刊出版市場:學界力抗出版巨商的奮鬥史

相關連結

延伸閱讀

文章難易度
活躍星系核_96
752 篇文章 ・ 126 位粉絲
活躍星系核(active galactic nucleus, AGN)是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍,在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。 本帳號發表來自各方的投稿。附有資料出處的科學好文,都歡迎你來投稿喔。 Email: contact@pansci.asia

0

3
3

文字

分享

0
3
3
圖形處理單元與人工智慧
賴昭正_96
・2024/06/24 ・6944字 ・閱讀時間約 14 分鐘

-----廣告,請繼續往下閱讀-----

  • 作者/賴昭正|前清大化學系教授、系主任、所長;合創科學月刊

我擔心人工智慧可能會完全取代人類。如果人們能設計電腦病毒,那麼就會有人設計出能夠自我改進和複製的人工智慧。 這將是一種超越人類的新生命形式。

——史蒂芬.霍金(Stephen Hawking) 英國理論物理學家

大約在八十年前,當第一台數位計算機出現時,一些電腦科學家便一直致力於讓機器具有像人類一樣的智慧;但七十年後,還是沒有機器能夠可靠地提供人類程度的語言或影像辨識功能。誰又想到「人工智慧」(Artificial Intelligent,簡稱 AI)的能力最近十年突然起飛,在許多(所有?)領域的測試中擊敗了人類,正在改變各個領域——包括假新聞的製造與散佈——的生態。

圖形處理單元(graphic process unit,簡稱 GPU)是這場「人工智慧」革命中的最大助手。它的興起使得九年前還是個小公司的 Nvidia(英偉達)股票從每股不到 $5,上升到今天(5 月 24 日)每股超過 $1000(註一)的全世界第三大公司,其創辦人(之一)兼首席執行官、出生於台南的黃仁勳(Jenson Huang)也一躍成為全世界排名 20 內的大富豪、台灣家喻戶曉的名人!可是多少人了解圖形處理單元是什麼嗎?到底是時勢造英雄,還是英雄造時勢?

黃仁勳出席2016年台北國際電腦展
Nvidia 的崛起究竟是時勢造英雄,還是英雄造時勢?圖/wikimedia

在回答這問題之前,筆者得先聲明筆者不是學電腦的,因此在這裡所能談的只是與電腦設計細節無關的基本原理。筆者認為將原理轉成實用工具是專家的事,不是我們外行人需要了解的;但作為一位現在的知識分子或公民,了解基本原理則是必備的條件:例如了解「能量不滅定律」就可以不用仔細分析,即可判斷永動機是騙人的;又如現在可攜帶型冷氣機充斥市面上,它們不用往室外排廢熱氣,就可以提供屋內冷氣,讀者買嗎?

CPU 與 GPU

不管是大型電腦或個人電腦都需具有「中央處理單元」(central process unit,簡稱 CPU)。CPU 是電腦的「腦」,其電子電路負責處理所有軟體正確運作所需的所有任務,如算術、邏輯、控制、輸入和輸出操作等等。雖然早期的設計即可以讓一個指令同時做兩、三件不同的工作;但為了簡單化,我們在這裡所談的工作將只是執行算術和邏輯運算的工作(arithmetic and logic unit,簡稱 ALU),如將兩個數加在一起。在這一簡化的定義下,CPU 在任何一個時刻均只能執行一件工作而已。

-----廣告,請繼續往下閱讀-----

在個人電腦剛出現只能用於一般事物的處理時,CPU 均能非常勝任地完成任務。但電腦圖形和動畫的出現帶來了第一批運算密集型工作負載後,CPU 開始顯示心有餘而力不足:例如電玩動畫需要應用程式處理數以萬計的像素(pixel),每個像素都有自己的顏色、光強度、和運動等, 使得 CPU 根本沒辦法在短時間內完成這些工作。於是出現了主機板上之「顯示插卡」來支援補助 CPU。

1999 年,英偉達將其一「具有集成變換、照明、三角形設定/裁剪、和透過應用程式從模型產生二維或三維影像的單晶片處理器」(註二)定位為「世界上第一款 GPU」,「GPU」這一名詞於焉誕生。不像 CPU,GPU 可以在同一個時刻執行許多算術和邏輯運算的工作,快速地完成圖形和動畫的變化。

依序計算和平行計算

一部電腦 CPU 如何計算 7×5+6/3 呢?因每一時刻只能做一件事,所以其步驟為:

  • 計算 7×5;
  • 計算 6/3;
  • 將結果相加。

總共需要 3 個運算時間。但如果我們有兩個 CPU 呢?很多工作便可以同時(平行)進行:

-----廣告,請繼續往下閱讀-----
  • 同時計算 7×5 及 6/3;
  • 將結果相加。

只需要 2 個運算時間,比單獨的 CPU 減少了一個。這看起來好像沒節省多少時間,但如果我們有 16 對 a×b 要相加呢?單獨的 CPU 需要 31 個運算的時間(16 個 × 的運算時間及 15 個 + 的運算時間),而有 16 個小 CPU 的 GPU 則只需要 5 個運算的時間(1 個 × 的運算時間及 4 個 + 的運算時間)!

現在就讓我們來看看為什麼稱 GPU 為「圖形」處理單元。圖一左圖《我愛科學》一書擺斜了,如何將它擺正成右圖呢? 一句話:「將整個圖逆時針方向旋轉 θ 即可」。但因為左圖是由上百萬個像素點(座標 x, y)組成的,所以這句簡單的話可讓 CPU 忙得不亦樂乎了:每一點的座標都必須做如下的轉換

x’ = x cosθ + y sinθ

y’ = -x sinθ+ y cosθ

-----廣告,請繼續往下閱讀-----

即每一點均需要做四個 × 及兩個 + 的運算!如果每一運算需要 10-6 秒,那麼讓《我愛科學》一書做個簡單的角度旋轉,便需要 6 秒,這豈是電動玩具畫面變化所能接受的?

圖形處理的例子

人類的許多發明都是基於需要的關係,因此電腦硬件設計家便開始思考:這些點轉換都是獨立的,為什麼我們不讓它們同時進行(平行運算,parallel processing)呢?於是專門用來處理「圖形」的處理單元出現了——就是我們現在所知的 GPU。如果一個 GPU 可以同時處理 106 運算,那上圖的轉換只需 10-6 秒鐘!

GPU 的興起

GPU 可分成兩種:

  • 整合式圖形「卡」(integrated graphics)是內建於 CPU 中的 GPU,所以不是插卡,它與 CPU 共享系統記憶體,沒有單獨的記憶體組來儲存圖形/視訊,主要用於大部分的個人電腦及筆記型電腦上;早期英特爾(Intel)因為不讓插卡 GPU 侵蝕主機的地盤,在這方面的研發佔領先的地位,約佔 68% 的市場。
  • 獨立顯示卡(discrete graphics)有不與 CPU 共享的自己專用內存;由於與處理器晶片分離,它會消耗更多電量並產生大量熱量;然而,也正是因為有自己的記憶體來源和電源,它可以比整合式顯示卡提供更高的效能。

2007 年,英偉達發布了可以在獨立 GPU 上進行平行處理的軟體層後,科學家發現獨立 GPU 不但能夠快速處理圖形變化,在需要大量計算才能實現特定結果的任務上也非常有效,因此開啟了為計算密集型的實用題目編寫 GPU 程式的領域。如今獨立 GPU 的應用範圍已遠遠超出當初圖形處理,不但擴大到醫學影像和地震成像等之複雜圖像和影片編輯及視覺化,也應用於駕駛、導航、天氣預報、大資料庫分析、機器學習、人工智慧、加密貨幣挖礦、及分子動力學模擬(註三)等其它領域。獨立 GPU 已成為人工智慧生態系統中不可或缺的一部分,正在改變我們的生活方式及許多行業的遊戲規則。英特爾在這方面發展較遲,遠遠落在英偉達(80%)及超微半導體公司(Advance Micro Devices Inc.,19%,註四)之後,大約只有 1% 的市場。

-----廣告,請繼續往下閱讀-----
典型的CPU與GPU架構

事實上現在的中央處理單元也不再是真正的「單元」,而是如圖二可含有多個可以同時處理運算的核心(core)單元。GPU 犧牲大量快取和控制單元以獲得更多的處理核心,因此其核心功能不如 CPU 核心強大,但它們能同時高速執行大量相同的指令,在平行運算中發揮強大作用。現在電腦通常具有 2 到 64 個核心;GPU 則具有上千、甚至上萬的核心。

結論

我們一看到《我愛科學》這本書,不需要一點一點地從左上到右下慢慢掃描,即可瞬間知道它上面有書名、出版社等,也知道它擺斜了。這種「平行運作」的能力不僅限於視覺,它也延伸到其它感官和認知功能。例如筆者在清華大學授課時常犯的一個毛病是:嘴巴在講,腦筋思考已經不知往前跑了多少公里,常常為了追趕而越講越快,將不少學生拋到腦後!這不表示筆者聰明,因為研究人員發現我們的大腦具有同時處理和解釋大量感官輸入的能力。

人工智慧是一種讓電腦或機器能夠模擬人類智慧和解決問題能力的科技,因此必須如人腦一樣能同時並行地處理許多資料。學過矩陣(matrix)的讀者應該知道,如果用矩陣和向量(vector)表達,上面所談到之座標轉換將是非常簡潔的(註五)。而矩陣和向量計算正是機器學習(machine learning)演算法的基礎!也正是獨立圖形處理單元最強大的功能所在!因此我們可以了解為什麼 GPU 會成為人工智慧開發的基石:它們的架構就是充分利用並行處理,來快速執行多個操作,進行訓練電腦或機器以人腦之思考與學習的方式處理資料——稱為「深度學習」(deep learning)。

黃仁勳在 5 月 22 日的發布業績新聞上謂:「下一次工業革命已經開始了:企業界和各國正與英偉達合作,將價值數萬億美元的傳統資料中心轉變為加速運算及新型資料中心——人工智慧工廠——以生產新商品『人工智慧』。人工智慧將為每個產業帶來顯著的生產力提升,幫助企業降低成本和提高能源效率,同時擴大收入機會。」

附錄

人工智慧的實用例子:下面一段是微軟的「copilot」代書、谷歌的「translate」代譯之「one paragraph summary of GPU and AI」。讀完後,讀者是不是認為筆者該退休了?

-----廣告,請繼續往下閱讀-----

GPU(圖形處理單元)和 AI(人工智慧)之間的協同作用徹底改變了高效能運算領域。GPU 具有平行處理能力,特別適合人工智慧和機器學習所需的複雜資料密集運算。這導致了影像和視訊處理等領域的重大進步,使自動駕駛和臉部辨識等技術變得更加高效和可靠。NVIDIA 開發的平行運算平台 CUDA 進一步提高了 GPU 的效率,使開發人員能夠透過將人工智慧問題分解為更小的、可管理的、可同時處理的任務來解決這些問題。這不僅加快了人工智慧研究的步伐,而且使其更具成本效益,因為 GPU 可以在很短的時間內執行與多個 CPU 相同的任務。隨著人工智慧的不斷發展,GPU 的角色可能會變得更加不可或缺,推動各產業的創新和新的可能性。大腦透過神經元網路實現這一目標,這些神經元網路可以獨立但有凝聚力地工作,使我們能夠執行複雜的任務,例如駕駛、導航、觀察交通信號、聽音樂並同時規劃我們的路線。此外,研究表明,與非人類動物相比,人類大腦具有更多平行通路,這表明我們的神經處理具有更高的複雜性。這個複雜的系統證明了我們認知功能的卓越適應性和效率。我們可以一邊和朋友聊天一邊走在街上,一邊聽音樂一邊做飯,或一邊聽講座一邊做筆記。人工智慧是模擬人類腦神經網路的科技,因此必須能同時並行地來處理許多資料。研究人員發現了人腦通訊網路具有一個在獼猴或小鼠中未觀察獨特特徵:透過多個並行路徑傳輸訊息,因此具有令人難以置信的多任務處理能力。

註解

(註一)當讀者看到此篇文章時,其股票已一股換十股,現在每一股約在 $100 左右。

(註二)組裝或升級過個人電腦的讀者或許還記得「英偉達精視 256」(GeForce 256)插卡吧?

(註三)筆者於 1984 年離開清華大學到 IBM 時,就是參加了被認為全世界使用電腦時間最多的量子化學家、IBM「院士(fellow)」Enrico Clementi 的團隊:因為當時英偉達還未有可以在 GPU 上進行平行處理的軟體層,我們只能自己寫軟體將 8 台中型電腦(非 IBM 品牌!)與一大型電腦連接來做平行運算,進行分子動力學模擬等的科學研究。如果晚生 30 年或許就不會那麼辛苦了?

-----廣告,請繼續往下閱讀-----

(註四)補助個人電腦用的 GPU 品牌到 2000 年時只剩下兩大主導廠商:英偉達及 ATI(Array Technology Inc.)。後者是出生於香港之四位中國人於 1985 年在加拿大安大略省成立,2006 年被超微半導體公司收購,品牌於 2010 年被淘汰。超微半導體公司於 2014 年 10 月提升台南出生之蘇姿豐(Lisa Tzwu-Fang Su)博士為執行長後,股票從每股 $4 左右,上升到今天每股超過 $160,其市值已經是英特爾的兩倍,完全擺脫了在後者陰影下求生存的小眾玩家角色,正在挑戰英偉達的 GPU 市場。順便一題:超微半導體公司現任總裁(兼 AI 策略負責人)為出生於台北的彭明博(Victor Peng);與黃仁勳及蘇姿豐一樣,也是小時候就隨父母親移居到美國。

(註五)

延伸閱讀

  • 熱力學與能源利用」,《科學月刊》,1982 年 3 月號;收集於《我愛科學》(華騰文化有限公司,2017 年 12 月出版),轉載於「嘉義市政府全球資訊網」。
  • 網路安全技術與比特幣」,《科學月刊》,2020 年 11 月號;轉載於「善科教育基金會」的《科技大補帖》專欄。
文章難易度

討論功能關閉中。

賴昭正_96
43 篇文章 ・ 56 位粉絲
成功大學化學工程系學士,芝加哥大學化學物理博士。在芝大時與一群留學生合創「科學月刊」。一直想回國貢獻所學,因此畢業後不久即回清大化學系任教。自認平易近人,但教學嚴謹,因此穫有「賴大刀」之惡名!於1982年時當選爲 清大化學系新一代的年青首任系主任兼所長;但壯志難酬,兩年後即辭職到美留浪。晚期曾回台蓋工廠及創業,均應「水土不服」而鎩羽而歸。正式退休後,除了開始又爲科學月刊寫文章外,全職帶小孫女(半歲起);現已成七歲之小孫女的BFF(2015)。首先接觸到泛科學是因爲科學月刊將我的一篇文章「愛因斯坦的最大的錯誤一宇宙論常數」推薦到泛科學重登。

0

3
2

文字

分享

0
3
2
論文好多看不完?研究生的救星!用 AI 幫你分析統整!
泛科學院_96
・2023/10/14 ・761字 ・閱讀時間約 1 分鐘

-----廣告,請繼續往下閱讀-----

近期科技界最熱烈討論的新聞,應該就屬韓國有研究單位宣布找到了新的室溫常壓超導體 LK-99 ,聽說可以在一般的高中大學實驗室中完成。這讓我不禁好奇它的製作原理,但,大部分的朋友應該跟我一樣都不是專業材料工程人員,看不懂論文怎麼辦呢?除了等泛科學出影片,別忘了我們有 AI 呀!今天我要來分享一套專門訓練來閱讀論文的 AI —— SciSpace Copilot。

今天的影片簡單的跟大家分享了基於 GPT 技術且針對閱讀學術文章進行特別優化的 AI —— SciSpace ,我只要遇到研究型文章都會特別開這個工具起來使用,其他的大語言模型都無法做到如此細緻。我覺得生成式人工智慧的未來就會到處是這種基於某種目的,比如讀論文,使用某個大模型進行微調 Fine-Tuning 之後的小模型,將會協助我們解決各種問題。

是說現在的研究生做研究的工具真是越來越多,你會想要把這支影片分享給你的指導老師看嗎?
歡迎你把使用的經驗與想法在影片下方留言與我分享!

也歡迎加入泛科學院的頻道會員,或者科學AI的Discord論壇,一起討論交流。

-----廣告,請繼續往下閱讀-----

如果這支影片對你有幫助的話,請幫我在影片下方點個喜歡,或是透過超級感謝展現你的心意,讓我製作更多實用有趣的 AI 教學影片,最後別忘了訂閱泛科學院的頻道,我們下支影片再見囉。

更多、更完整的內容,歡迎上泛科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得更多有趣的資訊!

泛科學院_96
44 篇文章 ・ 51 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!

0

2
0

文字

分享

0
2
0
你對大數字有「感覺」嗎?一本電子書檔案有多大?一間國家圖書館有多少藏書是合理的?——《一輛運鈔車能裝多少錢?》
三民書局_96
・2023/07/07 ・3010字 ・閱讀時間約 6 分鐘

-----廣告,請繼續往下閱讀-----

ZB(zettabyte,皆位元組)相當於 10 億兆位元組:1 後面帶了 21 個 0。1 ZB 相當於可以儲存美國國會圖書館(Library of Congress)所有藏書量的 1,000 億倍。」——《紐約時報》,2009 年 12 月 10 日

科技帶來的巨大單位和微小單位

科技帶來了許多大數字,大多數都以陌生單位表示,因此又多了另外一組大單位:M(mega,百萬)、G(giga,吉)和T(tera,兆),這些單位日常生活中就會用到,而更大的單位:P(peta,拍)和E(exa,艾)現在也會時不時出現。

現今電腦和智慧手機非常普及,因此我們早已習慣 GB(gigabyte,吉位元組)和百萬像素(megapixel)等單位。然而,這些前綴單位經常使用在位元組(byte, B)這類無形實體上,相較於更常見的十億(billion)和兆(trillion)來說,我們更難理解這些單位的意義。

科技的發展,尤其是電腦、資訊科學的突飛猛進,帶來了許多前所未有、人腦已經不太能「想像」的大數字。圖/envatoelements

這裡幫大家統整一下,通常會使用 K(kilo,千)代表一千、M 代表一百萬、G 代表十億、T 代表一兆。如果你想要為未來的科技發展進一步做好準備,接下來的單位依序為:P、E、Z(zetta,皆)和Y(yotta,佑)。依序後者為前者的1,000倍。

電腦的速度極快也同樣有一系列相對應代表小數量和小尺寸的前綴單位,往往更令人陌生:m(milli,毫)、µ(micro,微)、n(nano,奈)和 p(pico,皮),分別代表千分之一、百萬分之一、十億分之一和一兆分之一。這些前綴單位通常使用在長度和時間上,例如毫公尺(millimeter, mm)和奈秒(nanosecond, ns)。

-----廣告,請繼續往下閱讀-----
國際通用單位的符號、名稱和詞頭。表/維基百科

這些數字到底多大多小?可以「感覺」一下嗎?

大多數人對這些微小單位毫無感覺,也不知道提供這些數字的人是根據什麼資料算出來的,因此只能任由資訊提供者擺布。以下是幾個能帶給你啟發的例子。

幾年前的聖誕節前夕,贈送亞馬遜 Kindle 或其他新推出的電子書閱讀器作為禮物蔚為風潮,甚至聽說蘋果公司(Apple)也將推出平板裝置(iPad 在 2010 年 1 月下旬發布,但一直到 3 月才上市)。2009 年12 月 9 日,《華爾街日報》指出巴諾書店(Barnes & Noble)的 Nook 電子書閱讀器擁有 2 GB 記憶體,「約能存下 1,500 本電子書」。隔天,《紐約時報》提出 1 ZB 記憶體,「相當於可以儲存美國國會圖書館所有藏書量的 1,000 億倍」。

一間圖書館有多少藏書是合理的數字?

我當時很幸運正要開始出課程的期末考題,這些科技領域數字,正是上天贈與我的靈感。我在試題中問到:

假設以上兩個描述皆正確,請計算美國國會圖書館大約有多少本書?

回答這個問題只需要簡單的算術,然而計算數字非常龐大,而大部分的人不見得擅長大數字計算。出現太多0的時候,腦袋往往會轉不過來。寫下 Z 所代表的完整數字(1 後面帶著 21 個 0)可能會有幫助,但往往會寫錯。

-----廣告,請繼續往下閱讀-----

接下來我會提到,使用科學記號(scientific notation)書寫是較佳方法,但像「Z」這樣的單位,除了極少數人外幾乎沒人知道,對大部分的人來說根本毫無意義。

既然直覺無法帶來任何幫助,就仔細計算一下吧。根據《華爾街日報》的說法,2 GB 可以儲存 1,500 本書,代表一本書略多於 1 MB。再根據《紐約時報》的說法,1,000 億倍等於 1011 倍,將總位元組數 1021除以 1011 倍,會得到國會圖書館藏書量約相當於 1010 位元組。如果每本書為 106 位元組(約為 1 MB),將 1010 除以 106 可以得出,國會圖書館藏書本數約為 104 本,也就是 10,000 本書。如果你對這裡使用的指數和科學記號不太熟悉,接下來會有更深入的解釋。

10,000 本是合理的估計值嗎?比起盲目猜測合不合理,可以試試評估這個數值是否過大或過小,也就是試題的第二部分:

一間圖書館的藏書應該有幾本才算是合理的範圍?一萬本是合理的數字嗎?圖/envatoelements

計算出來的數字看起來太多、太少,還是差不多?為什麼?

當然如果一開始就算錯了,就沒辦法正確回答這個問題。部分學生遭遇到這個狀況,而必須試圖解釋小至分數或大至數億以上的數字。

-----廣告,請繼續往下閱讀-----

儘管計算正確的學生狀況會好一點,但某些學生在評估數字合不合理時,依然遇到了困難。看來就算是比較小的大數字,依然難以想像出實際情況。不少學生認為一間大圖書館藏書 10,000 本十分合理,完全出乎我的意料。

其中一位學生回答:「我猜就算是普林斯頓大學的圖書館,隨便也超過 10,000 本書吧!」實際上這樣說也沒錯啦!但回答得還不夠好。單單我自己的辦公室就有超過500本書,我敢打賭許多更專注於學術研究的同事,都擁有好幾千本書。至於坐落在校園中心的巨大建築、貌似學生都十分熟悉的學校圖書館,藏書整整超過 600 萬本。

一本書到底有多大?TB 或是 MB 又到底有多大呢?以下是簡單的答案。以常見的文本來說,一位元組可以儲存 1 個英數字元。珍‧奧斯汀(Jane Austen)的《傲慢與偏見》(Pride and Prejudice)約有 97,000字,共 550,000 個字元,因此一本純文字的浪漫小說或傳記,大小基本上可以評估為 1 MB,因此 1 GB 可以儲存這類書籍約 1,000 本。圖片則要佔據更多空間,每張圖約幾KB到幾MB。

《華爾街日報》的計算結果十分合理,但相比之下,《紐約時報》卻大錯特錯。

-----廣告,請繼續往下閱讀-----

電子書檔案有多大?

大家可以評估看看,以下 3 則關於電子書大小的說法:

「《欽定版聖經》(King James Bible)的文字檔案大小很可能不超過 500 KB。」

「如果以文字檔來看,1 GB 可以儲存相當於 2,000 本《聖經》文字量的書籍。」

「整個微軟 Office 套裝軟體程式,約會佔用與一本厚書相當的硬碟空間。例如,微軟 Office 中小企業版僅佔用 560 MB。」

-----廣告,請繼續往下閱讀-----

《聖經》文字量可比《傲慢與偏見》多上許多,字數整整接近 800,000 字,相當於約 4.5 MB 的純文字,稱得上一本厚書。前兩則描述還算合理一致,雖然都過於樂觀。資料壓縮技術雖然可以減少所需儲存容量,但並沒辦法壓縮到 500 KB 這麼小。然而,第三則描述則差了 1,000倍,560 MB 的微軟Office軟體佔用的空間,整整接近 500 本厚書佔用的硬碟空間。

一本聖經多達八十萬字。圖/envatoelements

順道一提,根據 loc.gov(國會圖書館網站)上的資料,國會圖書館藏書約為 1,600 萬冊,外加 1.2 億件其他資料。另外提一個有趣的說法,《紐約時報》的電子書閱讀器報導,也試圖幫助讀者視覺化國會圖書館的藏書量:「相當於可以在美國本土和阿拉斯加蓋上 7 層書籍。」先不管這段資訊實不實用,資訊是否真的正確就交由你來計算吧。但我想給你個提示,幫助你開始計算,1 平方英里超過 2,500 萬平方英尺,而一本書籍的大小就大概與你手上的這本書相當。

——本文摘自《一輛運鈔車能裝多少錢?:輕鬆培養數感,別再被數字迷惑》,2023 年 6 月,三民出版,未經同意請勿轉載。

三民書局_96
18 篇文章 ・ 12 位粉絲
創立於1953年,為了「傳播學術思想,延續文化發展」,60年來默默耕耘著書的園地。從早期的法政大學用書、三民文庫、古籍今注新譯叢書、《大辭典》,到各式英漢字典及兒童、青少年讀物,成立至今已出版了一萬多種優良圖書。不僅讀者佳評如潮,更贏得金鼎獎、小太陽獎、好書大家讀等諸多獎項的肯定。在見證半個世紀的社會與時代變遷後,三民書局已轉型為多元、綜合、全方位的出版機構。