0

4
0

文字

分享

0
4
0

想學機器學習、深度學習、資料科學、人工智慧的人照過來! 22 個線上社群網站助你一臂之力~

活躍星系核_96
・2020/04/21 ・3064字 ・閱讀時間約 6 分鐘 ・SR值 543 ・八年級

立即填寫問卷,預約【課程開賣早鳥優惠】與送你【問卷專屬折扣碼】!

 

  • 文 / Elsa│弱弱開發女子,在東京的開發者人生。
    2011年研究所畢業,2014年來日工作。不只寫關於開發的文章,也寫美食、在日工作樣貌、在日生活訊息。

機器學習資料科學的轉行潮

資料科學家、機器學習工程師被喻為 21 世紀最性感的職業。個人認為這份職業的工作內容一點都不性感,性感的應該是它水漲船高的薪酬條件。而根據史丹佛大學 在 2019 年的  AI 指標報告, 2019 年的人工智慧相關職位需求是 2015–2016 年的三倍,意指將會有越來越多的工程師或理工生轉向資料科學家或機器學習/資料工程師的行列。

然而,轉行的學習過程中,遇到問題最好還是要靠自己解決,但中間若有高人提點,痛苦會少一點。下面列出幾個線上社群,供有興趣入門的夥伴參考:

熱門的線上社群

RedditStack OverflowQuoraKaggle 在同行裡算是家喻戶曉。

Reddit美國第五大網站,截至 2018 年 3 月的每月活躍用戶量超過三億。與在台灣熟知的 PTTDcardBBS 論壇類似,有很多分類主題,用戶可以對貼文內容按讚或留言。在搜尋欄位輸入 data science、machine learning 等關鍵字就能找到相關分類主題版加入討論。

Reddit 論壇。圖\Reddit網站截圖
在搜尋欄輸入關鍵字加入相關社群。圖\Reddit網站截圖

Stack OverflowQuora 都是問答系網站,加入會員後可以發問,還可邀請業界專家回答你的問題。

Stack Overflow 偏向程式設計領域,常見的主題有 JavaScript 、 Java 、 C# 、 Python 等程式語言。

Quora 的主題編列範圍廣泛,除了技術社群,更網羅生活娛樂、人文社會、經濟等各式主題。一樣利用網站的搜尋欄位輸入自己感興趣的關鍵字,在相關主題群裡發問。

stack overflow 問答社群。圖\ Stack Overflow 網站截圖
Quora 問答社群。圖\ Quora 網站截圖

Kaggle 除了社群,還有很多資料集、專案及社群貢獻的資料分析代碼,不定期還會有競賽,是個很好的學習資源網站。

Kaggle 社群。圖\ Kaggle 網站截圖

上述幾個社群都是英文為主,而中文社群我知道的有知乎將門技術社群TensorLayer

知乎,基本上就是中文版的  Quora ,就不多做介紹了。而專門技術社群要填表申請,通過群主審核才能加入,領域分門別類,有計算機視覺、自然語言處理、物聯網等,只能擇一加入。

至於 TensorLayer ,它其實是中國開發者把 TensorFlow 包裝起來的函式庫,據說就是親切易懂版的 TensorFlow ,他們有自己的 Slack 社群,使用上有問題可以在群裡問,在 TensorLayer 的官方 Github 有連結可加入。無論是 TensorLayer 、 TensorFlow 這種開源函式庫,為了活躍開源環境,讓開發者踴躍參與開發,幾乎都會有各自的專屬開源社群,在它們自己的開源專案網站都會具體說明如何參與社群,這邊就不多加詳述。

台灣的社群使用 Facebook 社團算滿普遍的,活躍的有台灣人工智慧同好交流區、 AI 人工智慧與機器人社團、 AI Seminar Taiwan  、台灣人工智慧學校 — 舊稱:台灣資料科學年會等;此外, PTT 的資料科學版也是一個能參與討論的選擇。

怎麼找社群?

台灣普遍習慣使用 Facebook ,在 Facebook 搜尋關鍵字就能找到幾個活躍的社群。

而在海外的朋友,可以透過 Meetup 這個活動組織網站,用關鍵字搜尋找到當地的社群。 Meetup 上的社群多屬線下,也就是租個場地舉辦研討會、讀書會等,因為要面對面與人交流,一方面不符合我的個性,一方面是有些參差不良的活動會有獵頭推銷工作機會,我不是很喜歡。當然有部分 Meetup 聚會是線上舉辦,有興趣的朋友可以自己找找看。

Meetup 社群。圖\ Meetup 網站截圖

而日本除了 Meetup ,還有幾個類似的社群如: conpass Doorkeeper TECH PLAY 。不知道出於什麼原因,日本很喜歡辦這種約出來見面的研討會或讀書會,然後會議結束後要再外掛個懇親會閒聊加吃喝,我只能說這種活動對社交障礙者真的很不友善。

針對 Slack 社群官方並沒有提供搜尋介面,雖然網路上有人把 Slack 社群爬下來做成資料庫,但資料沒那麼即時; Facebook  社團雖然可以輸入關鍵字搜尋相關社團,但是找不到私密社團。譬如在東京的澀谷,時常在 Meetup 舉辦讀書會的 Team AI ,從 2016 年開始每週開辦讀書會,到目前會員數超過七千人,官方也有 Slack 群 (Team AI Slack Group) 可加入學習討論。

像這樣利用 Meetup 等活動社群,也能知道 Slack Facebook 等線上社群的資訊。

其他線上社群

Kaggle Noobs

Kaggle Noobs 是關於 KaggleSlack 社群,線上有即時新聞、硬體效能、論文分享等學習資源。截至 2020/3 ,成員數超過一萬人。

KaggleNoobs 社群。圖\ KaggleNoobs 網站截圖

AI Researchers

AI Researchers 有關於 OpenCV自然語言處理OpenAIGymKeras 等討論串,截至 2020/3 ,成員數超過五千人。

AI Researchers 社群。圖\ AI Researchers 網站截圖

Data Quest

Data Quest 是一個培育資料科學家的線上教育網站。除了提供整套教學課程外,還有自己的社群。社群算滿活躍的,這個公司基本上招募很多遠端資料科學工作者,所以來自世界各地的資料科學家都會參與這個社群。

Dataquest 社群。圖\ Dataquest 網站截圖

Data Science Salon

Data Science Salon 在舊金山、紐約、洛杉磯等都市舉辦機器學習高峰會,跟各大公司合作並邀請各界名人演說,有點像是機器學習版的 TED Talks,收取高價門票的富人聚會(誤)。但你可以加入他們的 Slack 社群,觀察一下研討趨勢。可以到 https://info.datascience.salon/apply-to-dss-slack-workspace 填表加入社群,或寄信到 info@formulated.by  申請。

DSS Slack 社群。圖\ Data Science Salon 網站截圖

Watson Developer Community (WВC)

這個是專門給 IBM Watson 開發者討論的 Slack 社群。

R-Team for Data Analysis

使用 R 做資料分析的朋友,可以加入這個全球 Slack 社群。

有些社群知識範圍屬廣域,有些社群聚焦在特定主題,依照自己的需求及水平參與相對應的社群,多看多吸收。若有心參與社群反饋,正所謂教學相長,學習效果更好。

參考資料

  1. 2019 AI Index Report by Stanford University
  2. 15 Data Science Slack Communities to Join
  3. AI開発を仕事にするための具体的な行動計画を『機械学習エンジニアになりたい人のための本』から紹介
文章難易度
活躍星系核_96
752 篇文章 ・ 96 位粉絲
活躍星系核(active galactic nucleus, AGN)是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍,在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。 本帳號發表來自各方的投稿。附有資料出處的科學好文,都歡迎你來投稿喔。 Email: contact@pansci.asia

0

1
0

文字

分享

0
1
0
準備出國啦!Surfshark VPN 快趁黑五買起來,上網購物最安心
鳥苷三磷酸 (PanSci Promo)_96
・2022/11/01 ・2113字 ・閱讀時間約 4 分鐘

立即填寫問卷,預約【課程開賣早鳥優惠】與送你【問卷專屬折扣碼】!

 

本文由 Surfshark VPN 贊助。

兩、三年以來的防疫生活,終於迎來全面 0+7 的這一天啦!返國之後不再需要隔離的一天來了,冰友們,你是不是已經收拾好心情、收拾好行李,在進行機+酒的比價了呢?除了規劃好出國行程、找好景點與美食店家,想要讓自己不可或缺的網路生活也更加安全,一定要趁即將到來了感恩節黑五期間,把超優惠的 Surfshark VPN 服務買起來,為自己的網路生活加買最平安的保險!

Surfshark 黑五限時 18 折折扣,額外加送兩個月
專屬連結:https://lihi2.cc/8XwRN

在疫情下,網購成為了更多人的日常。不僅各樣的在地購物節為網友帶來眾多優惠,全球化的購物活動,台灣當然也不會缺席!美國感恩節(Thanksgiving)都是 11 月第四個星期四,但是感恩節後的週五,便是聖誕節前的購物佳期啟動日,這一天通常都會業績超標(在收支表上呈現正向收入(顯示為黑色字體,而非赤字的紅色字體),各家的瘋狂優惠都會在黑五祭出!相信許多精打細算的朋友,對黑五購物節絕對不陌生(很可能還搶過很多優惠!!)

網購怎能漏掉「亞馬遜」!

雅虎奇摩之於台灣,就像是亞馬遜(Amazon.com)之於美國那麼的有名!絕對也是什麼都賣、什麼都不奇怪的最佳代表。

如果你平常就很喜愛一些美國品牌,趁著黑五的日子到亞馬遜清空購物車,覺對優惠不會讓你失望。這時候,透過 Surfshark 連線到亞馬遜美國站,絕對會顯示的價格絕對讓你眼睛為之一亮,這時候最新搭載 M2 晶片的 iPad Pro,獨家支援動態島顯示的 iPhone 14 Pro,絕對是最好入手的時機。除此之外,亞馬遜平台經典的 Kindle 閱讀器,也是超合適的禮物,送禮自用兩相宜啊!另外要特別留意,購買時可以確認商品有沒有幫忙送到台灣,如果還沒有,可以先跟美國的朋友確認一下,邀請他們回國時幫你一起帶回來!

跨國追劇最爽快

對於喜愛追劇的朋友,品味可能相當豐富且多元,畢竟欣賞優秀影視作品,不現語言,更是不限地區啊!只不過,若是你訂閱 Netflix 等跨國 OTT 服務,都會有各地不同的上架影視作品,可能會讓你無法在第一時間就能夠立即「追」到劇,讓你等得心癢癢!還好這一切只要連上 Surfshark VPN 都能解決,Surfshark 支援超過 100 國的 VPN 連線,無論你想看韓國、日本還是哪一國的最新戲劇,通通讓你一秒追到最新進度!

Surfshark 黑五限時 18 折折扣,額外加送兩個月

專屬連結:https://lihi2.cc/8XwRN

出差大陸翻牆超方便

在過往出國、返國都需要隔離的階段,肯定讓不少工作上需要經常往返多國之間的朋友,感到生活驟變。所幸,在防疫政策解封之後,一切都可逐漸恢復正常。對於經常有需要到中國大陸出差的朋友,肯定都會感受到網路斷聯的不方便,因為無論是 LINE、Facebook Messenger、YouTube、Gmail 等你可很能天天都在使用的網路服務,大陸都無法使用。這還不打緊,連跟家人、朋友報平安也很不便。這時候 Surfshark 連上,就可以幫助你輕鬆「翻牆」,跟台灣親人網路無距離!

 

上網不留痕跡,不被追蹤最自由

對於一個人來說,最私密的資料之一,除了你的個資,就屬我們每天耗費大量時間逗留的網路。我們所在網路上留下的痕跡,絕對是超真實的自己,當然你不會期待這樣的自己被「搜尋引擎」、「網路廣告」公司了解得太透徹,好像你在網路上的一言一行,都被監視著。

..0000000\0;也可隱藏IP位置,避免被廣告商追蹤;更可以為你我阻擋惡意程式、釣魚軟體等,讓你防止被攻擊,以及被網路充斥的廣告打擾,好處多又多!

如果對於 Surfshark 還覺得不夠熟悉的話,不得不告訴大家,今年 Surfshark 榮獲第六屆 CyberSecurity Breakthrough 頒發的「VPN 年度最佳解決方案」(VPN Solution of the Year),也就是成為今年最推薦的 VPN 方案。CyberSecurity Breakthrough 是全球領先的獨立市場情報組織,致力於表揚當今全球資訊安全市場上的頂尖企業、技術和產品。有了他們「掛保證」,代表 Surfshark 絕對是品質、信譽都讓你安心的VPN 服務。

講了這麼多,是不是讓你感到很心動了。如果你原本就是網路重度使用者,用來上網的設備是樣樣都有,Surfshark 一個帳號就能支援所有設備,CP 值超高!趁著年度超狂黑五購物節的到來,送給你自己兩年安心無虞的網路生活,肯定是送自己的最好禮物!

Surfshark 黑五限時 18 折折扣,額外加送兩個月
專屬連結:https://lihi2.cc/8XwRN

文章難易度
鳥苷三磷酸 (PanSci Promo)_96
155 篇文章 ・ 268 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

2
2

文字

分享

0
2
2
資料科學與研究資料管理的最前沿:2022 國際資料週
研究資料寄存所 (depositar)_96
・2022/10/07 ・5342字 ・閱讀時間約 11 分鐘

立即填寫問卷,預約【課程開賣早鳥優惠】與送你【問卷專屬折扣碼】!

 

想和來自全世界的科學家、研究者、政策制定者、企業領袖等一起討論資料議題,想跟上資料科學與研究資料管理最前沿的腳步?國際資料週(International Data Week, IDW)是最好的選擇之一。

國際資料週是什麼?

「國際資料週」是由研究資料聯盟(Research Data Alliance, RDA)以及國際科學理事會(Internatioanl Science Counci, lSC)所屬的資料委員會(Committee on Data, CODATA)、世界資料系統(World Data System, WDS)所共同舉辦的資料科學盛事。自 2016 年起,通常每兩年舉辦一次,吸引近千名全球參與者。因為 COVID-19,2020 年的大會延到今年六月在首爾舉行。

國際資料週的議程由兩個大型研討會構成。例如 2022 的國際資料週,即結合了 RDA 第 19 次大會(RDA 19th Plenary Meeting)與 2022 年的科學資料會議(SciDataCon 2022 )這兩項會議。RDA 大會專注於促進資料分享與再利用的討論,SciDataCon 則著墨在研究資料的前沿議題。

2022 為 IDW 第 3 次舉行,議程為期 5 天,於今年的 6 月 20-24 日,在南韓首爾舉行,主題為「用資料改善世界」(Data To Improve Our World)。因  COVID-19 疫情,採實體與虛擬會議併行,議程總計約 150 場次。在 8 月底,RDA 大會與 SciDataCon 已將多數議程的錄影開放給所有人線上觀看(連結見本文最末)。

研究資料寄存所(depositar) 團隊也參與了本次會議,我們除加入各場次的討論外,亦參加海報徵件,向所有與會者說明我們近來在研究資料管理上的工作。筆者參與會議的部分場次,礙於篇幅,以下僅紀錄筆者感興趣的報告與討論。

場次紀錄:如何提高研究成果的可再重現或可複製性?

SUPPORTING RESEARCH TRANSPARENCY, ACCOUNTABILITY, AND REPRODUCIBILITY: LESSONS FROM THE TRENCHES

本場次專注討論研究成果在「運算」上的可再重現(reproducibility)或可複製性(replicability)。

有關研究成果可否被重現或複製,攸關該研究的可信度與透明性。美國國家學院(The National Academy of Science, Engineer, Medicine)在 2019 年出版了《科學的可重現與可複製性》報告,是研究者可參考的重要指引。

研究不可重現的原因眾多,在本場次中,來自 AGU 的 Shelly Stall 即指出,如紀錄不足、報告不透明、數位技術過時、或嘗試重現的過程有缺陷等,皆可能是研究結果無法重現的原因;要改善這類狀況,則可從分享資料與工作流程、對數位物件編配持續識別碼、強化資料引用、建立數位物件的說明等方面著手進行。

對此,來自 CURE 的講者們亦分享其機構內的作法。CURE 是由康乃爾大學、北卡羅萊納大學教堂山分校、以及耶魯大學等組成的聯盟,致力於倡議並實作研究在運算領域的可重現性。CURE 的運作環繞著四個基本原則:(1) 透明、近用、信任 (2) 可使用性 (3) 獨立性 (4) 出版前的研究重現(pre-publication)。

上述四個原則的完整說明,可在 CURE 的網頁上取得,例如獨立性即意味著可重現性必須「能在獨立的運算環境,交由獨立的第三方來確認」。

CURE 的成員亦分享了其如何實踐計算上的可重現性。例如康乃爾的社會科學中心的講者即表示,他們提供了全整合的服務(All-in-one service),除提供程式碼驗證的服務外,亦有經營資料儲存庫,將研究重現所需的資料悉數打包,存放於該機構的服務內,供他人使用或引用。

BEYOND MACHINE-ACTIONABLE DMPS – LET’S GO FORWARD TOGETHER!

本場次介紹「機器可操作的資料管理方案(machine-actionable Data Management Plans, maDMPs)」的近來發展。

DMP 是描述研究資料將如何被蒐集、使用、管理、(短期或長期)保存、分享等歷程的文件(有關 DMP 的介紹可見此)。 傳統上在撰寫 DMP 時,多是仰賴書寫以整理多方資料整理的工具與資源;而若完成的內容要挪作他用,亦多只能以人工手動進行。

為使 DMP 的內容能取用不同機器的資料,並在機器間進行順暢流通,RDA 自 2017 年起組成工作小組,擬定共通的控制語彙,以在人類可讀的條件下,實現機器可操作的 DMP。

經歷了數年的發展,採用該語彙的 maDMPs 服務亦已逐漸成形。在介紹何謂 maDMP 時,本場次講者 Tomasz Miksa 即指出,maDMP 就如各系統間的「膠水」,它能連結各個不同的研究系統,並自動將資料搬進搬出。

目前已邁入實作階段的 maDMPs 服務有歐盟資助的 Argos,其與歐盟的 OpenAIRE 和 EOSC 的相關服務進行整合,可讓研究者迅速取用不同平台的資料。

圖/Argos

DAMAP 則是另一類似的工具,其遵循 Science Europe 出版的「國際合用的研究資料管理實用指南」,以引導使用者填寫 DMP,而 DAMAP 在欄位設計上,亦遵循 RDA 工作小組所制定的標準,其匯出的 DMP 資料因此可被採用相同標準的服務自動取用。

DATA PUBLISHING IN THE OPEN SCIENCE ERA

本場次討論在自然科學領域,發布研究資料的相關議題,也討論如何消彌資料發布的障礙。

分享研究資料是開放科學的重要實踐項目之一,但在實踐上時常遭遇眾多複雜的阻礙。本場次的講者之一 Ohseok Kwon 教授分享了一篇 2014 年發表於 BMC Public Health 期刊上的文章,該文章透過實證研究,歸納出 6 類的資料分享障礙:技術、動機、經濟、政治、法律、倫理,並再進一步細分為 20 種不同的阻礙,如資料並未搜集(技術型阻礙)、欠缺信任(政治型阻礙)等。資料分享的複雜性可見一斑。

類似的研究,2021 年發表於 Scientifc Data 的研究,在向 199 名論文作者詢問資料後,亦彙整了其中 67 個拒絕分享資料的理由,「沒時間找資料」和「資料遺失」高居其中前兩名。

資料分享的困境,亦可從研究的準備工作就見端倪。來自密西根大學圖書館的報告者指出,根據其對該校所有的 DMP 進行分析的結果,僅有約 21% 的 DMP 會包含後設資料的陳述、僅有約 32% 包含了研究流程文件化的陳述,而若進一步深究兩者皆有提及的 DMP,更僅剩約 9% 左右。報告者 Jake Carlson 指出,這反映了研究人員普遍仍未意識到後設資料與文件化的建立,對研究資料分享至關重要,這是未來須強化的地方。

要改變資料分享與寄存的文化,由單一研究機構著力十分有限,跨學術機構的結盟時常是必要的。由十多個學術機構組成的「資料策展網絡(Data Curation Network, DCN)便是這樣的聯盟。

類似 DCN 的跨機構網絡,匯集了更充足的資源,可用以培訓來自各方的研究者,更完善地落實資料分享。相關網絡亦可為後續的資料策展提供一致的流程,並發展資料的策展標準。例如 DCN 即發展出了「資料策展入門(Data Curation Premier),針對不同類型的資料(如 PDF、Google 文件、Twitter 推文等)提供收藏上應有的考量與實作,供相關人員參考。

本場次的最後一部分,是由韓國科學技術研究院(Korea Institute of Science and Technology, KITSI)報告其對「資料論文」(Data Paper)的研究。資料論文是研究領域近來用以確保資料品質的重要方式之一。 根據 KITSI 的分析,全球資料論文的產量約自 2016 年後大幅上升,Elsevier 的加入,看來是造成明顯變化的主因。

CODATA-RDA SCHOOLS FOR RESEARCH DATA SCIENCE GROUP UPDATES AND NEW CHALLENGES

本場次由 CODATA-RDA School of Research Data Science 發起,討論該短期學校在經營永續性上的可能財務模式。

當代科學使用並生產了各式各樣的資料,研究人員是否具備充足的資料技能,往往是研究能否順利推展的關鍵。為此,CODATA 和 RDA 自 2016 年起,建立了 CODATA-RDA School(下稱「學校」),學校以數天至數週短期課程的方式,培力來自各國(特別是中低收入國家)研究人員相關的資料技能。

自 2016 年至今,學校所開設的課程總計已吸引逾 800 名的參與者。但如同研究資料會面臨如何永續保存的問題,資料學校也持續面臨組織如何方能永續有效運作的問題。

資料來源/CODATA-RDA Data Schools – Ignition Report

CODATA-RDA School 目前的經費主要來自各國政府或私部門所資助的專案經費(project funds)。計畫經費的使用有著用途固定、明確的優點,但也時常受到資金提供者的各種限制。

為了打造長期運作的模式,學校擘劃了兩種未來可能發展方向:小幅擴展、大幅擴展,並評估了兩類發展方式各別所需的活動及人事需求。

學校並設想了五種可能的資金來源:專案經費、CODATA 國家會員的額外資助、高教機構或研究組織的訂閱或貢獻、參與者付費、募資捐款,這五類來源可能交雜構成了未來的財務模式。

報告者也分析了各項經費來源的優缺點。例如「參與者付費」的優點,可能是學生會有較強的學習動機,學生也有正當理由去找尋不同來源的經費支持;但缺點則是學生可能對課程有較高的期待,而目前僅靠志願講師擔綱的課程,可能無法達到對應的要求等。

議程並邀請參與者針對各種可能資金來源集思廣益,例如提供可能資金贊助者的名單、或建立需求者間的國際網絡等,都是會議上曾被提出的建議。

或許是議程本身定位在意見蒐集,本場次在討論上並未有明確的結論。但可預見的是,隨著資料的重要性日益提升,這些與資料基礎建設攸關的學術財務或行政議題,在未來只會越來越受到重視,並不斷浮上檯面被討論。

海報:研究資料寄存所推展研究資料管理的現況 – ADVOCATING GOOD DATA PRACTICES: FROM RESEARCH DATA REPOSITORY TO RESEARCH DATA MANAGEMENT

除工作坊的議程外,RDA 大會歷來亦會有海報徵件的活動,讓研究者能透過自製海報,向與會者展示近來的工作成果。研究資料寄存所(depositar)在本次會議中也投稿海報,並順利入選

作為資料儲存庫的經營者,我們以「提倡良好的資料實務:從研究資料儲存庫到研究資料管理」為題,簡述台灣在研究資料管理的現況與背景、depositar 在推廣研究資料管理上的實踐、所習得的教訓、並描繪了研究資料管理與資料儲存庫的互動關係。

小結

確保資料具良好品質、可相互操作、可長期保存等特性,是以資料為底的科學研究能被持續推展的基礎。參與跨國界的科學合作,它們更是須被優先處理的基本議題。這些基本議題時常是由技術、經濟、政策、與法律等多面向交織而成,它們也構成了 International Data Week 多數議程的討論核心。

略嫌可惜的是,台灣對於這些基礎議題的討論與實踐仍少,國際會議的參與人數也不多。

但無論如何,2022 年國際資料週的所有場次(含 SciDataCon 2022 和 RDA Plenary 19)錄影均已在 8 月底公開,如有興趣一覽本次議程內容,可至以下網址,再次回顧這個全球的科學資料盛事。

研究資料寄存所 (depositar)_96
2 篇文章 ・ 2 位粉絲
研究資料寄存所 (depositar) 是由研究人員建立的線上資料儲存庫。所有人都能使用這個平台,自由地儲存、尋找、再次使用研究資料。

0

5
1

文字

分享

0
5
1
從「自動化」進化成「智動化」——智慧製造是半導體產業的未來趨勢
鳥苷三磷酸 (PanSci Promo)_96
・2022/08/15 ・3611字 ・閱讀時間約 7 分鐘

立即填寫問卷,預約【課程開賣早鳥優惠】與送你【問卷專屬折扣碼】!

 

  • 文/曾繁安

台灣擁有傲視全球、成熟完整的半導體產業聚落,在世界科技領域中扮演舉足輕重的角色。這個國家的經濟命脈,經過全自動化的時代後,即將迎來另一次生產技術的大變革——智慧製造。

當訂單越來越多,人力卻不夠,半導體業者該怎麽辦?

半導體產業包含了矽晶圓[註]、相關化學品與氣體及導線架等封裝材料,其中又以晶圓厰為大宗,例如台積電便是全球規模最大的晶圓代工厰。素有「現代科技應用的大腦與心臟」之稱的半導體,是現代多數電子產品的核心單元,因為各項產品正是利用半導體電導率變化的特性來處理資訊。然而,目前半導體製造業卻面臨人力資源跟不上產量需求提高的挑戰。

晶圓是積體電路製程中的載體基片。圖/wikimedia

一般半導體廠場域面積大,人力短缺使企業面臨管理人手吃緊,再加上人員進出無塵室的過程繁瑣耗時,也是另一大負擔。與此同時,在廠內儀器參數比對和規劃生產計劃上,傳統人力也可能有出現誤差的風險。疫情時代也促成在宅經濟和 5G 應用的高速發展,各領域對晶片的需求大增,造成半導體產業出現產量需求高,但人力短缺的現象。

因此對不少業者而言,可有效緩解人力不足、大幅提升作業效率的數位轉型(Digital Transformation),可謂勢在必行。

從「自動化」升級到「智動化」的智慧製造

那半導體產業的數位轉型,該怎麽做?所謂數位轉型,不僅僅只是將資料或作業數位化,還包括導入人工智慧(Artificial Intelligence,簡稱 AI)與數位科技,來改變企業的整個營運生產模式。AI 指的是電腦程式可模擬人類思維過程的能力,而在 AI 概念下的機器學習(Machine Learning,簡稱 ML),即為機器可以根據已收集的大量數據,經由建立模型對新數據進行推測,學習找出最佳解、改善效能

結合 ML 的製造執行系統,需搭配裝置在工廠各處的多個傳感器(Sensor),來收集與回傳各樣的生產數據。它們與工廠設備的相互連接,即是運用了物聯網(Internet of Things)的技術。有賴於 5G 科技的發展,數據可以達成高速率傳輸與低延遲,使得機器與機器之間可以達成溝通,在整合分析各方數據資訊後,有效率地完成各種指令操作,可以比自動化製造系統,更進一步為人類代勞工廠運作的大小事務。

舉例來説,當工廠的生產過程出現問題,自動化系統只會跳出異常通知,還是需要仰賴人員來進行手動排除;但換作應用 ML 系統的話,便可透過自我學習,來自動調整製作流程以解除異常狀況,無需人力介入便可自主解決,提升良率,達成「智動化」智慧製造(Smart Manufacturing)的最終目的。

機器可以根據已收集的大量數據,經由建立模型對新數據進行推測,學習找出最佳解、改善效能。 圖/elements

懂得精益求精、提高品質產量的智慧工廠

一座運用智慧製造的半導體工厰,不但能自主克服製程中的疑難雜症,更能幫助提高晶圓的產量品質。在研發方面,AI 可以協助理解高複雜、高維度的製程開發挑戰,也可與 ML 軟體分析感測資料和檢測影響,進行品質管理與缺陷檢查。

此外,數據治理和數位分身,也是智慧製造的關鍵策略。對企業整體的數據進行管理和控制以提高數據的價值將因為數據產生的成本風險降到最低,是數據治理(Data Governance)的核心精神。

在兼顧資訊安全下,數據治理的體系能使跨部門間的數據共享更為方便暢通。輔以 AI 及 ML 的運算,便可以使業務部門的客戶需求、供應鏈管理等資料,與工廠生產部門的設備控制與品管等流程,有更迅速緊密的配合,規劃好合適的未來生產計劃,指導人員進行相關作業。

如同我們可以在電玩游戲或社交媒體上,按照自己的個人形象,來打造自己的虛擬化身,工厰也能藉助現今的科技,來為產品的物理實體,在資訊化平臺或系統的虛擬空間中,打造一個類比實物數位分身(Digital Twin)

數位分身模型之概念圖。圖/wikimedia

數位分身也是物聯網的應用之一,半導體廠中,由傳感器所收集到的晶圓製造數據,在 AI、ML 和軟體分析的協助下被整合,對映成數位空間中「雙胞胎」的存在。這位孿生兄弟不僅能夠隨物理實體的變化而即時做出相應變化,還可以提供無法在實體產品上測試計算的數據。

理想情況下,數位分身可以經由機器學習,分析過去的歷史資料或多重來源的數據,來推估實體的未來情境。因此在危機或異常事件發生前,業者便可預先進行預測性的設備維護與產品的良率分析,比起傳統人力的判斷更加精確,降低技術風險,大大提高生產效率。

工業 4.0 浪潮來襲,智慧製造是產業未來趨勢

運用通訊科技、資料庫和電腦系統達成全自動化生產,已不是新鮮事,如今人類社會正迎來第四次工業革命的新一波浪潮。主打網絡與機械相互連接的核心精神,導入人工智慧、機器學習、物聯網感測與大數據分析等人機協作的智慧製造,是因應多變市場需求的時下趨勢。

在半導體領域中,企業龍頭台積電可説是數位轉型的成功案例,從二十年前的全自動化製造系統,如今致力於打造組織內部友善 AI 的工作環境,努力向智慧製造全面轉型。數位轉型的技術支援不能沒有半導體產業製造的晶片,而如今數位轉型也有望帶領半導體產業突破產能吃緊、人才短缺的困境,走向智慧製造的新紀元。

以台灣在地企業的智慧製造覆蓋率而言,就已在短短 6 年內成長 50%。舉全台最大的國際半導體展 SEMICON Taiwan 為例,智慧製造相關的展商在近六年內的成長幅度也同樣攀升了 50%。

今年高科技智慧製造特展將以歷年最大規模之姿登場,與全台最大半導體盛宴 SEMICON Taiwan 2022 國際半導體展同期同地舉辦,匯集橫跨高科技製造業智慧製造解決方案業者、系統整合、軟硬體商及智慧製造需求端業者,如盟立自動化、倍福自動化、家登精密、攝揚企業、日商 JEL 等不容錯過。

今年高科技智慧製造特展將以歷年最大規模之姿登場,與全台最大半導體盛宴 SEMICON Taiwan 2022 國際半導體展同期同地舉辦。圖/SEMI

因應疫情下數位轉型成為全球企業的重要任務,今屆展覽中的「高科技智慧製造論壇」將由美光科技、 Lam Research、 Rockwell Automation、Siemens 等知名企業專家以人工智慧工廠為主軸,探討 GEC 技術藍圖,內容包含五個部分包含數據管理、智能分析、數位分身預測等重點實務經驗分享,從晶圓厰到設備製造商和解決方案提供者的角度,讓參與者得以探究 AI 智能工廠的前景和挑戰,跟上數位轉型的步伐。

除了智慧製造議題,展覽期間共有超過 20 場重磅級的國際趨勢論壇,豐富主題涵蓋先進製程、異質整合、化合物半導體、車用晶片、永續製造、半導體資安及人才。論壇將在今年 9 月 13 日率先開幕,展覽則於 9 月 14 日至 16 日於臺北南港展覽館一館盛大開場,規模創歷年新高,届時將有 700 間國內外指標性大廠共襄盛舉,現場將有 2,450 個攤位展出,完整串聯全球半導體供應鏈,目前展會參觀與論壇皆已開放報名,參與席次有限,有興趣者趕快手刀至官網報名起來!

註:晶圓(Wafer)是半導體晶體圓形的簡稱,是從半導體材料如最常見的矽,經過拉製、提煉等一系列處理過程,製成的圓柱狀半導體晶體經過切片、抛光而來。這些圓形薄切片被用於積體電路製程中的載體基片,也可用來製作太陽能電池。

參考資料

  1. 半導體是什麼?晶片產業一次看懂
  2. About SEMI Smart Manufacturing initiative
  3. 【獨家披露】台積電數位轉型的下一步,靠AI推動全面轉型(上
  4. 【獨家披露】台積電數位轉型的下一步,靠AI推動全面轉型(下)
  5. 泛科學:每分鐘 15 次的駭客攻擊,5G 世代的臺灣資安挑戰——資安所王仁甫策略總監專訪
  6. Data Governance – 臺灣人工智慧行動網
  7. 「數據治理」:人工智慧企業的基本功
  8. 科技大觀園:從全自動化製造邁向智慧製造
  9. 聯剛科技股份有限公司
  10. 【新興領域:9月焦點8】數位分身(Digital Twin)技術發展趨勢與不同層次應用模式
  11. 半導體資安的新挑戰!後疫情時代,如何全面打造半導體供應鏈數位韌性
  12. 工業4.0大全,從淺到深一篇搞懂它!
鳥苷三磷酸 (PanSci Promo)_96
155 篇文章 ・ 268 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia