- 文 / Elsa│弱弱開發女子,在東京的開發者人生。
2011年研究所畢業,2014年來日工作。不只寫關於開發的文章,也寫美食、在日工作樣貌、在日生活訊息。
機器學習資料科學的轉行潮
資料科學家、機器學習工程師被喻為 21 世紀最性感的職業。個人認為這份職業的工作內容一點都不性感,性感的應該是它水漲船高的薪酬條件。而根據史丹佛大學 在 2019 年的 AI 指標報告, 2019 年的人工智慧相關職位需求是 2015–2016 年的三倍,意指將會有越來越多的工程師或理工生轉向資料科學家或機器學習/資料工程師的行列。
然而,轉行的學習過程中,遇到問題最好還是要靠自己解決,但中間若有高人提點,痛苦會少一點。下面列出幾個線上社群,供有興趣入門的夥伴參考:
熱門的線上社群
Reddit、Stack Overflow、Quora、Kaggle 在同行裡算是家喻戶曉。
Reddit 是美國第五大網站,截至 2018 年 3 月的每月活躍用戶量超過三億。與在台灣熟知的 PTT 或 Dcard 等 BBS 論壇類似,有很多分類主題,用戶可以對貼文內容按讚或留言。在搜尋欄位輸入 data science、machine learning 等關鍵字就能找到相關分類主題版加入討論。
Stack Overflow 和 Quora 都是問答系網站,加入會員後可以發問,還可邀請業界專家回答你的問題。
Stack Overflow 偏向程式設計領域,常見的主題有 JavaScript 、 Java 、 C# 、 Python 等程式語言。
Quora 的主題編列範圍廣泛,除了技術社群,更網羅生活娛樂、人文社會、經濟等各式主題。一樣利用網站的搜尋欄位輸入自己感興趣的關鍵字,在相關主題群裡發問。
Kaggle 除了社群,還有很多資料集、專案及社群貢獻的資料分析代碼,不定期還會有競賽,是個很好的學習資源網站。
上述幾個社群都是英文為主,而中文社群我知道的有知乎、將門技術社群、 TensorLayer 。
知乎,基本上就是中文版的 Quora ,就不多做介紹了。而專門技術社群要填表申請,通過群主審核才能加入,領域分門別類,有計算機視覺、自然語言處理、物聯網等,只能擇一加入。
至於 TensorLayer ,它其實是中國開發者把 TensorFlow 包裝起來的函式庫,據說就是親切易懂版的 TensorFlow ,他們有自己的 Slack 社群,使用上有問題可以在群裡問,在 TensorLayer 的官方 Github 有連結可加入。無論是 TensorLayer 、 TensorFlow 這種開源函式庫,為了活躍開源環境,讓開發者踴躍參與開發,幾乎都會有各自的專屬開源社群,在它們自己的開源專案網站都會具體說明如何參與社群,這邊就不多加詳述。
台灣的社群使用 Facebook 社團算滿普遍的,活躍的有台灣人工智慧同好交流區、 AI 人工智慧與機器人社團、 AI Seminar Taiwan 、台灣人工智慧學校 — 舊稱:台灣資料科學年會等;此外, PTT 的資料科學版也是一個能參與討論的選擇。
怎麼找社群?
台灣普遍習慣使用 Facebook ,在 Facebook 搜尋關鍵字就能找到幾個活躍的社群。
而在海外的朋友,可以透過 Meetup 這個活動組織網站,用關鍵字搜尋找到當地的社群。 Meetup 上的社群多屬線下,也就是租個場地舉辦研討會、讀書會等,因為要面對面與人交流,一方面不符合我的個性,一方面是有些參差不良的活動會有獵頭推銷工作機會,我不是很喜歡。當然有部分 Meetup 聚會是線上舉辦,有興趣的朋友可以自己找找看。
而日本除了 Meetup ,還有幾個類似的社群如: conpass 、 Doorkeeper 、 TECH PLAY 。不知道出於什麼原因,日本很喜歡辦這種約出來見面的研討會或讀書會,然後會議結束後要再外掛個懇親會閒聊加吃喝,我只能說這種活動對社交障礙者真的很不友善。
針對 Slack 社群官方並沒有提供搜尋介面,雖然網路上有人把 Slack 社群爬下來做成資料庫,但資料沒那麼即時; Facebook 社團雖然可以輸入關鍵字搜尋相關社團,但是找不到私密社團。譬如在東京的澀谷,時常在 Meetup 舉辦讀書會的 Team AI ,從 2016 年開始每週開辦讀書會,到目前會員數超過七千人,官方也有 Slack 群 (Team AI Slack Group) 可加入學習討論。
像這樣利用 Meetup 等活動社群,也能知道 Slack 、 Facebook 等線上社群的資訊。
其他線上社群
Kaggle Noobs
Kaggle Noobs 是關於 Kaggle 的 Slack 社群,線上有即時新聞、硬體效能、論文分享等學習資源。截至 2020/3 ,成員數超過一萬人。
AI Researchers
AI Researchers 有關於 OpenCV 、自然語言處理、 OpenAIGym 、 Keras 等討論串,截至 2020/3 ,成員數超過五千人。
Data Quest
Data Quest 是一個培育資料科學家的線上教育網站。除了提供整套教學課程外,還有自己的社群。社群算滿活躍的,這個公司基本上招募很多遠端資料科學工作者,所以來自世界各地的資料科學家都會參與這個社群。
Data Science Salon 在舊金山、紐約、洛杉磯等都市舉辦機器學習高峰會,跟各大公司合作並邀請各界名人演說,有點像是機器學習版的 TED Talks,收取高價門票的富人聚會(誤)。但你可以加入他們的 Slack 社群,觀察一下研討趨勢。可以到 https://info.datascience.salon/apply-to-dss-slack-workspace 填表加入社群,或寄信到 info@formulated.by 申請。
Watson Developer Community (WВC)
這個是專門給 IBM Watson 開發者討論的 Slack 社群。
R-Team for Data Analysis
使用 R 做資料分析的朋友,可以加入這個全球 Slack 社群。
有些社群知識範圍屬廣域,有些社群聚焦在特定主題,依照自己的需求及水平參與相對應的社群,多看多吸收。若有心參與社群反饋,正所謂教學相長,學習效果更好。
參考資料
- 2019 AI Index Report by Stanford University
- 15 Data Science Slack Communities to Join
- AI開発を仕事にするための具体的な行動計画を『機械学習エンジニアになりたい人のための本』から紹介