分享本文至 E-mail 信箱
學術引用格式
MLA
APA
EndNote(.enw)

大數據專題導言:我們真的認識 Big Data 的「科學」嗎?

2016/05/24 | | 標籤:

文 / 陳妤寧

Big Data's definition illustrated with texts

Big Data’s definition illustrated with texts (Author: Camelia.boban)

關於 Big Data(大數據)能夠如何在網路世代改變人們的生活,只要上網搜尋即可查閱到國內外大量的文章。不過,究竟神奇的 Big Data 要如何運作?和十多年前的 Data Mining(資料採礦)又有何異曲同工?除了資工之外,數學、統計等其他學門在資料科學中分別扮演什麼角色?在股市、在民調、在醫療等形形色色的領域之中,是否已經是能夠被成熟運用的產品了呢?

本次大數據專題要揭開大數據科學的面紗,專訪五位精通於不同資料科學領域的專家,讓我們即使從外行麻瓜的角度,也能了解大數據背後能夠如何運作的科學原理。

在展開資料分析之前,「資料」真的能夠完整呈現「真實世界」的全貌嗎?我們想問的問題,都能從手上的資料中得到解答嗎?本專題專訪了社會企業DSP智庫驅動的知識長謝宗震,從統計人的角度,細細討論了在分析資料前應該如何「思考」資料,以及統計人面對大數據時代的非結構化資料,應如何迎接挑戰。→ 資料科學如何解決真實世界的問題?認識資料極限,打開分析視野-專訪DSP智庫驅動知識長謝宗震

台大資工系的林守德副教授,則從機器學習的角度出發,從社群網站的個人化推薦、地圖 APP 提供的最佳路徑等案例分享,主張未來時代的機器人,將跳過「報表」階段,直接為人類做出最佳的決策。而人類不應為此恐慌,而是進化到下一階段、找出更多電腦所無法辦到的事情。→ 運用海量資料讓機器「自學」,電腦將成為更好的決策代理人-專訪台大資工教授林守德

談到社群網站帶來的海量資料,不可忽略語意分析的關鍵地位。語意分析讓選前的民意調查能夠更廣泛的涵蓋到各種更「非正式」的網路意見,也不再侷限於以數字獨霸的數據資料,更深入拆解文字背後隱含的正面或負面情緒意涵,甚至能夠藉此更快掌握並預測事件的發生。創辦意藍科技的楊立偉董事長,深入介紹了語意分析的觀念、應用和挑戰。→ 不是只有數字才是數據,語意分析讓電腦掌握文字背後的情感-專訪意藍科技董事長楊立偉

大數據的本質在於資料,東吳大學的助理教授吳牧恩認為,從小資料到大資料,都是數學這個學門能夠積極介入、加以演算和預測的。電腦硬體的運算速度,必須加上演算法的加持,才能提升解題效率、降低運算的複雜度,尋求出最佳解。→ 從演算法設計到金融交易應用,數學在資料科學中無所不在-專訪東吳數學系教授吳牧恩

最後,在分析結果的可靠問題上,是典通科技的總經理楊雅惠著墨最深的。為了優化分析模型,深入研究大眾在網路上發表意見的行為模式可以做出更好的判斷,讓「大」數據獲得精緻化的可能。而在醫療資料的分析上,她則認為除了常見的隱私問題之外,也存在著多元採集設備之間缺乏共同標準的挑戰。→ 提昇大數據可信度,統計學用機率和抽樣優化分析模型-專訪典通公司總經理楊雅惠

數據和資料從古到今都是人類尋求解答的重要材料,而網路時代的資料來源變多也變雜,不論是語意分析、機器學習、演算法、統計建模,眾多方法都試圖解決更多過去人類仰賴臆測萊處理的問題。看完這五位不同背景和專長的專家分享了他們的見解後,對於所謂大數據的定義和視野,也隨之更為寬廣了。

(本文由科技部補助「新媒體科普傳播實作計畫-智慧生活與前沿科技科普知識教育推廣」執行團隊撰稿)

責任編輯:鄭國威

2017 年泛知識節 早腦人必搶的早鳥優惠開跑啦!

「3 大領域 x 150 場分享、體驗、工作坊 x 200 個意見領袖 x 1000 個參與者」2017 年兩岸三地最大知識饗宴 – “泛・知識節" 早鳥票開賣啦!

由泛科知識旗下 PanSci 科學新聞網、 娛樂重擊 Punchline、PanX 泛科技新聞網聯合超強協力夥伴,邀你在兩天內火拼知識,替自己的大腦做個版本升級。11月 11&12 日到泛.知識節直搗知識核心,挑戰與創造未知 ∞ 種可能!手腳迅速,眼光精準的早腦人如你,還不速速搶下早鳥優惠及獨家周邊商品!(購票還贈 TAAZE 讀冊生活折價卷)

>>早鳥優惠只到 10/27<<

關於作者

熱愛將知識拆解為簡單易懂的文字,喜歡把一件事的正反觀點都挖出來思考,希望用社會科學的視角創造更宏觀的視野。