分享本文至 E-mail 信箱
學術引用格式
MLA
APA
EndNote(.enw)

要證明自己是人類很不容易 ── Google意外破解驗證碼檢核機制

4592374689_0554aac793_z

source:Didier Jansen

每當我們要申請網路會員或在論壇中留言時,常會出現類似上方圖片中的驗證碼(captcha),這驗證碼通常由歪歪扭扭的英文字母或數字組成,我們必須正確輸入該組驗證碼,才能通過檢核、順利完成登入程序,但這項檢核機制卻意外地被Google研發的演算法給破解了。

以前我們總認為,電腦的功能再強大,人腦還是有無法取代之處──人腦可以辨認扭曲的文字,而電腦只能辨認工整的文字。許多網站就利用這項特點,在網站中設置驗證碼檢核機制,防止惡意的網路機器人入侵網站。不過,現在人腦與電腦之間的這項差異恐怕已不復見。

驗證碼檢核機制會被破解其實是個意外。一開始,Google地圖的街景服務小組只是想發明一種圖像識別演算法,讓電腦可以準確辨認街景照片中的門牌號碼。

過去的演算法都將識別圖像或文字的技術分成定位〈localization〉、切割〈segmentation〉、辨識〈recognition〉三個步驟處理,但Google街景車傳回圖像中的門牌號碼在明暗度、數字排列及字體各方面都不盡相同,辨識難度也提高許多。因此,Google團隊發明圖像識別演算法,利用複雜的機制將三個步驟結合,讓電腦能夠直接分辨圖像中的數字。

有趣的是,後來他們發現這個演算法也可應用於辨認網站的驗證碼,而且其準確率高達96%。若再結合Google集眾人之力來辨識文件內容的 reCAPTCHA計畫,準確率甚至會達到99%。

Google產品經理維奈•謝特(Vinay Shet)表示,這其實是個好消息,這證明了只靠驗證碼來保護網站是不夠的。他也說道,為了防止網路機器人的入侵,Google也已經在網站中嵌入新的檢核機制。

資料來源:

 

想要耳聽分享,嘴吃熱炒、手領好書、同時認識一大群愛科學的朋友嗎?

「生猛科學」的特色是:

  1. 只在台灣南部舉辦(精準一點的定義是雲林以南,一直到屏東)。
  2. 只找當地最生猛的科學人擔任講者。
  3. 只談在地的科學,或是在地人最關注的科學。
  4. 只在最生猛的生猛熱炒舉辦。

我們希望透過「生猛科學」系列活動,更認識在地科學社群,並且讓在地的科學除了讓更多在地人知道以外,也透過PanSci的網絡傳得更遠。好久沒辦了想要見見最生猛的你,限量 25 個名額!報名還可獲得科普好書一本,原價800元,現在只要600元!

[報名 10/1 (日)生猛科學@高雄]

關於作者

afore

泛科學特約編譯作者。一個很容易臉紅的女生,最想去的國家是印度。