要證明自己是人類很不容易 ── Google意外破解驗證碼檢核機制

-----廣告,請繼續往下閱讀-----
source:Didier Jansen

每當我們要申請網路會員或在論壇中留言時,常會出現類似上方圖片中的驗證碼(captcha),這驗證碼通常由歪歪扭扭的英文字母或數字組成,我們必須正確輸入該組驗證碼,才能通過檢核、順利完成登入程序,但這項檢核機制卻意外地被Google研發的演算法給破解了。

以前我們總認為,電腦的功能再強大,人腦還是有無法取代之處──人腦可以辨認扭曲的文字,而電腦只能辨認工整的文字。許多網站就利用這項特點,在網站中設置驗證碼檢核機制,防止惡意的網路機器人入侵網站。不過,現在人腦與電腦之間的這項差異恐怕已不復見。

驗證碼檢核機制會被破解其實是個意外。一開始,Google地圖的街景服務小組只是想發明一種圖像識別演算法,讓電腦可以準確辨認街景照片中的門牌號碼。

過去的演算法都將識別圖像或文字的技術分成定位〈localization〉、切割〈segmentation〉、辨識〈recognition〉三個步驟處理,但Google街景車傳回圖像中的門牌號碼在明暗度、數字排列及字體各方面都不盡相同,辨識難度也提高許多。因此,Google團隊發明圖像識別演算法,利用複雜的機制將三個步驟結合,讓電腦能夠直接分辨圖像中的數字。

-----廣告,請繼續往下閱讀-----

有趣的是,後來他們發現這個演算法也可應用於辨認網站的驗證碼,而且其準確率高達96%。若再結合Google集眾人之力來辨識文件內容的 reCAPTCHA計畫,準確率甚至會達到99%。

Google產品經理維奈•謝特(Vinay Shet)表示,這其實是個好消息,這證明了只靠驗證碼來保護網站是不夠的。他也說道,為了防止網路機器人的入侵,Google也已經在網站中嵌入新的檢核機制。

資料來源:

 

-----廣告,請繼續往下閱讀-----
afore

泛科學特約編譯作者。一個很容易臉紅的女生,最想去的國家是印度。

View Comments