要證明自己是人類很不容易 ── Google意外破解驗證碼檢核機制

每當我們要申請網路會員或在論壇中留言時，常會出現類似上方圖片中的驗證碼（captcha），這驗證碼通常由歪歪扭扭的英文字母或數字組成，我們必須正確輸入該組驗證碼，才能通過檢核、順利完成登入程序，但這項檢核機制卻意外地被Google研發的演算法給破解了。

以前我們總認為，電腦的功能再強大，人腦還是有無法取代之處──人腦可以辨認扭曲的文字，而電腦只能辨認工整的文字。許多網站就利用這項特點，在網站中設置驗證碼檢核機制，防止惡意的網路機器人入侵網站。不過，現在人腦與電腦之間的這項差異恐怕已不復見。

驗證碼檢核機制會被破解其實是個意外。一開始，Google地圖的街景服務小組只是想發明一種圖像識別演算法，讓電腦可以準確辨認街景照片中的門牌號碼。

過去的演算法都將識別圖像或文字的技術分成定位〈localization〉、切割〈segmentation〉、辨識〈recognition〉三個步驟處理，但Google街景車傳回圖像中的門牌號碼在明暗度、數字排列及字體各方面都不盡相同，辨識難度也提高許多。因此，Google團隊發明圖像識別演算法，利用複雜的機制將三個步驟結合，讓電腦能夠直接分辨圖像中的數字。

-----廣告，請繼續往下閱讀-----

有趣的是，後來他們發現這個演算法也可應用於辨認網站的驗證碼，而且其準確率高達96%。若再結合Google集眾人之力來辨識文件內容的 reCAPTCHA計畫，準確率甚至會達到99%。

Google產品經理維奈•謝特（Vinay Shet）表示，這其實是個好消息，這證明了只靠驗證碼來保護網站是不夠的。他也說道，為了防止網路機器人的入侵，Google也已經在網站中嵌入新的檢核機制。

資料來源：