首頁 > 智能時代>人工智能

驗證碼的前世今生

中興文檔 2022/10/15 18:28:23 責(zé)編：遠生

評論：

“你永遠不知道，網(wǎng)絡(luò)對面坐的一個人還是一只狗”

--網(wǎng)友戲說

視頻、出行、購物等網(wǎng)站的使用者，就一定是人類嗎？會不會是偽裝成“人類”的計算機呢？

為了能夠識別人類和計算機，“驗證碼”應(yīng)運而生。

驗證碼的前世今生

今天，讓我們了解一下驗證碼的前世今生吧！

01、先了解什么是“圖靈測試”

從 1946 年世界上第一臺計算機出現(xiàn)開始，聰明的人類就已經(jīng)考慮計算機發(fā)展到替代人類的可能性。艾倫?麥席森?圖靈，被稱為計算機科學(xué)之父、人工智能之父，專門設(shè)計了一個著名的“圖靈測試”，用來判定計算機能否在智力行為上表現(xiàn)得和人無法區(qū)分。

驗證碼的前世今生

當(dāng)主持人問了 1 個問題，然后無法從 2 個解答中分辨出誰是人類、誰是計算機時，就表明計算機的智能水平已經(jīng)與人類沒有差異了。

“圖靈測試”是由人類來判斷：誰是計算機？誰是人類？

最重要的目的，是識別出計算機。

02、反過來的“圖靈測試” 就是驗證碼

那么“驗證碼”，是由計算機來判斷：誰是人類？誰是計算機？

最重要的目的，是識別出人類。

這一點，可以從驗證碼的中英文全稱中看出來：CAPTCHA（Completely Automated Public Turing Test to Tell Computers and Humans Apart，全自動區(qū)分計算機和人類的公開圖靈測試），又名 HIP（Human Interaction Proof，人類交互行為證明）。

最典型的驗證碼，如下圖所示。

驗證碼的前世今生

以目前的眼光來看，這個驗證碼確實略顯簡陋。

但是在計算機技術(shù)還不發(fā)達的年代，這樣的驗證碼，已經(jīng)足以識別出人類：

只有人類，才能識別出驗證碼中被嚴重扭曲的字母或者數(shù)字；

而計算機，則無法識別。

基于這樣的驗證碼，各種計算機系統(tǒng)（例如：網(wǎng)站、郵箱等）成功識別到真正的人類后，允許人類繼續(xù)操作，比如：登錄郵箱、投票等。

03、為“保護”而生的驗證碼

當(dāng)各種計算機系統(tǒng)無法識別人類和計算機時，計算機技術(shù)也能給人類帶來麻煩，例如：

郵箱的泛濫注冊，導(dǎo)致垃圾郵件滿天飛；

投票的野蠻刷票，導(dǎo)致投票結(jié)果不公正；

車票的插件搶占，導(dǎo)致返鄉(xiāng)車票買不到。

1999 年一個網(wǎng)站發(fā)起的在線投票，推選全美計算機科學(xué)專業(yè)最好的學(xué)校時，按理來說是一個人投一張票。但是投票網(wǎng)站在設(shè)計的時候，沒有考慮太多，只以投票者所在計算機的 IP 地址作為判斷依據(jù)。

于是有人編寫了計算機腳本進行批量刷票：每次投票完后更改一個 IP 地址，然后繼續(xù)投票。這樣的話，有成千上萬個 IP 地址就代表了成千上萬個不同的人，就可以投成千上萬票。

這樣的計算機技術(shù)，無疑是影響到了整個投票的公平性。

所以說，各種計算機系統(tǒng)，需要一個堅固的“盾”來保護自己。

實際上，第一種驗證碼（字符型）的出現(xiàn)，就是為了對抗“自動刷票”這種計算機技術(shù)的。

04、越來越堅固的“盾”

那么你知道都有哪些千奇百怪的“驗證碼”嗎？

01、字符型

字符型驗證碼，是我們?nèi)粘Ｗ罱?jīng)常見到的驗證碼。通常是一些字母、數(shù)字的組合，而且為了增加識別的難度，這些字符經(jīng)常會被變形、被扭曲、被翻轉(zhuǎn)。

驗證碼的前世今生

隨著計算機技術(shù)的發(fā)展，字符型驗證碼的安全程度在降低，逐漸被其他類型驗證碼替代。

02、計算型

計算型驗證碼，通常是一些數(shù)學(xué)公式，需要人類發(fā)動聰明的大腦進行復(fù)雜的運算，才能得出正確的結(jié)果。

驗證碼的前世今生

很遺憾，這種可以提供較高安全性的驗證碼，雖然計算機很難識別，但是大部分人類自己也覺得很難。所以計算型驗證碼，并沒有廣泛應(yīng)用過。

03、點擊型

點擊型驗證碼的最大特點是：使用者只需要通過鼠標進行點擊，不需要輸入任何東西。通過這種人類專屬的行為動作，以及使用者在瀏覽器中的一些操作數(shù)據(jù)、瀏覽數(shù)據(jù)等，共同識別出真正的人類。

驗證碼的前世今生

點擊型驗證碼的安全性較高，而且用戶體驗較好。

在一些重要的計算機系統(tǒng)，例如：動車售票網(wǎng)站、大型購物網(wǎng)站、大型視頻網(wǎng)站等用戶量較大、數(shù)據(jù)安全要求高的地方，采用點擊型驗證碼，可以有效識別人類，避免其他計算機的攻擊。

04、滑動型

滑動型驗證碼通過收集使用者的動作，判斷是否為人類。例如：人類拖動滑塊的軌跡會是一個先快后慢的過程：先快速拖動，后慢慢對齊，再瞬間釋放。

驗證碼的前世今生

這種驗證碼的用戶體驗較好，雖然被計算機技術(shù)突破的成功率也有 60% 以上，但是計算機技術(shù)模擬人類行為的成本較大，得不償失。

05、短信型

短信型驗證碼，是最常用的一種方式。各種 App 一般會采用這種方式，簡單直接，通過運營商來發(fā)送短信，安全上有保障。

驗證碼的前世今生

每個驗證碼與手機號碼相對應(yīng)而且一般有效期僅為 60 秒~90 秒，不留其他人鉆空子的機會。

06、掃碼型

掃碼型驗證碼，實際上就是首先確保在手機上已經(jīng)成功登錄，然后通過掃描二維碼的方式在 PC 上繼續(xù)登錄。這是如今各大視頻網(wǎng)站、購物網(wǎng)站的常用方法。

驗證碼的前世今生

讓人類自己去驗證人類自己，嘿，這方法真棒。

07、生物特征型

各種人臉識別、指紋識別、聲紋識別甚至虹膜識別，都可以算作是生物特征型驗證碼。使用起來更加簡單，而且因為這些生物特征在每個人類中的獨特性，猶如一把專屬鑰匙，具備較高的安全性。

05、越來越鋒利的“矛”

雖然“盾”很堅固，但是隨著計算機技術(shù)的不斷進步，鋒利的“矛”也層出不窮。

為了突破驗證碼的保護，發(fā)展出了以下的計算機技術(shù)：

01、OCR 技術(shù)

OCR （Optical Character Recognition，光學(xué)字符識別）技術(shù)，可以將圖片、照片上的文字內(nèi)容，直接轉(zhuǎn)換為可編輯的文本。

2003 年有人通過圖像識別算法（Shape Context）對簡單字符型的驗證碼進行自動化識別，可以達到 93% 的成功率。

驗證碼的前世今生

OCR 技術(shù)僅能攻破一些簡單的字符型驗證碼，稍微復(fù)雜一些（比如扭曲、翻轉(zhuǎn)）的字符，就需要花費更多時間，一般無法在字符型驗證失效前識別成功。

02、機器學(xué)習(xí)模型

2005 年有人利用機器學(xué)習(xí)模型（CNN）對單個字符的驗證碼進行自動化識別，計算機的識別成功率竟然還比人類的成功率還高。

驗證碼的前世今生

然而，要想使用機器學(xué)習(xí)模型來識別字符型驗證碼，需要先準備好多臺高性能計算機和大量的訓(xùn)練數(shù)據(jù)，因此模型識別的成本太高，一般人用不起。

03、偽裝的手機基站

要想破解短信型驗證碼，偽裝的手機基站需要首先屏蔽目標手機的信號，然后以這個手機號碼去嘗試登錄網(wǎng)站，還要能夠偽裝目標手機去接收短信。

驗證碼的前世今生

各個環(huán)節(jié)都要在短時間內(nèi)完成，簡直就是 Mission Impossible，而且每一步都是違法違規(guī)，破解成本高到天際了。

04、終極的“偽裝”

“能打敗人類的，終將是人類自己”！

當(dāng)人類擁有走出宇宙文明的計算機技術(shù)時，是否可以通過克隆出一個人類，讓這個復(fù)制出來的人類去破解各種各樣的驗證碼，豈不是手到擒來？！

當(dāng)然，這僅僅是小編的一丟丟幻想，可能會在科幻片里看到，各位粉絲不要當(dāng)真哦！

好的，今天的內(nèi)容就是這些啦，和小編一起回顧一下吧：

“圖靈測試”是為了分辨出誰才是計算機；

“驗證碼”是為了分辨出誰才是人類；

千奇百怪的“驗證碼”保護著各種計算機系統(tǒng)；

層出不窮的“計算機技術(shù)”不斷提高自己偽裝成人類的能力。

作為“盾”，驗證碼如何才能更安全、更易用？

作為“矛”，計算機技術(shù)如何才能突破驗證碼的嚴防死守？

這些問題，都需要交給聰明的人類、更加智能的計算機技術(shù)去解答。

可以預(yù)見，作為“人類與計算機的角斗場”的驗證碼，將迎來更多的攻防機會，同時也會給我們的社會帶來更多的改變，讓我們拭目以待！

本文來自微信公眾號：中興文檔（ID：ztedoc），作者：中興文檔

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

驗證碼的前世今生

01、先了解什么是“圖靈測試”

02、反過來的“圖靈測試” 就是驗證碼

03、為“保護”而生的驗證碼

04、越來越堅固的“盾”

01、字符型

02、計算型

03、點擊型

04、滑動型

05、短信型

06、掃碼型

07、生物特征型

05、越來越鋒利的“矛”

01、OCR 技術(shù)

02、機器學(xué)習(xí)模型

03、偽裝的手機基站

04、終極的“偽裝”

相關(guān)文章

01、先了解什么是“圖靈測試”

02、反過來的“圖靈測試” 就是驗證碼

03、為“保護”而生的驗證碼

01、字符型

03、點擊型

04、滑動型

05、短信型

06、掃碼型

07、生物特征型

01、OCR 技術(shù)

02、機器學(xué)習(xí)模型

03、偽裝的手機基站

04、終極的“偽裝”