越来越变态的验证码,究竟在验证什么?

2024-08-19

The following article is from 网易公开课 Author 白小哲的公开课


如今,从注册账户到确认信息,所有的验证码都不存在。自从验证码出现以来,它的图案越来越多,演变成了各种各样的外观,甚至让你抓狂。有必要存在验证码吗?为什么还存在?本文逐一分析。让我们来看看。


———— / BEGIN / ————


"我是谁?我在哪儿?我要去哪儿?"


有时候,也许不是苏格拉底,而是不断翻新图案的验证码,迫使你思考哲学问题。


不知道从什么时候开始,上网冲浪成了视力和智商的多重挑战。


验证码,是你要面对的第一个副本。


让扭曲的数字众神回到原来的位置,按顺序点击一盘散沙的成语,在乱花渐欲迷人眼的图片中精确选择几个正确的图片...


选择合适的棕榈树


显然是在网上解压,结果却让验证码压力更大。


更有甚者,验证码的方式越来越花哨,想要顺利登陆网站却没有它不行。——


上网冲浪,为什么要这么麻烦?


验证码,人类一生的敌人


实际上,验证码的初衷很简单,就是用来区分计算机程序和真人。


计算机程序无法识别扭曲的数字,因此无法通过验证,从而对网站进行恶意攻击和污染。


所有噩梦的开始


根据统计,全球网民每天都要输入。 2 十亿个验证码,耗时超过 50 万只小时。


由于生活中的验证码无孔不入,本届网友也逐渐失去了耐心。


登陆网站,个人社交平台,手机转账需要验证码事故的原因,毕竟涉及个人财产和信息安全;


喜欢还需要验证码


假如只是看到验证码的窗口弹出就开始火冒三丈,那么你就会生气。


验证码测试每个人的离谱方法,才是真正让人“原地死亡”的电子砒霜。


最基本的英文数字组合验证码,已经使人陷入自我怀疑:


" I 还是 1?0 还是 O?2 还是 Z?9 还是 q?vv 还是 w?"


为什么你们这个验证码还会骂人?


在图片中找到汽车和斑马线的验证码,更会使人陷入强迫症的焦虑:


"只露出一辆车的屁股算不算包括车?角落里的玩具车要不要选?"


现在,有影响线的数字,找到红绿灯,公共汽车或烟囱已经过时,新一轮考试正式启动。——


"请点击每一张包含微笑的狗的照片。"


所以,在思考“狗真会笑吗?”之前,大家已经对狗的笑容进行了条件刺激的研究。


事实上,大多数狗看上去既不快乐也不悲伤,只是张嘴算不算笑?或是他们伸出舌头才算笑?


只有通过成功的人才能知道这个问题的答案。


而且作为一个老互联网居民,没有人能忘记曾经被人遗忘。 12306 害怕网站验证码支配。


2015 2008年,如果你想成功买到火车票,抢票界面的“剩余票数”并不意味着你可以买到。只有在支付前的验证码阶段顺利通关,才能算是成功的一半。


有些奇怪的东西混合在一起。


要么在一群明星的照片中找到最佳男主角,要么在一堆假货中找到真货,更何况在十几个方言中选择了“海南话”...


那时候,被卡在验证码阶段抢不到票的倒霉鬼数不胜数。


"验证码,不想让我买火车票你就直说。"


甚至让人陷入自我质疑。


据说验证码可以阻止机器人,但事实是大活人上网被绊倒了。


更加悲惨的是,大多数情况下,验证码的难度,总是与你的焦虑程度成正相关。


"在紧急情况下,验证码总是让人想掉手机,你越着急,它就越不容易成功。"


无数网友被烦人的验证码挡在网页外面,心中充满了愤怒的呐喊:验证码,人类一生的敌人。


为什么要验证码?


"人类发明的验证码是为了反机器,但是现在的网站用它来反人类。"


现在,被验证码气疯已经成为人们的日常生活,但事实上,当时发明验证码的初衷并非为难人类,而是为难机器人。


确认你是人类


时间回到 2000 年初,刚接触互联网的第一代网友,或许还记得当时最头疼的事情。——


总是删除无尽的垃圾短信,随意弹出的攻击页面,总是快人一步,用插件抢票的黄牛。


新兴的因特网,相当于一条自行车可以上的高速公路,有人做生意,就有人制造代码程序故意捣乱。


如果标题的速度跟不上恶意注册的速度,人工审核跟不上重复运行代码,则迫切需要为上网冲浪设置门槛。


2003 2008年,为了解决这个问题,一群来自卡内基梅隆大学的医生创造了这个问题 CAPTCHA,这是一个公开的图灵测试,可以自动区分计算机和人类。


我们所说的图灵测试,就是人类对计算机问题的回答,用来判断计算机是否能在智商行为上与人区分开来。


要辨别电脑前是否是真人,只需将此测试反过来——由机器提问人类解答,“验证码”应时而生。


最早的验证码,于 1997 年度设计公布并申请专利


由变形、扭曲、旋转的字符串或数字组合而成的早期验证码。


机器人无法理解,人类可以用肉眼轻松识别。


有了这个简单的门槛,垃圾短信,黄牛插件,恶意攻击爬虫程序,就很容易被网页挡住了。


不过好景不常,这种验证码很快就被程序破解了。


无论程序有多复杂,都离不开程序。 26 一个英文字母,10 一个阿拉伯数字的组合,只要用程序算法把字符和背景分开,从长远来看,数据库就会学会识别。


同时,一套由庞大的中文字符库组成的中文验证码就这样出现了。


识别结构相似的汉字,给汉字标记拼音,并按顺序点击打乱成语,已成为中文验证码的常规操作。


最终,图文并用、阅读理解纷纷上阵,验证码的方式越来越多样化,计算机识别系统也越来越强大。


数字验证码升级版本


验证码的迭代,变成了一场“道高一尺,魔高一尺”的较量。


这不仅是程序员智力的竞争,也是人机对抗学习的竞争。


到目前为止,各种验证码已按功能划分为不同的阵营,在互联网的挑战磨练中。


如果你想要一个新闻媒体,欢迎你的可能性很大,那就是点击验证码。


根据鼠标的运行轨迹,算法将判断你是否是真人,同时也有助于验证码系统的进化。


“我不是机器人”


在登录个人帐户时,滚动式验证码可以通过拖动速度来判断真人,同时还可以发送贴心的激励:


“祝贺你耗时 1.6 秒,超越全国 90% 的人。"


随着安全性能的提高,短信验证码、扫码验证、刷脸验证相继出现,用户的信息安全在危机互联网世界层层关注。


验证码可以消失吗?


面临越来越变态的验证码,很多人质疑:


"为保护我账户上的五毛钱,设置八层验证真的值得吗?"


回答是,值得。


所谓安全验证,不仅要判断用户注册时设置的登录名称、密码等,还要判断是否为真人,是否为自己操作。


到目前为止,乖乖输入验证码,仍然是区别人和计算机最有效的方法。


很少有人知道:验证码的出现除了保护信息安全外,人类还可以利用它来做一些正事。


发明初代验证码的天才 Luis von Ahn,曾在 2004 一年一度带领团队上线。 reCAPTCHA 验证码系统。


它们把电脑上很难识别的旧书扫描成电子版,把斑驳的文字连接到验证码上,让每个人都能识别。


依靠这种巧妙的方法,系统每年都能成功数字化。 230 有几万本旧书。


在人们认为这就是验证码的光明结局时,有些人本着法术打败魔法的原则,推出了破解验证码的插件。


只要遇到图形验证验证码,小插件不仅会自动帮助用户点击,还会使用深度学习训练模型来提高他们的精度。——


使用的人越多,小插件就越精确。


在观看了这波血腥的“验证码对决”之后,有人感慨:


"验证码取客户训练机器人,客户用机器人绕过验证码,最后机器人学得最多。"


验证码难度的提高,体现了人工智能技术的进步。


随着机器越来越“聪明”,人类面临的问题也越来越多,再复杂的验证码,也会有走投无路的一天,需要寻求新的改革。


但是作为只想在网上轻松冲浪的用户,我们只要验证码,不要让我在照片中找到狗、云做的马。


———— / E N D / ————


作家:白小哲


来源微信微信官方账号:网易公开课(ID:open163)


题图来自 Unsplash ,基于 CC0 协议


品牌推广| 内容编写|广告营销|培训合作


请到微信官方账号后台回复


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com