贝索斯的技术员编写的是一种纯自动化的爬虫脚本。

        在互联网时代,一切讲究的是效率和速度,但是有时候,单纯的效率会催生出巨大的隐患。

        任何网站的负载都是有限的,如果一个网站的登陆访问请求超过某个上限值,比如一秒钟几万次的登陆请求,那么整个网站都会宕机,数据量再加大的话,服务器甚至有可能烧。

        而黑客最常用的攻击方式,就是写一个自动化的登陆脚本去不断的请求登陆。

        为了防黑客,一些程序员大佬发明了一种验证人机的办法——验证码!

        没错,大家最讨厌的验证码,其实是为了防黑客的!

        因为验证码是动态变化的,每一次都不一样,黑客编写的纯自动化脚本没办法识别。

        贝索斯的技术团队开发的这种纯自动化爬虫脚本,就类似于黑客的那种脚本。

        它可以做到一秒钟采集10万次数据!

        而掏宝的服务器是能够承载千万人同时在线流量的“怪物”,这点数据采集数量,根本不会引起掏宝的怀疑。

        1秒钟10万次,贝索斯甚至可以在半小时内把淘宝网的所有页面数据全部采集完!

        内容未完,下一页继续阅读