这事儿得从我上个月一次手欠操作说起。
一、脑子一热想搞点"捷径"
那天赶稿子缺数据,瞅着某公司官网排版挺整齐,心里琢磨:要是能直接扒下来多省事。以前听群里有人吹嘘过什么"自动抓网页神器",鬼使神差就下了个野鸡软件,把官网地址往里一填。咔哒一点开始按钮,看着屏幕上唰唰滚动的页面截图和文字,当时还美滋滋觉得自己挺能耐。
- 偷了啥:产品图、价格表、公司介绍整整齐齐躺我硬盘里
- 干了啥:开着软件刷了人家半个钟头
- 想啥:"反正公开信息不算偷?"
小编温馨提醒:本站只提供游戏介绍,下载游戏推荐89游戏,89游戏提供真人恋爱/绅士游戏/3A单机游戏大全,点我立即前往》》》绅士游戏下载专区
二、律师函差点砸脸上
消停没三天,邮箱突然弹出一封红头律师函,落款是那家公司法务部。信里说我用爬虫疯狂扫他们服务器,搞得正常用户都卡成PPT,还白纸黑字写着"已固定电子证据,拟追究民事赔偿及刑事责任"。当时捏着鼠标的手全是冷汗,心里就俩字:完犊子。
赶紧给干律师的发小打电话,他听完就骂我:"你是不是虎?人家网站底部写着'禁止自动化采集'看不见?你每秒请求几十次,当人家服务器是公共厕所?"
三、疯狂补课发现全是雷
吓得我连夜查资料补课,结果越看后背越凉:
- 机器人协议(*):官网根目录这个破文档根本不是摆设,早标明哪些目录禁止爬虫访问,我下的野鸡软件压根不理这茬!
- 绕过验证码=作死:那破工具自动破解登录验证码的行为,在司法解释里直接算"侵入计算机系统"
- 扒的公开信息也算侵权:别信网上说的"公开等于免费",页面排版、产品图汇编都有著作权,批量偷就等于复印别人家财报!
更吓人的是发小发来的判决书:某哥们儿爬了医疗公司价格数据转卖,直接判了侵犯商业秘密罪,蹲了两年还罚了五十万。
四、血泪换来的保命经验
硬着头皮去给人赔礼道歉,签了赔偿协议才算了结。现在想起来还肝颤:
- 别手贱碰技术手段:只要不是手动复制粘贴,自动化采集九成九违法
- 看人家脸色再行动:官网如果有"禁止采集/下载"声明,你碰一下就是送人头
- 商业数据死也别碰:产品库、客户名单、报价单这些扒了就是刑案
- 被逮住赶紧认怂:第一时间删数据道歉,硬刚只会让赔偿金后面多加个零
前天路过某科技园公告栏,还看见贴着我扒过的那家公司"成功破获数据窃取案"的喜报,照片里警察正押着个蔫头耷脑的年轻人。我默默把衣领竖高点,走得飞快——要是当初没收到律师函就收手,现在上墙的可能就是我这张老脸了。