大家都说技术无罪,但是也要看场景,据说现在国内做个人信用评测的,都是要用户授权各种账号,然后爬取信息。
先来看一些法律法规里对个人信息使用的规定
《中华人民共和国网络安全法》
2016年11月7日发布的《中华人民共和国网络安全法》明确“个人信息”是指是指以电子或者其他方式记录的能够单独或者与其他信息结合识别自然人个人身份的各种信息,包括但不限于自然人的姓名、出生日期、身份证件号码、个人生物识别信息、住址、电话号码等,就网络服务中的个人信息保护问题作出系统规定如下:
1、保护个人信息:
网络产品、服务具有收集用户信息功能的,其提供者应当向用户明示并取得同意;涉及用户个人信息的,还应当遵守本法和有关法律、行政法规关于个人信息保护的规定。
2、合法收集使用个人信息:
网络运营者收集、使用个人信息,应当遵循合法、正当、必要的原则,公开收集、使用规则,明示收集、使用信息的目的、方式和范围,并经被收集者同意。不得收集与其提供的服务无关的个人信息,不得违反法律、行政法规的规定和双方的约定收集、使用个人信息,并应当依照法律、行政法规的规定和与用户的约定,处理其保存的个人信息。
3、不得向他人提供个人信息:
网络运营者不得泄露、篡改、毁损其收集的个人信息,未经被收集者同意,不得向他人提供个人信息,但经过处理无法识别特定个人且不能复原的除外。
《规范互联网信息服务市场秩序若干规定》
《规范互联网信息服务市场秩序若干规定》(工业和信息化部令第20号,以下简称“20号文”)就互联网信息服务提供者信息搜集规定如下方面:
1、搜集须经许可:未经用户同意,不得搜集与用户相关、能够单独或者与其他信息结合识别用户的信息(“用户个人信息”),但法律法规另有规定除外;
2、限定搜集范围和用途:经用户同意搜集用户个人信息的,应当明确告知搜集和处理用户个人信息的方式、内容和用途,不得收集其提供服务所必需以外的信息,不得将用户个人信息用于其提供服务之外的目的;
3、用户个人信息保障:互联网信息服务提供者应当加强系统安全防护,妥善保管用户个人信息,未经用户同意,不得向他人提供用户上载信息,但是法律法规另有规定的除外。
爬虫本质是一种工具,一种用机器人代替人手操作、搜集信息提高效率的工具。工具无罪,有罪的是如何使用。
对于涉及法律风险的数据爬取要求,程序员最好在采集前和老板深聊一下,明确法律风险,或者事先和公司签署一份免责协议。

