Python爬虫 | 写在系列博客的第一篇,爬虫到底犯法吗?看完再开始爬虫!!!

在这里插入图片描述

一、 什么样的爬虫是非法的?

爬虫不能涉及个人隐私!

如果爬虫程序采集到公民的姓名身份证件号码、通信通讯联系方式住址账号密码财产状况行踪轨迹等个人信息,并将之用于非法途径的,则肯定构成非法获取公民个人信息的违法行为。

在这里插入图片描述

也就是说你爬虫爬取信息没有问题,但不能涉及到个人的隐私问题,如果涉及了并且通过非法途径收益了,那肯定是违法行为。

另外,还有下列三种情况,爬虫有可能违法,严重的甚至构成犯罪:

  1. 爬虫程序规避网站经营者设置的反爬虫措施或者破解服务器防抓取措施,非法获取相关信息,情节严重的,有可能构成“非法获取计算机信息系统数据罪”。
  2. 爬虫程序干扰被访问的网站或系统正常运营,后果严重的,触犯刑法,构成“破坏计算机信息系统罪”
  3. 爬虫采集的信息属于公民个人信息的,有可能构成非法获取公民个人信息的违法行为,情节严重的,有可能构成“侵犯公民个人信息罪”。

现在网上有很多付费的课程,比如极客时间、Gitchat、慕课网、知识星球等等,这些付费内部信息如果被非法爬取手法出售获利,一种违法行为。

二、 什么样的爬虫是合法的?

1. 遵守 Robots 协议

Robots 协议也叫 robots.txt(统一小写)是一种存放于网站根目录下的 ASCII 编码的文本文件,它通常告诉网络搜索引擎的漫游器(又称网络蜘蛛),此网站中的哪些内容是不应被搜索引擎的漫游器获取的,哪些是可以被漫游器获取的。

Robots 协议就是告诉爬虫,哪些信息是可以爬取,哪些信息不能被爬取,严格按照 Robots 协议 爬取网站相关信息一般不会出现太大问题。

例如:京东
京东 robots.txt

2. 不能造成对方服务器瘫痪

但不是说只要遵守 Robots 协议的爬虫就没有问题,还涉及到两个因素,第一不能大规模爬虫导致对方服务器瘫痪,这等于网络攻击。

2019年05月28日国家网信办发布的《数据安全管理办法(征求意见稿)》中,拟通过行政法规的形式,对爬虫的使用进行限制:

在这里插入图片描述

3. 不能非法获利

恶意利用爬虫技术抓取数据,攫取不正当竞争的优势,甚至是牟取不法利益的,则可能触犯法律。实践中,非法使用爬虫技术抓取数据而产生的纠纷其实数量并不少,大多是以不正当竞争为由提请诉讼。

举个例子,如果你把大众点评上的所有公开信息都抓取了下来,自己复制了一个一模一样的网站,并且还通过这个网站获取了大量的利润,这样也是有问题的。

一般情况下,爬虫都是为了企业获利的,因此需要爬虫开发者的道德自持和企业经营者的良知才是避免触碰法律底线的根本所在。
在这里插入图片描述

三、 建议

  1. 谨慎抓取,请在开始抓取之前检查“ Robots.txt”
  2. 保守一点。激进地请求数据可能会给Internet服务器造成负担。请保持温柔。没有人想要使服务器崩溃。
  3. 明智地使用数据。您可以从收集的数据中获得见解,并帮助您的业务发展。
  4. 在开始抓取之前,请与网站所有者联系。
  5. 请勿将抓取的数据随意传递给任何人。如果它是有价值的数据,请确保其安全。

在这里插入图片描述

最后

最近看了很多关于程序员出事的事件,东南亚程序员被打,多个大数据公司被查等等。做为一名普通的程序员,希望大家也可以多关注此类事件,从而提醒自己。

有风险的行业谨慎进入,比如现金贷、不合规的P2P、赌博类游戏、黑五类产品的行业。如果公司安排入侵某个网站数据,或者有同事/朋友邀请泄露公司信息的都需要保持警惕,有时候一个很小的动作都有可能导致出问题。

我们绝大多数公司和个人使用的爬虫都是没有问题的,不必人人自危,只要把握住不要爬取个人信息,不要利用爬虫非法获利,不要爬取网站的付费内容,基本上不会有问题。

程序员是世界上最单纯的一批人,也是一批高智商低情商的人,工作是工作但也需要适当保持谨慎,对于一些游走在法律边缘的事情请保持距离。

敬畏法律,遵纪守法,从我做起。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/35217.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

学习ChatGPT,AI绘画引入人类反馈会怎样?

来源:机器之心 本文约2400字,建议阅读5分钟本文介绍了研究人员在文本到图像模型中引入人类反馈。 NLP 领域使用的技术不断地向其他领域扩展,如 CV 和多模态,鸿沟正在被打破。本文中谷歌研究院和加州伯克利的研究人员在文本到图像模…

(十三)AI作画、AI绘画、AIGC本地大模型

(十三)AI作画、AI绘画、AIGC本地大模型 AI作画近期很火,涌现出了很多AIGC(AI内容生成)的网站、平台,但这些平台都是使用的云上的算力,基本都有使用的各种限制等。 一、本代码自动将大模型下载本地,可以无-限-使-用。但是对硬件的…

健身房会员管理系统

开发工具(eclipse/idea/vscode等):idea 数据库(sqlite/mysql/sqlserver等):mysql 功能模块(请用文字描述,至少200字):涉及到的技术 SpringBoot Mybatis Thymeleaf mysql题目描述:健身房管理系统是对健身房会员,员工的管…

健身房管理系统分析

主要功能: 1、经理权限&#xff1a; <1>会员的添加和移除&#xff1b; <2>会员基本情况的查询功能&#xff1b; <3>会员的消费记录查询功能&#xff1b; <4>会员续卡功能&#xff1b; <5>教练的在职和当班情况&#xff1b; <6>教练的排班…

让 ChatGPT 来担任这个召之即来挥之即去的私人健身教练

健身教练 和ChatGPT聊天可以运用在各种正式、非正式&#xff0c;工作、休闲场合&#xff0c;让我们再来看一个场景&#xff0c;也是年轻人群体中非常热门的话题&#xff1a;健身。健身已经是年轻人最流行的活动&#xff0c;既可以是私密的个人健身&#xff0c;也可以是呼朋唤友…

chatgpt赋能python:如何使用Python快速打包iOS应用程序

如何使用Python快速打包iOS应用程序 如果你是iOS应用程序开发者&#xff0c;那么你一定知道打包iOS应用程序的繁琐和耗时。在iOS应用商店上发布应用程序需要遵守特定的规则&#xff0c;并且必须打包成IPA文件。如果你想在你的开发流程中更快地打包应用程序&#xff0c;那么你可…

腾讯云控制台详细介绍及使用教程

腾讯云控制台是用户通过网页端管理和使用云产品的入口&#xff0c;用户通过控制台对腾讯云产品和服务进行选购、查看、使用等各种操作。掌握了控制台的使用就是操作腾讯云产品的第一步。 一、控制台总览页 在控制台总览页&#xff0c;查看所有腾讯云产品入口、使用文档入口、在…

使用腾讯云轻量应用服务器搭建网站教程(也太简单了)

码笔记一直想搭建个人网站博客&#xff0c;腾讯云轻量应用服务器还不错&#xff0c;公网带宽也够用&#xff0c;想着用搞台轻量服务器搭建个网站&#xff0c;没想到通过应用镜像&#xff0c;也太简单了&#xff0c;把全部教程分享给大家&#xff1a; 本文是以轻量应用服务器上…

登陆注册实现腾讯云短信验证功能

目前比较流行的短信登陆注册&#xff0c;因为腾讯提供的sdk每月有100条免费短信&#xff0c;下面博主将和大家分享实现的过程&#xff01; 第一步 腾讯云短信功能注册&#xff1a; 然后配置短信签名和短信正文来确认发送短信的默认格式 需要注意的是&#xff0c;两个花括号为…

腾讯云SSL证书配置(nginx)

申请SSL证书 下载证书 下载完证书之后解压&#xff0c;因为腾讯云选择的是nginx服务器&#xff0c;所以我们只需要下载nginx并解压。 配置Nginx服务器 我们需要把刚才解压的nginx证书文件拷贝到nginx的conf路径下面—也就是服务器中/etc/nginx/conf路径下面的。 ssl_cert…

腾讯云弹性MapReduce

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、弹性MapReduce产品架构二、弹性MapReduce 应用功能三、弹性MapReduce优势四、弹性MapReduce试用场景总结 前言 腾讯云弹性MapReduce是结合云技术和 Hadoop、…

Xshell远程连接腾讯云服务器(Xshell无法使用密码登录)

1.新建 填写云服务器IP地址后选择连接 输入root 如果上方密码处为灰色无法点击&#xff0c;则通过云服务器网页登录终端 输入命令cd /etc/ssh命令进入文件夹修改sshd_config&#xff08;注意&#xff01;不要与ssh_config混淆&#xff09; 输入命令vim sshd_config对该配置…

腾讯云域名购买和域名解析教程

一. 域名购买操作步骤 1. 登录 腾讯云 域名注册 2. 选择合适的域名&#xff0c;添加到购物车&#xff0c;然后支付。 二. 添加解析操作步骤 步骤1&#xff1a;添加记录 1. 登录 腾讯云 DNS 解析控制台。 2. 在 “域名解析列表” 中&#xff0c;可查看全部已添加的域名。如下…

Java后端利用腾讯云短信服务发短信

利用手机验证码进行注册或进行下一步操作已经是非常普遍的&#xff0c;这篇文章就教你如何是用腾讯云短信服务发送手机验证码。 文章目录 一、前提条件 二、代码实现 1.引入依赖 2.Java代码实现 3.代码改进 4.实现效果 三&#xff0c;关于项目中验证码验证逻辑分享 1.…

腾讯云完整建站过程

整个网站的建立其实是很简单的,总共包含如下几个步骤: 第一步&#xff1a;购买自己的云域名,首推腾讯云域名,学生党优惠力度很大 第二步&#xff1a;购买自己的云空间,我也是在腾讯云上购买的轻量级云服务器 第三步&#xff1a;将域名和云空间绑定起来,也就是域名的解析 第四步…

腾讯云服务器入门使用流程 新手必看教程

一、根据个人需要选择云服务器配置, 打开首页》云服务器,选好cpu、内存、带宽,地域,这几个是主要的。其他都可以默认选择。 二、登陆控制台 1、登陆账号之后,在首页右上角,点击控制台 进去看到服务界面,控制台比较容易看懂。搜索你需要的云产品 2、以云服务器为例,…

腾讯云GPU云服务器配置初体验

一、故事背景 GPU 云服务器&#xff08;GPU Cloud Computing&#xff09;是基于 GPU 的快速、稳定、弹性的计算服务&#xff0c;因此&#xff0c;可以广泛应用到深度学习训练/推理、图形图像处理以及科学计算等场景中。 GPU 云服务器提供和标准 CVM 云服务器一致的方便快捷的管…

使用腾讯云发送短信API接口实现(完整流程)

步骤 一、开通腾讯云短信服务二、申请签名前的准备&#xff08;申请公众号&#xff09;三、创建签名和模板四、腾讯云API实现发送短信五、使用springboot进行调用六、可能会报的错误 一、开通腾讯云短信服务 在腾讯云官网找到短信服务&#xff0c;开通 二、申请签名前的准备…

使用腾讯云发送短信 ---- 手把手教你搞定所有步骤

最近在跟着一位大佬搞他的Austin项目&#xff0c;austin项目核心功能&#xff1a;发送消息。 这里作者使用了腾讯云发送短信&#xff0c;因为注册就送 100条免费短信的额度。发短信的功能就不用花钱了。 这里就记录了使用腾讯云的整个过程 第一步&#xff1a;注册腾讯云 注…

注册免费使用腾讯云企业邮箱

新手小白适用 在狗爹上买的域名 然鹅现在并不赠送邮箱了 买空间倒是有赠送的 但是我还专门打客服问过 说是不稳定…. 还是入鹅厂的坑吧 小绿锁也是在鹅厂申请的 别问我为啥…. &#xff08;还不是因为穷。。&#xff09; 如果你是阿里云的空间或是那几个某空间都是赠送企业…