导航菜单

裁判文书网数据竟被商家售卖:标价0.1元到1元不等

?

裁判文件网络的数据实际上是以商家的价格出售的

商家:使用“网络爬虫”技术获取大量数据律师:未经法院授权,此行为构成侵权

5c6e-iaqfzyw1064890.jpg

销售数据商家的5c96-iaqfzyw1064963.jpg销售页面

昨天,北京青年报从一家网上商城看到,最高人民法院裁判纸网的数据以0.1元至1元不等的价格出售。裁判文件发布的判决都是公开的,为什么要出售?从裁判的论文中获取数据的手段是否对网站有害?

在线销售数据

价格需要“私聊”才能获得

“北青日报”的记者在一家网上商城看到,来自湖南,广东,山东等地的商家都声称出售了裁判纸网的数据。他们中的许多人声称数据量超过了6000万。根据裁判员纸质网络的公开数据,裁判文件在线发布的文件总数超过7395万。如果商家声明的数量为真,则商家可以提供绝大多数发布的文档数据。

许多声称能够从裁判文件中出售数据的商家在产品文本的描述中说,他们的数据是通过“网络爬虫”方法获得的。所谓的“网络爬虫”,也称为网络蜘蛛,网络蜘蛛,是根据某些规则自动抓取网络信息的程序或脚本。它相当于一个自动访问网页并执行相关操作的小型机器人。

北京日报记者注意到,虽然每个商家在产品页面上都说它的数据价格从0.1元到1元,但每个商家在文字说明中都说数据的价格不受标签的限制。但需要“私聊”才能获得。

销售裁判文件数据的商家表示,在裁判文件上购买数据的买家所需的数据量从几千到几千万不等。一些买家不得不寻求帮助,因为他们无法打开裁判文件。在数据销售商中,“仍有许多学生为论文写作购买数据。在这种情况下,几千就足够了。商业上,它可能需要数百万甚至数千万。“商家还表示,他们可以收到四或五种工具的数据收集订单,价格与买家需要的数据量有关。 “成千上万的数据大约是几千美元。现在加密技术非常严格,所以它更贵。“

“履带”系统

普通用户无法访问

北青日报记者了解到,一些技术组织通过网络爬虫系统获取裁判文书数据的行为给裁判文书网络的普通用户带来了不便。许多网友曾在互联网上发帖称,当他们搜索裁判文件时,他们经常会遇到因系统原因无法查询裁判文件网站的情况。

针对此,最高人民法院对网民的缓慢操作和官方网站频繁失败做出了回应。随着中国裁判纸网络公开文件的数量和影响力不断增加,访问用户数量持续增长。同时,自2018年5月初以来,大量科技公司通过爬虫系统获得了对裁判文件数据的无限制并发访问,导致网站负载过大,大量普通用户请求拥塞,慢访问或部分页面显示。

今年5月,最高人民法院信息中心主任徐剑锋在接受媒体采访时表示:“中国裁判纸网每日访问量可达数千万,包括数据抓取攻击,以及中央服务器受到攻击。压力很大。“

“我们每时每刻都在监控其应用,我们希望在遇到问题时立即采取措施,但我们无法完全按照步骤进行,因此会出现网络维护和运营的情况。”徐剑锋说,最高法律已经建立了专门的运维支持团队来维护和管理中国的裁判纸网,将更多的权力投入到技术和人力资源上。

相关机构

有多种方法可以“抓取”

北青日报记者获悉,在此之前,有关方面已采取各种措施打击“爬行动物技术”。最高人民法院已经发文称,为了更好地保证正常的用户访问性能,相关方面是以验证码的形式在线提供系统软件的防攀功能。 “验证码技术是反爬行动物的有效措施。当页面浏览量在一定时间内达到一定数量时,验证码机制将启用验证。之后,我们将更新反爬行动物技术从时间到是时候加强网站维护,提高网站效率和稳定性。“

件的主要原因是爬虫系统将基于“开放时间”。该项目以递增方式进行爬网。 “在下一次反爬行动系统稳定可靠一段时间之后,我们会考虑在适当的时候增加'开放时间'搜索项目。”

此外,最高人民法院表示:“由于爬行前行为过于猖獗,不受限制的暴力访问大大降低了正常的用户访问性能,我们已采取措施通过限制列表页面上的页面翻转次数来防止爬虫系统。“

律师分析

强行突破“反爬”技术或构成犯罪

专门研究知识产权法律的律师Zeng Fawen律师解释了网络抓取工具所涉及的法律问题。昵称,从技术中立的角度来看,爬行动物技术本身没有违法行为。然而,随着数据产业的发展,数据爬行带来的各种问题和顾虑正在增加。过于野蛮的爬虫可能导致站点过载,导致站点尴尬,无法访问等等。

“由于爬虫的批量访问会给网站带来很大的压力和负担,许多网站运营商将采取技术措施,防止爬虫分批获取自己的网站信息。对于这些技术手段,爬虫开发者可以优化自己的代码,使用IP池和其他方法规避上述技术措施,实现批量捕获和复制网站信息。“瞿淼表示,由于网页抓取工具会根据具体策略访问尽可能多的网页,因此抓取工具的使用会占用访问网站的网络带宽,增加了网络服务器的处理开销,甚至无法正常提供服务。

根据《反不正当竞争法》关于网络的相关规定,如果网站运营商采取了一定的防复制措施,履带控制器会根据业务目的强行突破网站运营商采取的反爬行技术措施,客观上如果被抓取的网站运行不正常,可能构成不公平竞争。此外,在攀爬方的某些具体措施中强行突破也可能构成刑事犯罪。

针对这种情况,北京市社会组织法律调解中心副主席张新新认为,“这些判决文件是司法披露的免费公共资源。未经最高人民法院批准,销售裁判文件构成侵权。

主编:陈永乐