数据爬取须平衡好商业价值与权益保护
互联网的蓬勃发展使得各种应用场景及用户的行为都在网上留下了许多痕迹,形成了海量的数据。如何利用好这些数据并发挥其最大价值,成为各个企业机构必须要面对的问题。在日前举办的企业数据权益保护研讨会上,咪咕版权和维权系统技术负责人苏贇表示,很多公司一般会利用爬虫采集企业内部或外部的数据,然后经梳理、清洗和转换后形成标准化的数据,再通过对数据的分析和挖掘获得商业价值。但要注意的是,在此过程中,会产生一系列的法律风险,尤其是版权保护问题。
对外经济贸易大学数字经济与法律创新研究中心主任许可表示,对于数据来说,流动性非常重要。数据的二次利用、多次利用是发挥数据价值的路径,而数据爬取是实现数据利用的基础。我们应该认可数据爬取是一种权益,在这种情况下,爬取方和被爬取方的权益都应得到保护。在具体场景中,到底是允许爬取方损害被爬取方,还是允许被爬取方损害爬取方,可以通过权衡的方法来解决。
北京市海淀区人民法院刑事审判庭副庭长覃波表示,从近些年其所在法院审理涉及数字权益的案件来看,数据权益真正落实到知识产权保护角度的比例是比较小的,目前更集中在涉及计算机信息系统相关的罪名中。此外,电子书作品的爬取侵权行为严重。一方面,大部分数据是通过链接爬取的,传播数量很难计算,按照传统认定作品数量的方式不能满足当下电子作品著作权保护的需要。另一方面,违法所得的取证范围、规则标准并不明确,合法成本和犯罪成本很难区分。
在清华大学法学院教授崔国斌看来,讨论数据爬取侵权行为是否合法,不能简化成一个数据产权或知识产权保护的问题,需要兼顾保护商业秘密、版权、个人信息、国家秘密等利益,最终形成统一的权衡方案。同时,还须注意不能将破坏计算机系统的行为与数据产权侵权行为混淆起来。很多时候,案件争议的焦点不在于数据本身能否得到保护,而在于行为人以何种方式获得数据或访问计算机系统。比如,每月一次访问他人计算机服务器并下载所有数据,可能并不违法;但你每隔几秒访问并下载数据,就可能被认为在破坏计算机系统稳定性。
“总的来说,根据互联网互联互通的精神,所有平台经营者应当在一定程度上容忍他人合法收集和利用平台中已经公开的数据。”江苏省高级人民法院知识产权审判庭法官刘莉表示,如果平台的使用者没有不当地损害其他主体的利益,也没有违反公认的商业道德等原则,那么可以认定使用行为是正当的。
许可表示,我们应当建立一套数据流通规则,从而将数据爬取规范在一定限度内,为数据法律、数据支付提供可参考的依据。当下,想要进行合法的数据爬取,最好先得到平台的允许。可以通过联系网站所有者或查看网站中是否有相关规定来获取,并遵守网络爬虫规范,不得侵犯商业秘密、个人隐私。