知产财经┃杨德嘉:“数据-信息二分”视野下的数据竞争问题探析

  作者:杨德嘉 北京市海淀区人民法院民五庭庭长

  2023年是全国首个自贸试验区——中国(上海)自由贸易试验区揭牌运行十周年,也是上海法院知识产权司法服务保障上海自贸区建设十周年。十年来,上海法院通过知识产权司法保护工作助力上海自贸区对标国际高标准经贸规则、推进高水平制度型开放,取得了显著成绩。自贸区提升战略的深入实施、国际经贸形势的不断发展变化,对于知识产权司法服务保障自贸区建设提出了新的更高要求。

  基于此,由上海市高级人民法院指导,上海市浦东新区人民法院、上海市法学会知识产权法研究会合办的“第五届自贸区知识产权司法保护浦东论坛”于11月10日在上海召开。北京市海淀区人民法院民五庭杨德嘉庭长围绕“‘数据-信息二分’视野下的数据竞争问题探析”话题进行主题演讲,知产财经对其主讲内容进行了整理,以飨读者。

  数据竞争的问题,特别是企业之间、平台之间,涉及到数据爬取和利用等方面的竞争问题,是当前的热点问题之一,也存在不少争议。尽管这方面的研究成果有很多,但是我个人在学习和梳理过程中,也发现了一些亟待进一步明确和澄清的问题。今天向各位汇报交流的,便是其中之一,即数据与信息的区分问题。

  什么是法律意义上的“数据”?我们在讨论数据保护、数据赋权、数据竞争时,首先是要把这个对象加以明确。尽管对此《民法典》并没有直接规定,但《数据安全法》第三条其实给出了精准的界定:本法所称数据,是指任何以电子或者其他方式对信息的记录。此外,国际标准化组织(ISO)也指出:数据是信息的一种形式化方式的体现,该种体现背后的含义可被再展示出来,且该种体现适于沟通、展示含义或处理。

  不少专家学者也非常重视对数据和信息的认识与区分。时建中教授在《数据概念的解构与数据法律制度的构建——兼论数据法学的学科内涵与体系》一文中强调:“概括地讲,数据是信息的载体,数字是数据的传输和处理方式……信息需要载体。若无载体,信息就失去了得以存续和呈现的介质,等同于没有信息。”吴汉东教授在《数据财产赋权的立法选择》中指出:“‘数据与信息具有很强的共生性和相互依赖性’。数据作为信息的表现形式和载体,可以说是信息类的无形财产。”申卫星教授在《论数据用益权》一文中也明确道:“数据的本质是信息的载体,而信息是知识来源……数据应是对已知或者未知信息 (连同元数据)的数字描述,且在技术上能够成为数字运算(处理、存储与传输)的对象,是以可机读方式存在的电子化信息记录……要正确讨论数据权属问题,必须从客体上严格区分数据和信息,将二者混为一谈会产生许多不必要的误解……”

  从以上学者的共识中,我们不难看出如何去厘清信息和数据的关系。当然也是我个人比较认可的观点,即:二者是内容与载体的关系。如果要打个比方的话,那么我们今天讨论的信息和数据,就类似于著作权法当中的作品与载体,二者相当于是《红楼梦》这部作品与印着《红楼梦》内容的纸质书之间的关系。

  应当注意的是,在日常生活中出现的很多有关“数据”的提法,并不都是明确、严谨地指向我们在前面所述的、作为载体的那个数据。在大量的场景中,人们都是把信息和数据这两个概念混淆使用的。很多时候,如果不结合上下文分析,我们是无法确定某一篇文章里所讲的“数据”,到底指向的是信息还是载体;甚至在同一篇文章、同一份文件的不同段落中,“数据”这个词所指代对象和内涵都是不同的。随着语境的变化,“数据”一词似乎也在不断变换着角色:有时候,它是指作为载体、结果的数据,即狭义的数据本身;有时候是指数据所记录、承载的信息或内容;而在某些情况下,这个词却又指向数据+信息的全部内涵,既包括了内容也包括了载体,实际上是两个对象的集合。

  我想,可能正是由于对“数据”这个概念的认识和使用不清晰、不严谨,频频出现一词多义的情况,才导致了我们对相关问题的研究和讨论,从一开始就会出现混乱,甚至严重的分歧。例如在《反不正当竞争法》修订草案征求意见稿中,第十八条“数据专条”的最后一款是这样表述的:获取、使用或者披露与公众可以无偿利用的信息相同的数据,不属于本条第一款所称不正当获取或者使用其他经营者商业数据”。如果单从字面意思上看,就很容易导致大家认为这里所指的数据是等同于信息的。如果这样的表述不做适当优化,恐怕会在未来的法律适用过程中引发不少问题。

  将信息与数据的概念混淆使用,在日常生活中似乎也问题不大,但转换到探讨法律规则的场景下时,就很容易产生方向性的误导和根本性的误判。因为数据与信息所存在着的本质差异,也必然会指向不同的权利配置与行为规则。

  对信息与数据不加区分,在信息权利主体与数据权利(权益)主体完全重合的情况下,可能存在的问题还不那么明显。然而一旦信息主体与数据主体是分开的,二者各自所拥有的权利或权益,就很可能是相互关联但又各自独立的。由此一来,这两类主体各自行使其权利时,就不免会产生一定的摩擦甚至矛盾。面对这种情况,如果还把信息与数据混为一谈,这种不同主体之间的权利冲突,恐怕无法妥善解决。因为不去准确地限定研究对象,在一个模糊的前提下就匆匆探讨相关的利益平衡与行为规则问题,我们就很难得到清晰、合理的结论,反而不可避免地会引发毫无意义的分歧与争论,陷入自说自话的死循环。

  所以,我的观点是,我们在讨论数据竞争,特别是关于企业间、平台间关于数据的爬取和利用的问题时,必须明确地限定我们所讨论的对象,即:这里的数据,是指作为信息载体的电子数据。在这样的前提下,我们再试着对一些现象、问题和争议进行梳理。

  其一,同样的信息,完全有可能对应着不同的数据,进而对应着不同的数据控制主体。即便这些不同的数据所记录的是完全相同的信息,也并不妨碍上述不同的主体对其各自所控制的数据,分别享有各自独立的、并存不悖的权利(权益)。比如说某UP主,其把自己摄制的同一条短视频分别上传到了“某音”“某手”“某书”等平台上。此时,作为信息、内容的短视频的权利人仍然只有一个,那就是UP主本人;而这一条短视频却在不同的平台上被分别记录、存储成了多份各自独立的数据;相应地,各个平台对其自己所存储、控制的相应数据,均分别地、独立地享有权利(权益)。

  其二,信息的权利主体,并不必然是该信息所对应之数据的权利(权益)主体,也并不必然地享有控制、支配这些数据的权利。举个例子,虽然刘慈欣是《三体》小说的作者,但对于新华书店、图书大厦里面售卖的《三体》图书,他并不享有占有、处分等权利。甚至他如果想拿几套《三体》图书送人,也得自己去花钱购买。小说作者的特殊身份,并不会使其产生控制、支配这些图书的特殊权利。借鉴“作品-载体二分”的思路,那么在“信息-数据二分”的视野下,我们对于涉及UGC(用户生成内容)平台数据的一个争议问题,似乎就可以看到一条比较清晰的解决路径。那就是用户作为内容(作品)的生成者、上传者,其对于自身所生成、上传的内容(作品)所享有的权利,并不能当然地吸收、对抗甚至消灭平台运营主体对于相应数据所享有的权利(权益)。进一步思考,此时用户能否授权第三方径行去平台爬取与其生成内容所对应的数据呢?我个人的观点是:不可以——正如刘慈欣也不能授权他人去书店里随便拿走几本《三体》的图书。简而言之,除非明确存在有法律规定或合同约定的义务,否则我们看不到有什么正当的理由,能够要求数据的加工、存储、控制等主体无偿地、无条件地把数据提供给任何其他市场经营者。

  其三,当前流行着这样一种观点:数据在被反复、多次利用的过程中不会产生损耗,反而是使用得越多越广泛,它发挥出的价值就越大,所以应当鼓励更多的市场主体对数据进行更多方式、更为广泛的利用;此时,如果数据的收集、加工、控制者等去限制他人使用自己的数据,反而是妨害了“数据流通”“数据共享”,反而会成为数字经济发展的阻力。其实我们只要认真思考一下,就不难发现这种观点存在的根本问题:客体在数量和物理属性等方面没有受到减损,并不代表它的市场价值不会受到贬损,更不代表该权利(权益)的所有者没有遭受损失。为便于理解,我们还是可以用著作权来进行类比:多印几万本盗版书,对作品及其内容本身不会造成任何改变和损害,但毫无疑问地会侵害作者、出版社等相关主体的合法权利和经济利益。道理,其实并没有那么复杂。

  其四,我们都认同,数据作为新的生产要素,应当鼓励其市场流通和广泛利用;但同时也必须注意到,这不能成为某些主体在缺乏合理理由的情况下违反robots协议,甚至破坏、规避技术保护措施,去违法爬取、使用其他平台数据的借口。应当看到,土地、劳动、资本、技术等其他生产要素,都是在市场交易中,通过订立合同、支付对价去实现流通、发挥价值的。就我个人的认识而言,似乎也没有把数据要素作为例外的正当理由。对于某些采取单方的、强行的甚至具有欺骗性、破坏性的方式去获取他人平台数据并牟利的行为,我们在进行评判的时候,也有必要从相对宏观的角度做些冷静、客观的思考:这种行为会不会冲击和破坏《反不正当竞争法》所维护的市场竞争秩序;它与我们的市场激励机制是否相违背;从长远和整体上看,这是否真的会有利于提升消费者福利、促进经济和技术发展?再进一步思考:这种行为模式能够复制、推广到域外市场吗?据此能够提升我们的国际影响力和竞争力吗?

  其五,时至今日,仍有观点认为:数据像水和空气等自然资源一样,具有天然性和公共性,加之本身并不稀缺,因此也就人人皆可得之,且应无条件地用之。我想这恐怕是对平台数据有些误解。首先,我们今天所谈及的作为“信息载体的电子数据”,从来就不是天然存在的。如果将其比喻为水和空气,那么它也是经过了加工、过滤等工序生产出来的饮用水和氧气,它是流通在市场中、放在货架上的商品,是需要通过交易、支付对价才能够被合法取得的。当然,很多与数据有关的网络产品或服务都是由平台“免费”提供给用户的,但免费提供并不代表无对价、无条件、无限制地提供,更不代表是默认向任何主体、任何使用方式提供的。我想这个道理应该不难理解。其次,平台数据真的不具有稀缺性吗?珠穆朗玛峰顶上散落的石头、马里亚纳海沟里流淌的海水,放在原地的话,似乎确实没有什么稀缺性。然而当有人投入时间、购置装备、冒着风险把它们从原地采集回来,放在城市的商场、酒店里售卖的时候,我们面前的这块石头、这瓶海水,它就是具有稀缺性的商品。这种稀缺性,与其此前是否属于自然资源无关,而是由人工获取它的成本和机会所决定的。

查看更多知识产权资讯,请访问知产财经网站:***

相关链接

【知产财经】宫晓艳:涉外知识产权纠纷的特点、问题与司法应对

【知产财经】赵长新:科学构建数据保护体系,促进数据资源流通使用

【知产财经】傅姚璐:数据权益保护的惩罚性赔偿适用探讨

【知产财经】新浪张喆:互联网企业涉外知识产权案件应对的经验与困局

本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:dandanxi6@qq.com

(0)
上一篇 2023-12-13 16:09
下一篇 2023-12-14 10:26

相关推荐