【系列之二】理解数据传播形态之间的辩证关系

A老男孩

<p class="ql-block">数据资产特性与价值尺度研究系列</p><p class="ql-block"><br></p><p class="ql-block"><b>作者</b></p><p class="ql-block"><br></p><p class="ql-block">刘剑桥(北京中同华资产评估有限公司 研究员)</p><p class="ql-block"><br></p><p class="ql-block">数据基础制度建设事关国家发展和安全大局,需要全社会的广泛参与,有关部门、行业和专业力量是其中的主力军。由于各专业领域的局限性客观存在,囿于单一专业领域来认识数据,容易陷入对数据的片面理解。这种片面理解将可能引起在数据权利、数据资产价值、数据要素收益分配等一系列问题上的认知错误,进而导致对公共利益或个人利益的损害,造成资源配置扭曲和收益分配失衡。</p><p class="ql-block"><br></p><p class="ql-block">本系列文章并非另起炉灶提出新的理论,而是聚焦于上述问题,基于哲学、财政、经济、法律等领域已有理论重新审视数据及其性质,融合多个学派和理论的观点和研究方法论,尝试性地提出了新的数据资产认识框架,意在通过对数据存在的客观性、数据资产的价值易变性、数据利用的非竞争性和数据利用的非排他性这四种重要性质的探讨,呼吁社会各界在跨领域对话中加深对数据资产价值尺度的科学认识,共同推动数据基础制度不断完善。</p><p class="ql-block"><br></p><p class="ql-block">本文是“数据资产特性与价值尺度研究”系列文章的第二篇。本系列文章涉及的部分观点、概念和用语前后相承,因此建议从第一篇文章开始阅读。欢迎交流研讨,共同探索。</p><p class="ql-block"><br></p><p class="ql-block"><b>摘要:</b>在本系列第一篇文章关于数据的基本认识的基础上,本文重点阐述了来源数据与备份数据客观的辩证关系,并据此提出了关于如何理解数据变化、数据质量、数据结构、数据产权等若干观点。这些观点是科学认识数据、开展数据资产特性与价值尺度相关分析的基础。</p><p class="ql-block"><br></p><p class="ql-block"><b>关键词:</b>数据基础制度 资产评估 数据资产 数据价值</p><p class="ql-block"><br></p><p class="ql-block">一、绪论</p><p class="ql-block"><br></p><p class="ql-block">理解“数据资产”的前提是在必要程度上理解“数据”和“资产”,本系列前三篇文章主要聚焦于前者。要避免陷入对数据“盲人摸象”的陷阱,我们至少应当站在哪些视角来观察、思考?这是一个重要的问题——开展研究和实践都要基于共识,这样的共识应当涵盖“象”的整体而非局部。因此本系列第一篇文章首先尝试为研究对象建立了一个更广阔的共同认识框架,将所谓“数据”和“信息”整体放在“自然”的框架下认识,抽离其一般性,总结为“表示属性的符号”。</p><p class="ql-block"><br></p><p class="ql-block">对于数据,我们可以采用不同角度加以认识。“如何认识一件事物”归根到底是哲学层面的问题,可以从哲学的视角来观察、思考。本文尝试从辩证唯物主义角度来认识数据,本系列文章尝试构建的数据资产价值理论也是基于马克思主义理论的。</p><p class="ql-block"><br></p><p class="ql-block">辩证唯物主义认为世界的本源是客观的,客观事物普遍处于运动的、联系的状态。狭义数据作为表示客观物质属性的符号,其存在形式亦是运动的、联系的,即具有辩证的客观性。</p><p class="ql-block"><br></p><p class="ql-block">本文围绕数据存在的客观性的重要内容之一——数据传播形态之间的辩证关系进行分析,在解释数据运动即传播的基础上,重点阐述了来源数据与备份数据的辩证关系,并据此提出了关于如何理解数据变化、数据质量、数据结构、数据产权等若干观点。这些观点是科学认识数据的基础,也是系列文章后续开展数据资产特性与价值尺度相关分析的基础。</p><p class="ql-block"><br></p><p class="ql-block">二、数据存在的客观性</p><p class="ql-block"><br></p><p class="ql-block">“客观性”一直是哲学史上的重要概念,客观性问题在近代更多地被作为认识论领域的内容来看待。在认识论方面,辩证唯物主义强调自然的实在性,强调现实生活中的实践活动是认识的来源。数据存在的客观性是辩证的客观性,主要而言,一是体现在数据传播形态之间的辩证关系上,二是体现在人与数据的辩证关系上。本文主要对数据传播形态之间的辩证关系进行阐述。</p><p class="ql-block"><br></p><p class="ql-block">在本系列第一篇文章《<a href="http://mp.weixin.qq.com/s?__biz=Mzk0OTY1NTc3OQ==&mid=2247483865&idx=1&sn=6b7185bfdb2dac5efc79a31070487f3b&chksm=c3544055f423c9435b3993578a5a78c2f295a3bc6dc844cdff75eb2b00e2a296eb088d1414c3&scene=21#wechat_redirect" target="_blank">数据定义的一种分类标准</a>》中,笔者提出了不同数据定义基于数据传播形态的一种分类标准暨认识框架,并指出该框架下数据在传播过程中主要存在“来源数据”“信息”和“备份数据”三种形态。把握数据三种运动形态之间的辩证关系是回答“数据是什么”这个问题的关键;而在把握数据运动的基础上明确人在其中的角色,是理解数据权属以及回答“数据资产是什么”这个问题的关键。</p><p class="ql-block"><br></p><p class="ql-block"><b>(一)数据的运动</b></p><p class="ql-block"><br></p><p class="ql-block">物质是运动而非静止的,表示物质属性的符号亦非例外,数据的传播本质上是数据的运动。考察数据的传播过程,《<a href="http://mp.weixin.qq.com/s?__biz=Mzk0OTY1NTc3OQ==&mid=2247483865&idx=1&sn=6b7185bfdb2dac5efc79a31070487f3b&chksm=c3544055f423c9435b3993578a5a78c2f295a3bc6dc844cdff75eb2b00e2a296eb088d1414c3&scene=21#wechat_redirect" target="_blank">数据定义的一种分类标准</a>》指出,数据的传播通常包括从来源数据向信息转化的“信息化”环节,以及从信息向备份数据转化的“备份化”环节,后续还可能存在信息与备份数据之间的往复转化环节。来源数据转化为备份数据,需要经历两个步骤,第一步是来源数据的信息化,是解码过程,第二步是信息的备份化,是再编码过程。这两个过程构成了数据三种形态之间的联系,因此,要考察数据内部形态之间的辩证关系,就需要先理解这两个过程。</p><p class="ql-block"><br></p><p class="ql-block"><b>1.来源数据的信息化</b></p><p class="ql-block"><br></p><p class="ql-block">来源数据广泛存在于自然,是天然存在而非由人类创造的。来源数据是表示物质属性的符号,是自然界的一部分,人与数据的关系属于人与自然的关系。从人获取信息的实践过程来看,首先是物质的存在,其次是人对数据的观测,再次是认识和记录,最后是形成信息。其中“观测”“认识”“记录”和“形成信息”的具体含义,可以结合示例来理解——当人在画纸上描绘山间明月,月光射入人眼,由视杆细胞和视锥细胞接收,经视神经传入大脑,即观测环节;大脑能动地将接收的来源数据解码,对符号进行认知,即认识环节;大脑将已认知的符号按照记忆的规律保存下来,即记录环节;由于在记忆的形成中,数据并非被一视同仁地看待,而是经过了有用性评价,因此一部分数据被强调,而另一部分受到忽视甚至遗忘,这一形态的数据就是信息。以上数据传播过程就是来源数据信息化的过程。</p><p class="ql-block"><br></p><p class="ql-block"><b>2.信息的备份化</b></p><p class="ql-block"><br></p><p class="ql-block">在信息的备份化环节,意识中的信息如要转化为物质世界的数据,就需要依托物质世界中的载体。成为载体的物质通常具有“物质”和“载体”双重属性。例如,在观测明月数据,对得到的信息进行分析后,人可以对绘画活动进行规划和实施,最终得以完成这幅画,此时这幅画就具有物质和载体双重属性。</p><p class="ql-block"><br></p><p class="ql-block">当信息向载体传播时,备份数据可能出现相对于信息和来源数据的差异,该差异可能体现为数据损失或冗余等现象。由于月亮本身蕴含的数据通常比我们观测到的月亮相关信息更多,而我们观测到的信息通常比画在纸上呈现的数据更多,这体现了在月光数据传播的过程中其数据和信息受到了损失。此外,这幅画是人使用墨水画在纸上的,所以作为物质的画中的明月又包含了纸墨的数据和创作人意识加工的数据,这些是明月原本不具备的数据,即其来源数据并非明月属性的符号。</p><p class="ql-block"><br></p><p class="ql-block">如果我们的目的仅是作画,那么这幅画的主要属性就是物质。当仅以作画为目的时,这幅画作为物质,画中的数据均应当视作“绘画属性的符号”,属于来源数据,无论这些数据来自明月、纸墨还是人的意识加工。此时,表示这幅画属性的数据的传播起点是这幅画,并非明月。</p><p class="ql-block"><br></p><p class="ql-block">如果我们的目的并非是作画,而是传播明月的信息时,这幅画就应当视为载体。其中纸墨的数据和意识加工的数据就成为了传播明月信息目的下的冗余数据,可能需要在以后环节提取信息时剔除;而画中反映明月信息的数据就应当视作“明月属性的符号”,属于备份数据。此时,来源数据是明月传播出的某种属性的符号,即数据传播的起点是明月,画中的数据是明月数据的一份可能存在着数据损失或包含着冗余数据的备份。以上在信息传播目的下,由信息转化为数据的过程就是信息备份化的过程。</p><p class="ql-block"><br></p><p class="ql-block"><b>3.小结</b></p><p class="ql-block"><br></p><p class="ql-block">可见,数据利用的目的通常决定了一份数据是由“物质”属性还是“载体”属性呈现为主要属性。当我们在区分一份存在于物质世界中的数据是来源数据还是备份数据的时候,我们应当意识到,在不同的目的下,答案可能不相同。如果一份数据的存在伴随着人“希望利用它来传播其所能够反映的信息”这一目的,那么这份数据就应当在这个目的下视为备份数据,否则就应当考虑视为来源数据。这一目的的存在意味着,当一份数据作为备份数据而存在时,它应当具有人基于数据利用目的所赋予它的任务,这个任务是:其所反映的信息应当与其来源数据反映的信息尽可能保持一致。这种信息上“看齐”的任务要求,是来源数据与备份数据的辩证关系中联系的一面,这种联系的一面我们通常称为“同一性”。此外,对于备份数据与来源数据具有区别的一面,我们通常称为“差异性”。</p><p class="ql-block"><br></p><p class="ql-block">站在物质本位的视角下,信息可以视作数据传播过程中的一种过渡形态,于是可以认为,数据内部形态之间的辩证关系主要是指来源数据与备份数据的辩证关系,具体体现在其同一性和差异性方面。</p><p class="ql-block"><br></p><p class="ql-block"><b>(二)来源数据与备份数据的辩证关系</b></p><p class="ql-block"><br></p><p class="ql-block">三种形态的数据在不同传播阶段可能存在差异,这些差异是其差异性的体现,然而,在通常的数据传播目的下,矛盾的主要方面是其同一性而非差异性——这一目的的存在使来源数据与备份数据辩证关系的呈现紧密围绕在它们所传播信息尽可能保持一致这一内在要求上。来源数据与备份数据的同一性以来源数据为标准,以信息为中介;备份数据之间的同一性以上游传播环节为尺度,最终依然以来源数据为标准。</p><p class="ql-block"><br></p><p class="ql-block"><b>1.来源数据与备份数据的同一性</b></p><p class="ql-block"><br></p><p class="ql-block">赫拉克利特提出“人不能两次踏入同一条河流”,仅从表面的含义看,既有正确性又有局限性。正确性包括肯定了物质的运动,局限性则包括否定了物质的稳定性。物质具有稳定性并非是指固定不变,而是指在“不断的变化,即与自身的抽象的同一性的扬弃①”中保持与自身的同一。数据亦然,数据在传播过程中不断变化,这种变化是对自身的“扬弃”过程,然而这种“扬弃”又在抽象的意义上保持着与自身的同一性,使数据的每一份备份都与同一传播链条上的其他备份,以及他们共同的来源数据持续不断地保有着一种“同一”关系。这种同一关系体现在这些备份数据所反映的信息与其来源数据反映的信息存在保持一致的倾向。</p><p class="ql-block"><br></p><p class="ql-block">①马克思,恩格斯.马克思恩格斯全集(第二十六卷)[M]. 人民出版社,2014(2):548.</p><p class="ql-block"><br></p><p class="ql-block"><b>2.来源数据与备份数据的差异性</b></p><p class="ql-block"><br></p><p class="ql-block"><br></p><p class="ql-block">在“来源数据——信息——备份数据”的传播过程中,备份数据相对于来源数据通常也会产生变化。导致这些变化的因素可能产生于数据传播的各个环节:在月光射入人眼后,红外光和紫外光不能被识别,不能参与后续建构信息过程;视锥细胞存在缺陷的观月者和健康的观月者即使接收到同样的月光,也会在关于颜色的认识方面存在差异;由于不同观月者的个人经验存在差异,对数据的重视情况存在不同,通过主观感受形成的信息将存在差异;在备份数据的构建过程中,人由于记忆的谬误或实践活动未能客观反映意识,也会出现备份数据与意识中的信息不匹配的情况;备份数据在保存和利用过程中也可能存在部分数据损坏、丢失等现象。可见,在数据传播的几乎各个环节上,数据都可能产生变化,来源数据与备份数据差异性的呈现贯穿着数据传播过程的始终。</p><p class="ql-block"><br></p><p class="ql-block"><b>3.如何理解来源数据与备份数据的同一性和差异性</b></p><p class="ql-block"><br></p><p class="ql-block">理解来源数据与备份数据的同一性和差异性是理解数据概念的关键,也是我们进一步树立对数据资产及其价值尺度科学认识的基础。</p><p class="ql-block"><br></p><p class="ql-block"><b>(1)数据变化不否定数据的稳定性</b></p><p class="ql-block"><br></p><p class="ql-block">狭义数据是表示物质属性的符号,这种变化是自然界的物质运动。除这个变化过程中可能存在意识对物质符号的反映与重构环节之外,备份数据通过一环接一环的物质联系与来源数据、与其他备份数据相互关联,既不能凭空出现,也并非孤立存在。这样的物质联系使具有同一来源的备份数据与其共同的来源数据构成了一种“同一”关系。在这种关系下,备份数据具有稳定性——在传播过程中不断变化却不改其物质来源。具有“稳定性”不等同于“完全一致”,数据在传播过程中可能会产生变化,人从不同备份数据中获取的信息即使存在差异,这些信息也是对特定来源数据的扭曲反映,而非对其他来源数据的反映。因此,数据发生变化不应当成为否定数据具有稳定性的理由。</p> <p class="ql-block">(2)备份数据相对于来源数据的差异应视作同一数据的质量缺陷</p><p class="ql-block">那么,面对数据因在传播中运动变化而产生的差异,我们应当如何理解呢?对该差异的称呼,宜考虑选用恰当的词汇,在形成共识之前,本文建议暂以“数据质量”代称——人介入数据传播时经常抱有特定动机,此时数据传播的任务之一通常是保持从备份数据与来源数据中分别获取信息的差异保持在可接受范围之内,即保证信息的传播相对准确,而“质量”一词可能较好地表达了该差异与人的目的的关系。</p><p class="ql-block"><br></p><p class="ql-block">《信息技术 数据质量评价指标》(GB/T36344-2018)指出,“数据质量”是指在指定条件下使用时数据的特性满足明确的和隐含的要求的程度,数据的特性则包括规范性、完整性、准确性、一致性、时效性和可访问性。②其中,“数据的准确性”是指数据准确表示其所描述的真实实体(实际对象)真实值的程度。在上述数据准确性的定义中,“数据”应理解为备份数据,“真实实体(实际对象)真实值”则应理解为来源数据,于是数据准确性评价结论可以理解为备份数据与来源数据差异的反映。因此,在数据传播过程中,备份数据可能在某些环节产生偏离于来源数据的差异,这种偏差的出现与“指定条件下使用”所蕴含的人的目的相违背,我们可以认为该差异属于一种数据质量缺陷。</p><p class="ql-block"><br></p><p class="ql-block">②国家市场监督管理总局,中国国家标准化管理委员会.信息技术 数据质量评价指标:GB/T36344-2018[S].北京:中国标准出版社,2018.</p><p class="ql-block"><br></p><p class="ql-block">备份数据相对于来源数据的差异是运动着的数据相对于自身的差异,并非“不同数据”之间的差异——备份数据是反映来源数据的信息基于物质世界的备份③,具有“在传播过程中不断变化却不改其物质来源”的稳定性。数据的这种状态,正是“真实的具体的同一性自身包含着差异、变化④”在数据上的例子。同理,从同一来源数据出发,在同一传播渠道不同环节、不同传播渠道都可能存在对应的备份数据,这些备份数据之间的这种差异也应当视为“同一数据的备份”在数据质量上的差异,而非“不同数据”的差异。</p><p class="ql-block"><br></p><p class="ql-block"><br></p><p class="ql-block">③相关解释参见本系列第一篇文章《数据定义的一种分类标准》。</p><p class="ql-block">④马克思,恩格斯.马克思恩格斯全集(第二十六卷)[M]. 人民出版社,2014(2):549.</p><p class="ql-block"><br></p><p class="ql-block">数据的变化通常包含两种类型:第一种是来源数据的变化,这种变化来自于物质属性的变化,通常表现在时间维度上。一旦物质属性发生变化,其表示符号即来源数据通常会发生改变,来源数据传播信息所反映的内容通常随之产生变化,由这些信息形成的备份也就发生了改变。第二种是备份数据相对于来源数据的变化,这种变化是备份数据质量的改变,通常表现在空间维度上。前文指出,在数据传播的几乎各个环节都可能存在备份数据相对于来源数据的变化,在从备份数据与来源数据获取信息保持一致性的传播(以下简称一致性传播)目的下,这种变化是一种缺陷,是数据质量的降低。如不以一致性传播为目的,备份数据就难以称之为备份数据,而是另一来源数据——两份来源数据之间不存在所谓数据质量的差异。现实中我们面临的情景通常隐含了一致性传播这一目的,因此第二种变化也是常见的变化类型。</p><p class="ql-block">需要特别指出的是,对数据作为资产的价值相关探讨,尽管也需要考虑数据质量,但是考虑后的结论并非必然将数据质量认定为“价值影响因素”。数据资产价值对数据质量因素的考虑本质上并非是对备份数据与来源数据关系的探讨,而是从备份数据利用的角度探讨其获利能力。所以,在探讨数据资产价值的语境下,对于第二种数据变化类型,一致性传播目的是否得到满足并非必然影响数据资产价值,真正需要关注的是委估备份数据的获利能力。在确定的利用方式假设下,即使在采用某一备份数据的质量不同,其作为资产的价值也可能基本相同——例如,精确程度不同的某参数可以视为同一数据的质量不同的备份,但当分别利用它们来制造并不精密的产品时,产品的合格率并无显著差异,于是资产组和数据资产的获利能力及价值亦无显著差异。</p><p class="ql-block">(3)具有同一来源的数据是树状结构下的同一数据</p><p class="ql-block">具有同一来源的备份数据,以及它们共同的来源数据,统一于一个树状结构。来源数据之于备份数据,好比树根之于树枝。处于不同传播渠道的备份数据则好比不同树枝上的分支,部分备份数据可能源于同一备份数据,而全部这些备份数据源于同一来源数据。</p><p class="ql-block">来源数据与备份数据是同一份数据,正如“树根”与“树枝”是同一棵树,不能割裂看待。树枝是树根持续运动、变化、发展过程中的其他形态,不是独立的另一棵树;备份数据亦是来源数据在传播运动过程中的其他形态,不是独立的另一份数据。</p><p class="ql-block">备份数据的变化是其数据质量的改变而非来源数据的改变,因此,对不同备份数据是否为同一数据的认定不需要考虑数据是否发生变化,更不需要考虑变化是随时间推移而自然产生还是人为因素导致的,而是仅应当考虑他们是否拥有相同的来源数据。现实中的情况通常较为复杂——一些备份数据的来源数据可能是由来历不同、交织在一起的多份来源数据聚合形成的数据组,然而,这并不否定这个数据组与这些备份数据属于同一数据组。</p><p class="ql-block">明确这一观点具有很高的重要性。在现实中,由于数据易复制,多份具有同一来源数据的相同或相似的备份数据一旦被认定为不同数据以适应传统的产权观念,其权利、价值等关系将产生混乱,当前数据确权和价值评估面临的诸多问题即根源于此。将数据先利用起来固然是重要的,但是要真正实现利用效率的提升和公平原则的落实,就需要合理制度的保障,而合理制度的建设离不开对相关权利和价值理论的研究,这些研究的基础则是对数据本身的科学认识——明确“具有同一来源的数据是树状结构下的同一数据”是开展相关研究的重要出发点。</p><p class="ql-block"><br></p><p class="ql-block">(4)关于数据聚合的分析</p><p class="ql-block"><br></p><p class="ql-block">来源数据通常并非不可分割,事实上,我们在社会生活中接触的来源数据通常可以视为由多个来源数据聚合形成。如果将这些不同的来源数据作为独立的存在来看待,那么它们将共同呈现为一幅多个树状结构并行矗立的森林图景。</p><p class="ql-block">随着这些数据的传播,树状结构也不断生长,作为树枝的备份数据除了可能会经历产生损失、出现谬误等过程,还可能经历与来源数据不同的备份数据的聚合。数据聚合的过程既有可能是排除人类影响的自然过程,也有可能是人类干预的结果,通常意义上的“数据加工”便属于后者。在数据聚合的过程中,备份数据视具体情况的不同可能呈现为直接合并,也可能在加工的过程中失去其本来面貌。</p><p class="ql-block">备份数据的聚合将不同来源的数据连接起来,形成了枝条相接的网状结构。在这样的数据森林中,让我们看见了一根树枝可能同时存在两个树根的“奇异”景象。然而,如果将彼此的备份数据存在聚合情况的全部来源数据整体视为一个数据组,它们将形成一个“根系”。将一片聚合着的数据森林的多个“根”视作一份数据的一个“根系”并非不可——榕树看起来便是这样的结构。</p><p class="ql-block">在这个视角下,聚合起来的多份数据依然可以视作一份数据,对单一数据的有关分析通常也适用于聚合数据,因此,本系列后续文章在多数情况下不再特别分析数据聚合的情况。</p><p class="ql-block"><br></p><p class="ql-block">(5)关于两种观点的商榷</p><p class="ql-block">在现实中存在两种值得商榷的观点。其中一种是“不同载体上的数据一定不是同一数据”。这种观点是错误的。对这种观点的认可,主要可能源于两种情况:第一种情况是,该观点的持有者并未意识到数据的传播是数据的运动,将数据视作是一种静止的存在,因此认为“既然数据不会运动,那么但凡载体不同,就不可能是同一数据”。这种观点犯了否定了物质运动的错误。第二种情况是,该观点的持有者肯定了物质的运动,但是割裂地看待数据变化前后的联系,即认为一份数据从一个载体传播到另一个载体就变成了另一份数据,不再是原来的数据了。事实上,不同载体上的备份数据如果拥有相同的来源数据,那么应当视为同一数据,即使这些备份数据之间存在数据质量上的差异,也是对同一来源数据所反映信息的现实复现。这种观点与“人不能两次踏入同一条河流”犯了同样的错误,即否定了物质稳定性的错误——逝者如斯,而未尝往也。</p><p class="ql-block">另一种观点是,“占有了(备份)数据的载体,即是占有了数据。”这种认识在很多情况下是不准确的——例如对于“掰断一根树枝”这种行为,我们不应视为“挖起树根”,这两种不同的行为不应混为一谈。数据整体呈树状结构,备份数据仅是树枝,而诸如“占有”“控制”等词汇具有排他性的暗示,将这样的词汇适用于数据整体是不合适的,因为其中的来源数据并不为人所有“占有”“控制”。更为严谨的说法是:占有了备份数据的载体,即是“持有”了来源数据的一份“备份”。此处“持有”备份,并非排他“控制”了数据,该表述更符合实际情况。第二种观点在遣词中无意识地表达出一种排他观念,其原因可能是并未认识到来源数据及其备份数据之间的区别和联系,进而未能认识到数据的树状结构。</p><p class="ql-block">当我们看向一份数据,我们不应当仅看到一份数据,而是应当看到树状结构整体。我们看待数据时,视野里应当有数据的三种形态,不能割裂看待这三种形态。我们经常犯的一个错误就是仅认识到备份数据的存在,而未能认识到来源数据的存在。理解来源数据的存在对于理解数据资产很重要——因为我们判断是否能占有一棵树,主要依据的是是否占有树根,而非是否占有一根树枝。假如某人声称“此树归我所有”,而实施上该人仅拥有树枝,树根的拥有者另有其人,那么这种声称显然是不合理的。同理,我们判断数据由谁占有,主要依据应当是来源数据由谁占有,而非备份数据由谁占有。</p><p class="ql-block">然而,数据相对于其他物的特殊性在于,来源数据是物质属性的自然符号,是苏轼所说的“苟非吾之所有,虽一毫而莫取”的。来源数据是一种非常具体,以至于难以描述的物质属性表示符号。人想要尝试去描述它,仅能做到尽可能详细地概括,而一概括就会产生信息的损失。例如,当人观测一棵树,接收到了“这棵树很高大”这一信息,该信息与这棵树实际传播出来的数据相比损失了很多;如果这个人接收到的信息为“这棵树的树冠很大,树干很高很粗”,这两句描述蕴含的信息比前一种情况中“高大”这一个词所蕴含的信息更加丰富,信息的损失也相对前一种情况减少了些许,然而这样的信息量与真实的树所蕴含的数据量相比依然相去甚远。这种一概括就会产生信息损失的天然符号,是不可能为人所占有的。以上是基于“量”的角度的结论,而从“质”的角度看,光的传播与接收是数据运动传播的一种自然形式,光所传播的物质属性的符号是自然固有的天然符号,并非人的创造,也不能为人所占有——人如何能占有“明”“暗”“高大”等属性的表示符号呢;而且,在转化为信息之前人尚且不能理解,更何况占有甚至独占呢?意即,人对于树状结构的数据从根本上不能实施“占有”这种行为。人充其量可以做到的是掌握部分信息,并仅针对这些信息制作备份数据,以及“持有”和“利用”备份数据等行为。</p><p class="ql-block">要进一步理解这一点,就需要考察人与数据的关系,这是数据这一存在所具有的辩证的客观性的另一重要内容,将在本系列第三篇文章中进行阐述。</p><p class="ql-block"><br></p><p class="ql-block"><br></p><p class="ql-block"><br></p><p class="ql-block">参考文献</p><p class="ql-block"><br></p><p class="ql-block">[1]马克思,恩格斯.马克思恩格斯全集(第二十六卷)[M].北京:人民出版社,2014(2):548-549.</p><p class="ql-block">[2]国家市场监督管理总局,中国国家标准化管理委员会.信息技术 数据质量评价指标:GB/T36344-2018[S].北京:中国标准出版社,2018.</p> <a href="https://mp.weixin.qq.com/s/Yj6iwRTkdTwuQgF9y6KAGQ" >查看原文</a> 原文转载自微信公众号,著作权归作者所有