数字经济下数据的价值创生 与安全风险
在数字经济时代,数据驱动创新和发展的关键在于发掘和释放数据资源的价值。数据价值产生和创造的机理,可以结合“数据—信息—知识—智慧层次模型”和“数据价值周期”来理解。前者由拉塞尔·阿克夫(Russell Ackoff)提出。他认为数据是观察的产物,本身不具有价值,除非被处理成可用形式的信息;知识是对信息的进一步提炼,是将信息转化成行为指南;智慧是感知和评估任何行为长期后果的能力;“数据—信息—知识—智慧”形成了从下到上的金字塔式层次模型。后者由经济合作与发展组织(OECD)提出,描述了数据价值的产生过程,包括数据化和数据收集、大数据、数据分析、知识库、数据驱动决策等一系列阶段,数据价值产生于数据被转化为知识以及被用于决策这两个环节。
总结来看,数据本身不具有价值,但依靠技术手段对数据进行分析和挖掘可以获得信息和知识,这些信息和知识可以用于决策和指导实践,这就是数据的社会和经济价值所在。从数据价值的创生来看,数据价值依赖于大量多样性数字化数据的汇聚、流动、处理和分析活动。这种流动性的数据密集型活动以分布式处理为主,参与主体更加多元,业务生态更加复杂,传统的系统和业务边界更加模糊。数据密集型活动的流动性和复杂性既使得传统的数据安全风险大大增加,也引发了新型的数据安全风险和挑战。
所谓传统的数据安全风险,就是指数据自身安全层面的风险,主要表现为利用数字环境的漏洞来侵害数据的保密性、完整性和可用性。从表现形态看,数字经济时代数据自身安全是动态的,贯穿于数据流动的全过程。这使得数据自身安全面临更大的风险,一旦遭受攻击也容易造成更严重的后果。比如,如果在人工智能的训练数据中加入恶意数据进行“数据投毒”,就会导致训练的算法模型出现决策偏差,有研究就指出用数据污染脸部检测算法可以将攻击者的脸识别成获授权者的脸。
所谓新型的数据安全风险主要是多源大量数据聚合和分析可能带来的安全风险。也就是说数据聚合分析是把“双刃剑”,数据聚合分析得到的信息和知识,不一定对社会和经济有价值,反而可能带来安全风险。这主要表现为两个方面:一是数据分析挖掘得到的信息和知识,本身就具有安全风险。例如,2018年1月,健身应用Strava发布了基于2700万用户运动轨迹数据的“全球热力地图”,由于许多美军士兵是该程序的用户,据此可以分析出美军在阿富汗等地的军事基地位置。可见,数据聚合分析通过对积累汇聚的数据进行搜索、比对、关联等分析,可能挖掘出数据集背后隐藏的安全情报甚至涉密信息。这说明某些之前认为无关紧要的数据在聚合分析技术条件下也会成为高风险敏感数据,判断数据重要性和敏感性要充分考虑数据的集聚效果和潜在使用方式。
二是滥用数据分析所得的信息和知识,作出决策和行动而引发安全风险。滥用数据分析结果不仅可能造成“大数据杀熟”“歧视”等个人权益侵害行为,更有可能对公共安全和国家安全造成严重威胁。例如,有报告指出,通过分析公开发表的科技论文和公共数据库的基因信息,可以分析出某种病毒的易感宿主基因,利用这些信息可以制造感染特定人群的病毒。这无疑会造成严重的生物安全风险。再如,2018年Facebook约8700万用户数据被剑桥分析公司用于分析用户偏好并投放定向政治广告,从而影响了美国总统大选和政治安全。该事件也说明,数据分析结果本身可能无关信息内容安全,但如果滥用数据分析结果来干预信息传播秩序和内容,也可能危害信息内容安全。原因在于网络信息传播存在“过滤泡”效应和“信息茧房”效应,基于数据分析的个性化内容推荐,如果被滥用于推送违法和不良信息尤其是虚假信息,就可能会扰乱信息传播秩序,破坏信息内容生态,造成受众观念极化,甚至会操纵用户的观念和行为。
文章摘自网络,如有侵权,请联系删除