沈艳:关注大数据分析门槛 警惕大数据神话
海外网:很多时候企业大数据分析展示给公众的只是一个结论,数据如何收集、处理无从得知。这让我想到信息孤岛的说法,某些数据仅限于某个部门或者企业知晓和使用,您认为这个孤岛出现的原因是什么?如何改变这种现状? 沈艳:从我的观察出发,信息孤岛出现有这么几个原因。第一,由于在一个单位内部,数据的收集整理都是服务于各部门自身的业务需要,于是会出现各部门在同一指标上内涵不同的状况。特别是我们的经济正在转型,业务部门是慢慢成长起来的,起初部门A出现的时候,并不知道未来会有部门BCD,当部门BCD出现的时候,也并没有想到它的信息可能需要和部门A一起使用,这就容易出现部门之间的信息分隔。第二,度量本身是有难度的,因为经济活动非常复杂。我自己长期参与中国健康和养老的追踪调查,在参与问卷设计的时候就体会到度量比想象难得多,需要考虑对各类人群的适用,考虑各种各样的可能。第三,数据共享涉及传输,传输环节的安全责任划分如果不清晰,数据共享也难以实现。 当然,我国在改变信息孤岛方面,还是做出了不少努力。比如我了解到,我们一些大型国有银行在做大数据战略的时候,首先就会制定统一的度量标准,从某个时刻开始,各部门对于同样的指标采取近似的定义。当然这些步骤的实施并不容易,因为有些绩效和这些度量结合在一起,统一标准未必对每个部门都有利。另外还需要制定一些数据的收集标准,这样各方整合数据才相对容易,对监管也更加有利。 不管是一个单位各部门之间,还是各个单位之间,数据的打通都非常需要专业人才。它们既要懂得数据内涵,又要能做打通部门数据壁垒工作,要知道目前不同标准之间的异同,哪些数据能够合并而哪些不能。 此外还需要数据产品安全级别的界定。数据开放共享并不意味着所有人都可以免费得到所有数据。开放存在级别划分,比如一些数据现在仅是在某部门内部使用,建立共享平台之后,其中的某些数据可以在某些程序下被某些人使用。当然也要慢慢明确哪些数据是公众可以自由获得的,开放共享会是逐步推进的过程。 海外网:您提到了数据安全的问题。大数据应用使得个人和企业的信息安全存在很大隐患,保护信息安全的立法呼声也已出现。如今是否到了数据安全相关立法的恰当时机? 沈艳:信息安全的重要性在大数据时代越发凸显,一定程度上是因为当数据的维度越来越多,就越来越容易通过特征识别出具体的个人。信息安全方面的立法工作是非常重要和紧迫的,由于数据泄露,老百姓的损失已经确确实实存在。一切的监管和保护要有效,还是需要坚实的司法基础。 关于个人数据保护我们要明确的是,个人数据的出卖需要明确的标准。即便在一定情形当中,个人数据能够被一些企业收集和使用,也要保证凭借这些数据不能精确地找到个人。比如有某人的姓名就不能同时有他的地址,而且对于姓名、地址等确切信息要特别注意,对于同时拥有这些信息的行业要有严密的监管。 “十三五”规划纲要第28章讲的就是信息安全保护的内容。在“加强数据资源安全保护”这部分提到了“建立互联网数据资源资产化和利用授信体制”“加强个人数据保护,严厉打击非法泄露和出卖个人数据行为”等,希望这些内容可以得到很好的执行。 (编辑:威海站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |