欢迎来到必胜文档网!

大数据环境下档案数据保全的体系架构研究*

文章来源:网友投稿 时间:2023-07-25 11:45:04

马千贺

(吉林大学商学与管理学院 长春 130012)

《“十四五”全国档案事业发展规划》提出要全面构建档案数据安全体系。随着大数据时代的到来,大数据技术有了更进一步的发展和应用,档案数据的安全管理正在面临严峻的挑战,例如:信息安全和数据管理体系尚未建立、人才队伍建设还需加强等。档案数据保全是一个新兴概念,它是指档案数据保全部门作为保全主体,运用相关数据保全技术,结合档案数据自身及其相关属性信息进行特征分析,保障档案数据资源的原始性、准确性、安全性、可靠性和可信性,从而进行相应的管理与服务工作,如今已经成为维护档案安全的重要技术手段和方法。然而,档案数据保全并不是单一的技术方法,它需要从不同层面,不同角度进行系统的研究和体系架构。

因此,本文拟研究大数据环境下档案数据保全的内涵、与传统档案数据安全管理的差异,从不同维度、不同层次对档案数据保全体系进行架构,并提出档案数据保全的具体实施策略。

1.1 传统数据保全与电子数据保全对比

传统档案保护主要是关于传统档案制成材料的安全保存[1];
电子数据保全一般是指电子证据的取证、扣押、封存、完整性校验等几种保护电子数据完整性以保障其原始性、真实性和合法性的手段,运用互联网或者电子、数字化的方式对这些档案进行整理和维护等工作[2],传统数据安全管理和电子数据保全的对比如图1所示。

图1 传统档案数据保护与电子数据保全对比图

1.2 档案数据保全功能

档案数据保全的功能主要包括:保护档案数据安全、监测丢失的档案数据和提升档案数据的质量。由于档案数据存在易发生改变的特性,在现有技术环境下,档案数据保全可以通过用信息记录载体来对档案进行固定,借助区块链技术来保护数据安全,保证档案数据的真实性和完整性。同时,造成档案数据丢失主要是因为载体老化或者在管理操作过程中人为因素导致的误删等情况,档案数据保全能够对数据展开监测,对出现异常的数据展开档案数据保全和修复[3],避免由于档案数据丢失,造成不能及时获取档案数据的情况出现。档案数据保全可以对档案数据开展全生命周期管控,对版本、路径等信息进行记录,使档案长期可读,结合档案数据的保存需要展开研究,极大地提升了数据的质量,有效推动了档案事业的发展。

1.3 档案数据保全研究现状

1.3.1 相关概念

档案是指人们在各项社会活动中形成的具有保存价值的原始记录。档案的原始记录性和凭证价值是由档案的形成过程与特点决定的,也是档案区别于文件等其他信息的显著特征[4];
数据是指所有输入到计算机并且计算机程序处理的符号介质的总称;
上海大学于英香教授曾从数据和信息之间的关系的变化来看档案数据概念的发展,认为“从内涵上看,档案数据是一种具备档案属性的数据;而从外延上看,档案数据包括电子文档、数据资源”。综上,我们可以将档案数据划分为几个不同层面的含义。首先,来自档案本身的数据,这部分数据是档案数据的主干部分,主要包括电子档案、音视频档案等;
其次,当档案部门开展相关的业务活动时,也会产生档案数据,并且通过不同的途径对档案数据进行收集,再进行保全;
最后一个层面是与档案用户相关的数据,例如个人基本信息、查询记录、浏览记录以及对用户需求的档案数据进行收集。这些不同层次的数据构成了档案数据保全的主体,也在一定程度上推动着档案事业的发展[5]。

档案数据保全的目标主要是保证档案数据不丢失,即使出现意外情况也能够通过符合法律程序规定的技术手段对电子数据进行找回、固定和长期保存,使之能够发挥其特有的价值。

1.3.2 技术方法

目前国内对于档案数据保全分为内容固化和价值固化。各档案机构部门可在数据生成阶段对档案数据进行内容固化,在档案数据生成阶段对其内容进行哈希运算,以哈希值作为其内容的完整原始性摘要并进行存储。哈希算法是保证文件唯一性的标志,一个文件也只有唯一的哈希标志值,当原来的文件发生变化时,对应这一文件的标志值也会发生变化,通过标志值的改变告知文件使用者当前的文件已经不是用户需求的文件,这使得档案机构部门在档案数据内容固化上持有一定的保全能力;

档案数据保全过程中对档案数据的价值保全主要依靠时间戳以及数字签名技术,依靠由可信的第三方时间戳服务中心(TSA)颁发的可信时间戳来证明档案数据产生时间的电子凭证,结合数字签名技术来确保档案数据的原始性,将档案数据的价值进行保全。

1.3.3 实践案例

苏州大学苏航档案数据保全中心是我国首个对外服务的档案数据保全平台。目前在国内档案数据保全领域具有领先地位,主要经营数据处理与存储;
档案整理服务;
开发档案管理系统等服务。当出现档案数据在保管过程中数据丢失、数据损毁、不能及时跟进数据状态等情况时,苏航档案数据保全中心都能够做到实时监测、实时保全,确保档案数据在长期保存过程中的完整、准确、安全、可用,从一定程度上解决了档案数据丢失、损毁、法律效力不足等方面的问题[6],保障档案数据保全工作的有序进行。

在苏航中心建设的基础上,可以为后续档案数据保全体系完备发展提供启发。目前苏航中心在数据收集、数据存储、保全维护等关键步骤上都有较为成熟的管理流程与技术应用。在未来的研究中,苏航中心还将针对档案数据格式、档案数据存储平台进行研究和跟踪,实现从管理和技术两方面的档案数据保全,对全媒体档案数据标识体系进行分析处理,实现档案数据智能化的治理和服务[7]。

2.1 机构体系架构

现有档案数据保全服务机构为数据保全提供新思路,其中包括:人民法院,公证处和市场现存第三方存证机构[8],如图2所示。

图2 数据保全机构体系架构图

人民法院的档案数据保全过程主要指当事人可以在证据丢失或者以后难以重新获得的情况下,向法院提出保全申请或者法院主动采取保全措施。经过法院审查后,作出准予保全裁定。人民法院这种保全方式具有公信力强,费用较低的特点,但是程序严格、耗时漫长,在及时保全极易消失的电子证据方面效果显著。

公证处的保全包括:传统公证机构和网络公证机构。传统公证是指当事人提前向当地公证处提出预约,公证时由公证员在设备上进行提取、固定并对真实性作出公证。这种保全面临着时机滞后的问题,同时,公证费也让人望而却步,因此,网络保全应运而生。网络公证,是指网络公证机构使用电子技术进行公证的行为,以公证服务为主,效率虽高,但是技术实力和存储资源也面临着不确定性。

最近,市场现存第三方存证机构逐渐发展起来,例如:存证云、联合信任时间戳服务中心等,这些类似的机构大多与科技公司合作,科技公司将档案数据进行存储管理,第三方存证机构接受申请,用户能够依照存证平台的指导独立完成存证、公证等保全过程,这种保全方式使得档案数据保全效率得到有效提升。

2.2 模块体系架构

档案数据保全模块包括三大模块,分别是数据接收模块、数据保管模块和数据利用模块,如图3所示。

图3 档案数据保全模块体系架构图

档案数据接收模块主要指将已经入库的电子档案数据进行数据预处理和数据验证,保证入库的电子档案数据是完整和准确的,同时还可以对整个流程进行记录。所谓数据预处理是指对所收集数据在进行主要分析过程、分类或分组前所做的审核、筛选、清洗、排序等必要的处理,主要从档案数据的完整性和档案数据的准确性两个方面进行审核等工作;

档案数据保管模块可以将入库的档案数据按照一定的原则和标准进行独立检测,实时监测数据状态,并根据数据状态对档案数据进行自主修复和自主保全;

档案数据利用模块用于为授权用户提供所需求的入库保全档案数据,并存储相应的数据利用记录。

2.3 技术体系架构

数据保全技术包括备份技术、镜像技术、文件加密、数字签证、访问控制和病毒防治等技术,如图4所示。

图4 数据保全技术体系架构图

(1)备份技术。所谓备份就是当出现文件或者数据丢失或损坏等意外情况时,将电子计算机存储设备中的数据复制到磁带等大容量存储设备中的过程。备份分为系统备份和数据备份。系统备份在我们的生活中很常见,电脑系统就可以设置系统备份,当磁盘损坏或者造成损伤、系统被病毒入侵或者用户操作失误删除档案数据时,便可以使用系统备份将操作系统事先贮存起来;
数据备份是容灾的基础,为了防止档案数据丢失而将全部或者部分数据复制到其他的载体中的过程,用户可以将档案数据存贮起来,在数据需要恢复时使用;

命题 4.1 如果测度Μ(B,K), 那么μ是界为B的Bessel测度当且仅当定义的算子F*有意义, 线性有界且

(2)镜像技术。镜像技术是集群技术的一种,镜像技术是将处在同一个网络下的两台服务器通过一定的网络设备,将它们的硬盘做成镜像。其中一台作为主服务器,另一台作为从服务器。只有主服务器通过网络向用户提供服务,从服务器被锁定以防对数据进行改动,镜像技术能够捕获全部的数据包,不会造成丢包的情况。同时,当主服务器发生故障不能正常使用时,从服务器会及时接管主服务器的应用,继续维持正常的运行;

(3)文件加密。这是一种对数据文件加密的技术。无论是政府还是企事业单位都会有对于本单位来说非常重要的、隐私的文件和数据,需要对这些文件进行加密处理,目的是防止文件信息的泄密和窃取;

(4)数字签证。数字签证是仅有信息提供者或者信息发送者产生的,其他人不能伪造的一段数字串[9],是保证信息真实性的有效证明。我们可以通过数字签证来防止后续的抵赖行为,因为接收方可以出示签证给别人看信息的来源。同时,传输档案数据的双方都希望数据在途中不会被篡改,数字签证能够有效的保证档案数据传输的完整性;

(5)访问控制。访问控制是几乎所有系统都需要用到的一种技术。它通过一定的网络协议以及控制标准对用户的日常行为进行控制。例如,在我们日常生活中,电脑中的一些文件在打开时就需要“以管理员身份打开”,这就是访问控制的一种体现,目的是防止对电子文件信息的乱用和破坏;

(6)病毒防治。在大数据背景下,数字档案也时刻面临着危机。例如:计算机设备中病毒导致档案数据文件丢失。针对这种情况,我们需要安装补丁程序,修复系统漏洞,尽量保证计算机设备的稳定运行。

2.4 管理制度体系架构

数据保全管理制度是一种动态的过程管理,将数据保全思想贯穿科学数据管理的整个流程[10],如图5所示。

图5 数据保全管理制度体系架构图

首先,习近平总书记提出要加强诚信科研作风学风建设的重要指示,我们要从国家层面设计数据保全管理制度,各主体明确职责,强化作风学风建设,实施科技监督,坚决抵制造假行为。通过设置激励机制,营造良好的档案数据保全环境,从档案数据接收模块到档案数据利用模块,每一个层次都要确保人员提供的完整性,档案数据的准确性,使后续的保全工作更加可靠;

其次,要将数据保全技术融入科学数据汇交及归档工作。档案数据保全工作的核心是运用先进高效的技术维护数据安全,派遣专人对档案数据进行管理,固定时间将档案数据交给负责人,同时也要及时进行归档,将符合归档条件的档案数据定期存储到能够长期保存的载体中。同时,在进行电子文件归档工作时,应按其基本技术条件进行检测。例如:硬件环境和软件环境的有效性以及其信息记录格式等,从而保证电子档案数据的保全;

再次,要做到强化数据管理能力,保证在数据利用模块的数据是准确可靠的。档案管理工作人员要按照有关规定做好文件材料的收集、整理、分类、归档等工作,也要按照归档要求,将文件材料按时归档,归档要求包括:把带有归档标识的电子文件集制成归档数据集,复制到相应载体中并做好标记,一式两份,一套封存保管,一套供查阅使用,必要时可复制第3套,异地保存[11]。针对档案管理人员来说,更重要的是工作人员应当遵纪守法、忠于职守,维护电子档案数据的完整与安全;

最后,要实现数据永存,将档案数据进行科学的存储和管理,明确需要长期保存以及有长久保存价值的数据的保管期限,同时还要跟踪文件格式的发展及其变化,真正实现数据保全的动态化管理。

3.1 保全对象

在档案数据保全中,我们需要保全的对象除了档案实体以外,还有档案生存环境的安全[12]。档案安全的存在环境是档案实体保全的基础,所以我们在注重保全档案实体安全的同时,也要保证档案数据所处环境的安全。同时,我们虽然已经发展到了信息化的时代,但是传统档案数据的安全管理也不能忽视。除此之外,每一个档案数据都有其相关材料和相关文献以及元数据,我们在保全档案本体的同时,也要保全维护档案相关材料及其元数据的安全。

3.2 保全主体

无论是档案数据的提供者、管理者、存储者还是利用者,都必须提升安全意识,注重档案数据信息安全,同时,在当今大数据时代,还需要有一定的决策能力和信息挖掘、高度整合的能力,将传统的纸质档案数据保全理念转变,这也对在大数据时代进行档案保全工作的档案保全工作者提出了更高的要求。这种信息化的电子数据保全更加注重专业化、多样化和细致化,这就需要档案管理者有着更加细致的分化,每个阶段的管理者都要明确职责,有着专业的操作,认真细致的去完成自己的工作任务。并且,大数据与云计算、云存储的联系也比较广泛,档案工作者也需要加强这方面的能力,了解档案数据保全工作的算法和形式,从而更加精确的完成工作,各司其职、各守其则,共同努力来确保档案文件的安全。

3.3 保全手段

灵活运用综合性的保全防护体系,综合运用技术、管理和法规等各种手段[13]。着眼于档案保全风险的评估、保全措施的组织实施以及保全手段的制定等,这些对于构建档案数据防护体系来讲都是很重要的内容。如果档案的数据资源不能得到综合性的分析,会降低档案保全的整体效率,效率降低就会影响社会的稳定性,不利于社会的稳定发展。所以,档案保全工作需要通过与大数据、云服务、云计算等相关资源进行整合,明确档案数据保全的核心目标。同时,档案信息安全必须与科学技术、有效管理和法律法规相结合,从体系构建、人员管理、技术方法、策略手段等各个方面进行综合保全。

3.4 保全策略

3.4.1 信息共享,集中管理

随着科技的进步,大数据环境的发展,档案数据管理对象也逐渐演变成了多样化、信息化的信息。针对这些层出不穷,海量的档案数据,像传统档案数据一样进行独立保存是很复杂的,我们可以设立电子文件档案数据保全系统,将各个部分的档案资源数据整合起来,集中管理,形成一个统一的利用平台。除此之外,这个系统也可以对外使用,实现信息共享,各个企事业单位的档案工作部门,例如:档案室、资料室等也能够充分发挥保存档案数据信息实体的功能。

3.4.2 标准统一,规范管理

对于电子档案数据的保全和管理的制度和标准必须严格由电子文件档案数据保全系统制定,统一标准后根据制定的技术制度进行统一规范管理。通过严格的数据形式、标准的操作流程以及统一的档案数据利用方式,充分发挥电子文件档案数据保全系统的作用,让其在数据管理、信息利用等方面发挥价值,使档案数据在不同层面都能够为档案事业提供帮助,最大化电子档案数据的价值。

3.4.3 预防为主,防治结合

不仅抓防范,也要抓治理,当今社会环境条件下,各级政府和企事业单位几乎都在为面临的大量信息资源管理苦恼,尽管有的部门已经采取了措施,例如,构建档案信息库或者增加人手来满足实际发展的需求。但是,时代一步一步变迁,会产生更多的信息,新的信息也会不断的存储和整合到档案信息库中,那古老的信息就很难做到保全,甚至需要被销毁,因此,在积极实施主动性防御的基础上,我们必须要对目前已经不完整的档案或者随时面临丢失的档案展开保全和修复,避免这些档案的安全以及所处的环境进一步恶化,尽最大努力将损失降到最低。

3.4.4 落实行动,着眼用户

档案数据保全工作除了要与时俱进,紧跟当今大数据时代的步伐以外,还要针对用户需求,从实际情况入手,了解用户行为、用户习惯,在信息检索和数据保全方面加强,运用大数据将当前的档案数据进行分类和归纳,分为不同种类和不同方向等方面,不仅可以提升检索的速度,还有利于用户的使用便捷性[14]。同时也要利用大数据对档案数据做好可靠的保全,只有通过不断建设保密工作安全体系,加强档案数据安全保护意识,才能避免档案数据的泄露,真正做好保全工作,以防给用户带来不必要的麻烦,造成不必要的损失。

3.4.5 法律约束,贯彻落实

为了保证档案管理和档案保全体系的合法化,我们也可以颁布一些相关法律法规,让档案管理工作者和用户自觉遵守法律法规,营造一个更加公平正义的社会氛围。国外针对档案数据保全的研究中,英国在1838年颁布《公共档案法》,在后续的几年陆续颁布了《信息公开法》、《信息自由法》等其他法律,这些法律法规对档案本身、档案保全等各项工作以及档案事业的发展进行了约束。依法管理档案也成为了全球各国档案管理的大趋势。此外,我们也可以在每一个阶层都制定相关的工作规章制度,无论是各企事业单位的档案管理部门,还是各级档案机构,无论是基层政府还是地方各级政府,都必须着眼档案数据本身,结合档案工作需要制定相应的规章制度,保证员工遵守。同时,我们也可以定期召开总结会议,各部门可以详细讨论和分享近期感觉有效的档案保全方式方法,增进档案人员的相互了解和交流,让国外的优秀学者也有机会参与进来,从而促进档案法规的贯彻实施。

随着云计算、大数据的快速发展,日常工作生活中的数据呈现爆炸式增长,日益增长的数据使得文档管理技术领域也得到相应的发展,电子档案逐渐取代纸质档案成为主流的文件记录形式。在档案数据保全和档案数据管理运用大数据时我们要有明确的目标和合适的标准。不要盲目的查找、分析和保全,不仅降低工作效率,也很难取得一定的成果。同时要注意潜在的风险。通过明确权限,明确责任来控制这些风险的发生。大数据时代的来临和发展,对于档案数据管理和保全工作者来说,既是一个挑战也是机遇[15]。当代技术一步步成长,为我们提供的电子平台也更加丰富多彩,档案数据保全在被人们利用的越来越广泛的同时,也会出现不同层面的问题,都需要我们更加细致认真的去解决。我们要加强学习,在实践工作中总结经验,吸取教训和不足,提高档案数据保全能力和工作的认真程度,保证档案的完整性和真实性。

总而言之,在大数据飞速发展的今天,我们也要面对时代发展,迎合时代变迁,提高大数据的使用率,巧妙的运用云储存和云服务来保证档案数据保全的可靠性,为我们的生活带来诸多便捷[16]。尽管我们处在现阶段信息技术优化以及大数据资源整合的背景下,但是我们可以以传统档案管理为基础,更新档案数据保全观念,更好的运用大数据为我们带来的便利。

推荐访问:数据 保全 架构

本文来源:http://www.triumph-cn.com/fanwendaquan/gongwenfanwen/2023/0725/91558.html

推荐内容