能源行业解决方案
 

前言

      能源行业大型集团公司档案管理系统需要处理的档案类型比较丰富,包括有各种文件、表格、单据、图纸、照片、录音、录像等多媒体资料等,非常需要进行分类归档管理,并能及时提供检索利用。     

      档案管理系统与办公自动化系统有着紧密的联系,档案资料管理的电子化、网络化是数据信息共享的基础条件,在办公系统中,所有办理过的文件都需要进行归档,以备日后查询。文件归档管理实现各种文件的分类、归档、存储、编辑、查询、打印。

      除此之外财务系统、人力资源、业务系统都需要与档案管理系统有一个高效的接口,各种数据可以源源不断地自动流入档案管理系统中来。
      为此系统采用当前最先进的网络技术, 系统运行模式为纯BS(Browse/Server)模式。利用计算机与现有的网络技术实现对各部门形成的科技类、文书类、公文类等其它类型的档案,从电子文件的形成、收集、整理,最终归档及网上查询利用、借阅统计进行全面管理,实现档案信息管理传输的自动化、文档一体化、共享化,充分利用计算机实现档案管理,取代原有手工管理档案的落后方式,提高工作效率,将档案部门建设成一个先进的、综合的数字化档案部门。

主要建设部分
      系统具有开放体系结构的,易扩充的,易维护的,具有良好人机交互界面的档案管理系统,具体要求如下: 
      a)系统符合《中华人民共和国档案法》、《文书档案文件级目录数据库结构与著录细则》的有关规定要求。     
      b)能结合现政府政务办公系统,满足政府各单位收录的所有档案按目录分类进行著录存储。支持文件分全宗、分目录批量导入到档案管理系统,并可以刻录光盘等介质永久保存。支持文件正文和附件的电子文档导入,文件格式支持pdf、word、cet、ppt、xls常用文件格式,支持扫描、图像、影音等格式文件。对原有历史归档文件可以手工著录或与其它档案管理系统接口导入。 
      c)实现各单位将处理后的文书、资料进行归档,按年度、季度、月度对文件进行组(立)卷等。收集的文件、材料,要按照档案要求进行整理,根据档案的利用价值分为永久、长期、短期三种保存。 
      d)建设内外网门户,提供分权限网络借阅、查询等管理。最大限度地提供检索手段,提供模糊检索的功能,通过查询档案文件中的几个残缺不全的词语,也可以找到目标,提高检索效率。再检索结果内容较多,还可以在检索结果中再检索,逐步缩小范围,直至达到要求。,检索结果能同步显示档案正文内容。能把已存储的档案信息等生成报表并打印出来。 
      e)支持海量数据存储,可以录入10亿条记录及更大数据量信息。 
      f)系统的可扩充性,档案管理系统在开发过程中,应该充分考虑以后的可扩充性。例如用户查询的需求也会不断的更新和完善。所有这些,都要求系统提供足够的手段进行功能的调整和扩充; 
      g)档案管理系统需web方式进行管理。界面友好,操作简单实用,使非计算机专业的人员可以轻松掌握系统,同时提供专业人员一个功能强大的定制工具包,这样系统就实现了功能性和易用性的完美结合。 

系统的核心功能: 
      电子公文的交换(收发文)、归档和移交三个节点,是电子公文文档一体化业务流程中的三个关键点,涉及不同OA之间、办公系统和档案管理系统之间、档案室档案系统与档案系统间数据交换。 




系统结构
先进技术的采用
      量子档案管理系统在技术上的先进性在业界是有目共睹的,公司从1991年开始进入这个领域,在档案管理系统的开发经验及成熟度上在业界是无出其右的。 
      为了更好地使档案管理系统能够达到国内最高水平,我们在这套系统中采用了我公司最新研制的大量高新技术。这些技术填补了国内的空白的,有些完全可以达到国际水准,这在我们的下面介绍中会有充分的体现。 
组件化、平台化、集成化的档案管理系统 
      随着计算机技术的发展,在企业信息化的过程当中,基于Internet的B/S的三层(甚至N层)结构的软件产品已得到广泛采用。我们认为,实现组件化、平台化和集成化,是现在和未来中国信息发展的必经之路,尤其是档案管理系统的发展方向。 

系统组件化对于系统具有大量的优点: 
      可以使软件在功能上采取分布处理的方式,可以分散单一服务器上运算的压力,提高系统响应时间。如我们产品中的 OCR识别组件、文件管理、流程管理、数据接口组件、打印编目组件,这些都可以安装在不同的服务器上,完成各自的工作,这样对于档案数量较大,利用人员较多的场合,系统具有很好的性能。 
      采取组件化的系统,开发人员可以专著每一个组件的开发,这样需要考虑的细节大大简化,这样每个组件开发的难度无形当中就得到降低,这样每个组件的开发质量就得到了很大的保证,这样整个软件的质量从技术上就得到了很大保证。在国际软件工程中,软件质量的控制一直是一个难题。虽然采取了各种控制标准,如ISO9001、CMM/CMMI等质量控制体系,但软件质量的难题一直没有从根本解决,相反随着软件规模的膨胀,这个问题反而越来越突出。但与此相反的例子是采用组件化的系统,软件的质量还是具有相当的保证,得到用户的认可,这是国外资深软件架构师从大量例子统计出来的。其实这是必然的,当我们把一个规模较大的系统能够分解成比较小的组件时,软件开发的难度必然会降低很多。这如同盖房子,采用秦砖汉瓦的房子在房子的强度上必然比不过采用预制件的现代化的房子,虽然秦砖汉瓦的房子在其它方面具有一定的优势。而预制件相当于我们这里讲到的软件组件。 
      为了适应客户的个性化需求,广泛采用组件化技术成为厂商开发的主流方向。量子档案管理就大量采用了组件化技术,现在已有几十种组件,方便不同的用户进行个性化组装,从而定制自己独特的系统。 
      随着制造业信息化软件功能的日益复杂,软件开发技术面临着前所未有的挑战。实现平台化成为必然趋势。所谓平台化,就是把软件设计在统一的架构上,把不同的业务模块建设成“插件”,可以方便地“拆卸”和“添加”。如我们的档案管理组件就是这样的“插件”,可以根据需要随时添加和“拆除”,这样系统在扩充上具有很大的弹性。 
      同时由于企业的档案管理及应用流程随着企业的发展变化会不断变化,因此,传统的功能固化的档案管理软件会难以适应企业的变化。采取组件化的系统可以根据用户的变化随时更换不同的组件,或者调整系统最外层架构,就可以满足用户变化的需求。如同汽车出现问题,只更换部分配件就可以了。使软件能够具有柔性,适应企业的发展。     
      企业中信息化子系统的集成是一个必然的趋势。如档案系统需要与OA具有紧密的接口,与财务、业务等部门也是需要一定的通道。由于我们采取了组件化的系统,系统之间可以通过组件进行沟通联系,组件通信的协议一般采用internet的基础协议HTTP及SOAP和XML格式,这些协议和格式都是跨平台的,这样任何平台的系统可以平滑的无缝连接,所以组件化的系统无疑在信息系统深度集成方面具有天然的优势。 

OCR智能识别系统
      量子档案管理系统在数字化加工的过程采用了自动OCR技术,用户原有的纸质文件可以通过扫描仪直接进入计算机中,并且扫描的同时,系统把扫描的数据经过OCR处理变成可查询的文字信息。然后再采用全文检索技术,用户可以随时对数字化加工过的档案信息进行全方位的查询,这样就完全解决了一个企业档案信息资源被大量闲置无法利用的局面。 
      在OCR处理过程中,我们采用双层PFD技术,扫描的档案原件和识别后的文字分别存放在PDF文件中的不同数据块中,这样既可以使用户可以看到档案原件的原貌,又可以查询其中的文字,做到两全其美,彻底解决了纸质档案原件的管理问题。 

档案数据流
     档案数据类型分为以下几种: 
      1.条目信息。 
      2.扫描原文。 
      3.电子文件。 
      4.音频数据。 
      5.打印报表。 
      体积较大的如音像视频数据,小到几兆大到几百兆,甚至达到几个G,这样在用户使用系统时就会出现一定的延迟。除了条目信息,其它类型的数据也会出现类似的情况,如扫描原文数据、打印编目数据等。 
      为了提高系统的响应速度,不只是音频数据流,其它类型的数据,我们同样采用了数据流处理技术,这样在用户浏览档案信息时可以及时响应。对于数据流的处理,我们采取了WEB服务器技术,对数据流采取了多数据缓冲池技术,使数据流读取速度得到很大提高,解决存储档案巨型数据的使用难题。 

严密的安全控制机制
      档案管理的安全保障是必须重点考虑的,在我们的系统中采用了先进的电子证书认证系统(CA),在系统的方方面面都具有完备的安全措施,可以完全满足安全方面的需求。 
      1.系统登陆时用户身份的确认,可以采用智能卡方式,智能卡中保存CA证书。用户不用输入口令,直接使用智能卡就可以进入系统。 
      2.档案库中的字段可以指定为加密格式,加密可以采用证书加密或通用加密,这样即使非法用户从系统内部获得数据,也无法得到真实的数据信息。 
      3.在数据传输当中根据CA证书采用SSL方法进行传输数据的加密,这样可以充分保证数据在传输过程当中数据的安全性。 
      4.在各种档案审批过程当中,采用数字证书进行数字签名,对审批人的身份进行确认。这样可以保证对档案的各种利用过程的标准化,进而确保档案数据的安全。 

游戏组卷
      对于档案的整理一直是档案管理的一个重要的工作。在我们国家档案标准中一直存在这样的原则,相关文件应该整理放在一起,即使是新的整理“规则”也是如此。 
      计算机整理档案一直存在的问题是,每个文件在计算机中的表现形式是一行文字,虽然中间有表格线分开各个项目。这与实际文件的形态截然不同,人们实际整理文件时需要对文件的位置,文件所处的卷(盒)做出频繁的变化。计算机中的文件形式和操作方式很难满足需要。这些是使用过老式档案管理软件用户的一个由衷体会。 
      我们根据这种情况进行了多年的研究分析,开发出了满足用户需要的“游戏” 组卷,文件被轻松拖拽到任意案卷(盒)中,每个文件以纸牌的形式出现,用户通过手工或自动的方法,把相关文件放在一个案卷中或档案盒中。可以对文件重新编号,也可以生成新的归档目录,整个过程完全是可视的,并且用户可以随时手工干预。 这个功能完全解决了多年困扰档案人使用计算机整理档案的难题,在国内是一项创新技术。 

全程条码支持
      在计算机中管理档案中,经常被忽视的问题是计算机中保存的档案信息与实际档案原件的对应。 
      虽然我们可以通过计算机中保存的信息,查到实际的档案原件,但当这种查找的次数变得比较多的时候,就会出现效率的问题。如我们在整理档案的时候,会随时需要档案原件与计算机中的信息发生关系,或者在档案归还时需要快速归还时,就需要快速的实现原件和计算机信息的对应,这时采用条码技术就是一个最好的选择。 
      在我们的系统中可以给每份文件分配一个代码,这样在文件信息查找,或档案原件归还时,可以快速找到计算机中的信息,提高了办公效率。 
      需要提醒的时,分配条码的时间最好是在文件生成的时候,如在OA系统中为每一份文件分配条码,并与实际文件放在一起。对外来文件也最好随时分配一个条码,这样为日后的管理打下一个好的基础。 

单点登陆(SSO)
      当前企业信息管理中,往往有很多的应用系统,如办公自动化(OA)系统,财务管理系统,档案管理系统,信息查询系统等等。用户在使用这些应用系统时会出现这种情况。用户每次使用系统,都必须输入用户名称和用户密码,进行身份验证;而且,应用系统不同,用户账号就不同,用户必须同时牢记多套用户名称和用户密码。特别是对于应用系统数目较多,用户数目也很多的企业,这个问题尤为突出。问题的原因并不是系统开发出现失误,而是缺少整体规划,缺乏统一的用户登录平台。
      单点登录(Single Sign On, SSO)平台就是为了解决上述问题而提出的。单点登录平台能够简化使用流程,用户只需要登录一次,即输入一次统一的用户名称和用户密码,就可以多次使用多个应用系统。 
      为了使档案管理与其他系统同时方便地使用,系统具有SSO子系统,当于其它系统集成时可以采用我们的单点登陆系统,这个子系统的特点如下: 
      (1) 同时支持多种平台的应用系统,基于J2EE和.NET开发的应用系统均能够实现单点登录。不仅能够兼容C/S结构的应用系统,也能够兼容B/S结构的应用系统。 
      (2) 采用了电子证书的方式,对用户信息进行高强度的加密处理,能够保证用户认证的安全。
      (3)支持多种认证方式,通过提供统一的认证平台。不仅支持普通的口令认证方式,也支持其他认证方式,如指纹识别认证方式,IC智能卡认证方式等。 
      (4) 完善的日志功能。单点登录平台能够详细记录用户使用单点登录平台的情况,包括登录时间,登录用户名称,登录的应用系统,登录时使用的客户机IP地址。 


档案中间件

      传统的档案管理系统,都会存在以下问题: 

      一个省档案局或市档案馆,下面会有许多档案局,每个档案局都保存着各自的档案。现在虽然都用上了档案管理系统,也提供了档案查询接口,但档案查询时还是只能查询到各自的档案信息,“信息孤岛”现象无法解决。一个大型的单位,会有许多的分公司,每个分公司地理位置分布较远,保存有各自的档案,如何协调管理?如果各自保管,还是会产生“信息孤岛”现象。如果档案数据集中存放管理,数据的安全肯定得不到保障,同时数据的维护工作也是比较困难。 
一个大型单位,档案的数据量随着发展越来越大,查询速度越来越慢,管理起来越来越吃力。 
      针对以上情况,一种全新的管理模式在国际上产生,它就是采用网格技术理论的档案网格模式。网格(Grid)这一名字,第一次出现在90年代中期,为高级科学工程所描述的分布式计算永久性基础所用术语。Lan Foster和Carl Kessman的著作《The Grid:Blueprint for New Computing Infrastructure》中第一次对网格作了解释。他预见到未来的网格将是全部计算资源,而目前WWW只是包含信息的文献。网格用户能在他们的分布式高性能计算机上访问和处理存储装有TB数据的全球数据库,通过适当工具来控制资源。 
     档案网格上的每个节点就是我们上面提到的基层档案局或分公司,这些节点上的档案还是由本单位自己管理,由于对自己的档案比较熟悉,这样维护起来非常方便,并且安全性得到保证。这些节点通过网络连接起来,作为一个整体提供档案的利用查询,相当于档案都放在了一起。 
对于一个大型的单位,如果档案的数据量较大,可以采取分配多个节点的方法,从外表上看还是一个节点。这样显而易见的是管理变得比较容易,并且系统负载更加合理,系统的扩充性会得到充分的体现。 
     我公司的档案中间件就是实现这种功能的产品,可以在每一个节点上使用一个中间件服务器,这样这个节点的档案数据的管理都可以通过这个中间件进行管理。由于采用了中间件,系统可以方便地实现跨平台操作,操作系统和数据库可以采用市面上流行的任何类型的产品。这样对于档案管理系统与其它系统的集成也是比较方便容易的。 
      从这里可以看出档案中间件在档案管理行业内是一个划时代的产品,夸张地说,它把档案管理软件从“饮毛茹血”的时代一下发展到“网格”时代,这种说法随着时间的流逝会变得越来越清晰。如果哪一天您从计算机中一次可以查询到全国各个地方档案馆的档案信息,您不要吃惊,它一定是中间件组成的档案网格正在为您效劳! 


结构图
     
      可以看出单位之间或单位之中档案服务器之间通过中间件连接在一起,组成网格档案,网格中的档案可以作为一个整体提供档案的查询。
      中间件按照功能可分为如下种类:中间件管理、任务分配、用户权限管理、数据维护、数据查询,根据需要配置不同的中间件就可以实现强大的档案分布管理能力。 
超强定制功能的档案管理
    1.界面简洁,采用单窗口方式,避免用户纠缠在多窗口中,提高了使用效率。 
    2.细粒度权限设置,权限控制可以精确到每个记录,直至每个字段。 
    3.多种输入方式设定,包括主题词自动标引、列表输入、重复、序号等方式。 
    4.按照国家标准进行年报统计,并且可以自动统计,不需手工填写。 
    5.具有历史记录功能,用户每一步的操作失误都可以立即修复。 
    6.具有数字安全证书高强度安全措施,实现数字签名及身份认证。 
    7.打印编目功能丰富,可以设计任意编目格式,所见即所得方便快捷。 
    8.任意设定多表关联,实现档案中案卷和卷内管理模式。 
    9.档案整理组卷采用“组卷游戏”,使整理档案象玩扑克牌一样轻松愉快。 
    10.在线升级功能,可以随时对系统进行升级,保证用户随时使用最新版软件。 
    11.在线错误信息提交功能,系统的状态可以随时提交给软件技术人员,并且对用户提供特殊的、细致入微的服务。 
    12.具有档案数字加工能力,并且可以制作光盘,光盘可以独立浏览。 
    13.对于扫描原文采用OCR识别,并且可以根据全文索引进行查询。 
    14.具有档案借阅、销毁、移交、统计、鉴定等全部档案专业功能。 
    15.具有库房管理,出入库登记,可以随时了解整个库房档案保管状况。 
    16.具有电子文件管理能力,支持任意格式文件,包括视频音像文件。 
    17.具有全宗管理功能,对每个立档单位信息都有详细的记录及管理。 
    18.扫描原文采用最新压缩标准JPEG2000,并且支持多种图像格式。 
    19.对于常用的数据批量修改和拷贝功能,可以预先设置方案,选择方案名就可以自动运行。 
    20.可以任意建立预归档和正式归档库,符合电子文件归档标准。 
    21.具有OA接口,自动提取Domino、关系数据库中的数据,具有识别新旧数据能力。
    22.支持多种数据库类型:SQLServer、ORACLE、Kingbase等。
系统逻辑图

系统安全设计
      系统安全与保密是本方案中重要的技术要求。系统的安全与保密包括信息传输全过程的安全与保密、数据库信息管理、WEB数据库信息管理、网络用户的身份确认等。 
     1、细化用户访问权限控制列表(ACL)。每个用户的权限可以细化到每一份文档的读取、创建、删除、修改等,同时对字段的操作权限也能灵活控制。 
     2、细化用户使用系统各个功能的权限,档案管理系统能做到控制到用户的对系统界面按钮的每一步操作。 
     3、采用网络防病毒软件,对网络病毒实行集中的监控管理。 
     4、完善的备份措施。磁盘阵列与刻录机(刻录光盘)等备份方式并行采用。 
     5、档案管理系统具有时时备份功能,防止用户误操作。 
     6、档案管理系统具有强大的日志功能,能记录所有用户的每一步操作。防止一切窥视档案信息的事件发生。 
     7、采用成熟的防火墙技术来保障网络免遭攻击。 

存储安全设计
      档案数据的特点是海量存储、逐年积累,特别是随着社会的进步,可归档的资料每年都加速增长。因此,如何有效地对海量数据进行管理,使系统不至于因为数据量大而减低速度,是决定数字化档案系统效率的决定因素。 
      考虑到系统的巨大数据量及可靠性、安全性、快速查询的要求,本方案采用磁盘阵列+刻录机多种介质存储提高安全性,其主要优点是: 
      1.磁盘阵列+刻录机多种介质存储。多种介质的存储形式不但可以提供相同资料的不同介质以供使用方便,更大的作用在于把资料分成不同介质存储提高了资料存储的安全性。 
      2.磁盘阵列。磁盘阵列采用SCSI+RAID5的技术,在首先保证快速存取的前提下,通过RAID技术对所存资料进行备份,即当其中的一块硬盘受到损害,无法存取时,可以有其他硬盘通过RAID技术还原其数据。提供优秀的数据存储安全性。 

系统应用设计
      通过系统结构逻辑图可清晰反映档案管理系统的相关流程。 
作为局域网中业务终端,对于已经形成电子文档的档案信息可灵活通过案管理系统中的数据编辑模块,直接与对应的档案库中的条目信息挂接进行归档工作。对于未进行数字化工作的档案原文可通过数字化设备,首先完成档案原文的数字化工作。后进行挂接存储归档,通过局域网+ (企业版 C/S模式)确保各部门共同完成档案信息的数字化、文件的归档工作。数字化形成的档案信息通过档案数据管理服务器方便快捷存储。为利用做准备。 
      数字化后的档案信息通过档案查询利用服务器与档案数据管理服务器共享数据库的方式,利用档案查询利用系统实现档案信息的时时发布,保证设各部门及其下属部门业务终端对档案信息的查询利用。达到档案信息充分共享的目的。