设为首页 | 加入收藏 | 登录 | 注册 
  • 当前位置:首页 » 新闻中心 » 行业知识库
  • 基于CSDB的IETM系统中数据的标准化处理

    发布日期:2014-12-24   信息来源:来自网络  浏览次数:
     

    交互式电子技术手册(IETMInteractive Electronic Technology Manual)20世纪90年代出现以来,由于其拥有表现能力强、查询方便、易更新维护、数据共享、能即时远距离传输、允许多用户同时阅读等诸多优点,世界各国竞相发展。近年来,IETM的发展出现了两种趋势:一是随着网络技术的发展,出现了基于web的交互式电子技术手册。所有技术资料都存入公共源数据库(CSDB)中,通过网络共享。二是随着XML技术的发展,采用XML作为数据格式标准。

    可见,IETM发展的方向,是建立一个利用网络数据库共享、采用XML格式进行数据交换的标准化数据环境,使技术数据一次生成,多次传递使用,让不同地区的用户通过网络能及时有效地获取IETM信息。这样,技术数据的标准化犹成为IETM系统的关键。

    技术资料的描述

    S1000D是技术出版物的国际标准,由欧洲航空航天与防卫工业委员会(ASD)和美国航空工业协会(AIA)共同维护。S1000D的核心概念是数据模块和公共源数据库,数据模块是技术出版物中能够自包含的最小数据单元,技术信息以数据模块的形式存储在CSDB中,并以XML作为文档交换格式。

    S1000D将技术信息分为描述、任务、故障隔离、维修计划、人员、图解零部件、战场损伤与抢修、布线、过程等九种类型,而我国多数装备的技术资料是按照ATA100的标准分类的,差异较大,需要重新分类。例如,某型飞机的技术资料包括维修大纲、指令卡片、操作卡片、技术说明书、图解零部件目录等五大类,每一大类又分为若干子类。以维修大纲为例,包括飞行机务保障、区域检查、结构检查、系统/设备检查、动力装置检查、润滑/保养等六个子类,另外还有前言、一般规定、区域划分、维修舱口盖板图、名词术语等附加信息,与S1000D标准信息的对应关系如表1所示。

    技术资料均以XML文档的方式保存,而XML只说明数据的结构,并不关心数据如何描述、数据是否正确,所以在用XML语言描述技术数据时,关键是要定义数据的SchemaXML Schema用来描述XML业务数据必须遵循的规则,指定文档的结构,以及文档中所包含元素和属性的数据类型。XML schema不仅可以定义XM比文档的结构而且还能约束文档的内容,因此,如果能够针对每种技术数据制定出标准的schema,通过schema对数据模块XML文档的验证,就可以有效地保证技术数据的标准化。S1000D中已经提供了所有数据模块的Schema,并允许各系统根据实际需要进行合理裁剪。依据维修大纲中各类信息数据的内容,对S1000D中维修计划数据模块的Schema进行了调整,建立起维修大纲的Schema,见图1。虚线框中为任选元素,实线框内为必选元素。从图中可以看出,维修大纲数据模块的根元素是dmodule,它包含三个子元素,分别是描述性元素description、状态元素idstatus和内容元素content。其中,必选元素idstatus包含该数据模块的状态信息,包括数据模块的唯一标识码一一DMC码、数据模块的标题、数据模块的版本信息、发行日期等。数据模块的所有内容包含在另一必选元素content中,并且可以通过任选元素refs参引其他数据模块。

    数据存储

    在基于Web的交互式电子技术手册中,所有技术资料都存在网络数据库中,这就要求数据库必须安全、可靠。就数据的储存而言,关系型数据库已经是相当成熟的应用,在基础理论、技术、算法、应用、安全、管理、控制等各个方面已经非常成熟,所以本系统的设计选用了关系型数据库SQL Server。目前,XML文档在关系型数据库中的存储方式主要有两种。

    1. 两维表数据映射方式

    关系型数据库把数据表示为简单的两维模型,即行与列的记录来进行存储处理。而XML是以层次性的树状结构作为储存架构,通过元素(Element)和属性(Attribute)来包含数据。所以在用关系型数据库存储XML文档时,就必须依据XML SchemaXML文档进行分解,找出元素和属性与数据库的映射关系。映射时的基本原则有三条:

    (1)复杂元素映射为数据表。

    (2)简单元素与属性映射为表中的字段

    (3)元素间的层次关系映射为表间的关联,在父元素与子元素之间建立主键一外键关系。

    由于每种信息类型的Schema中定义的元素少则数十个,多则数百个,每个元素还有多少不等的属性。因此,采用关系数据库的两维表数据模型存储XML文档时,需要建立和使用大量的数据表格,造成存储空间的海量增加;XML Schema中的任选属性对应的字段大量为空,又造成存储空间的大量浪费。而当数据需要输出时,又要反过来将已分散设置的大量的两维数据表,利用索引等技术进行连接后,组合、还原成XML文件,数据量较大时,就会大大影响到应用系统的响应速度。对于某个机型,技术资料的数量庞大,结构复杂,经过试验,我们认为此种存储方法对于IETM系统并不适合。

    2. XML原生态方式

    近年来,关系型数据库大大增加了对XML的支持,SQL Server2005中就增加了xml数据类型,允许直接将XML文档存入字段中,并通过XML schema进行文档的有效性验证,确保技术数据的准确。本系统采用的正是这种方式。在IETM数据库中分别建立维修大纲、指令卡片、操作卡片、技术说明书、图解零部件数据表,数据表结构见表2

     

    根据数据模块唯一的标识码(DMC),就可以快速定位,访问Xmlcontent字段中包含的XML文档,使得数据的更新和读取更为有效。同时,不仅能够通过建立XML索引提高查询效率,还可以深入到文档XML内部,通过XQuery函数和XPath语句快速进行精确查询,使查询更加高效、灵活。例如,要在飞行机务保障中查询检查类型为N检的所有区段,XPath语句为://schedule/limit/refinspec[@insptype=N检”]

    数据的解析

    XML的一个最大的特点是内容与显示分离。XML文档中只包含技术资料的内容,揭示信息本身的含义,所以,将XML格式用作数据的传递和交换是最佳的选择。要想在IETM系统中得到与纸质技术资料相同的显示效果,还要用XSLXML的显示格式进行定义。

    XSL(可扩展样式语言)是一种显示XML文件的规范,主要包含两大功能:

    (1)XML文档的转换。根据XSL样式的指示对原始文档进行排序、复制、过滤、删除、选择、运算等操作后产生另外一个新文档。

    (2)XML文档的显示。给XML文档中的元素加入显示控制信息,如表格、文字、图形等,并描述为HTML文件。

    不同信息类型的显示格式也不尽相同,应分别定义XSL文件。例如,飞行机务保障是以表格的形式显示的,为其定义的XSL文件如图3所示,表3为飞机机务保障内容对应的显示结果。

    结论

    S1000D标准是目前发展最快的IETM国际标准,我们遵循这一标准设计开发了某型飞机IETM应用系统,解决的主要问题有:对现有装备技术资料(符合ATAl00)进行信息类型的重新归类,以适应S1000D要求;按需裁剪定义XML Schema;采用XML原生态方式在SQL Server数据库中直接存储XML文档;按现有技术资料的格式定义XSL文件,以确保电子手册与纸质手册显示的一致性。

    关于希盟信 | 联系我们 | 法律声明 | 网站地图

    copyright@2009-2016 西安希盟信仿真科技有限公司  陕ICP备12011946号