数据库需求分析报告(精选5篇)

网友 分享 时间:

【导言】此例“数据库需求分析报告(精选5篇)”的文档资料由阿拉题库网友为您分享整理,以供您学习参考之用,希望这篇资料对您有所帮助,喜欢就复制下载支持吧!

数据库需求分析报告【第一篇】

关键词反洗钱 可疑交易 报告 模式 研究

一、引言

近年来,顺应国际反洗钱发展趋势和金融行动特别工作组(FATF)反洗钱标准的变化,作为我国反洗钱主管部门的人民银行提出了“风险为本”和“法人监管”的反洗钱工作理念,并在金融机构启动了“可疑交易集中处理”试点,这对当前金融机构双向报送的可疑交易报告模式带来了挑战。新形势下,如何构建有效的可疑交易报告模式,提高可疑交易信息处理质量和效率,更好的发挥对打击洗钱犯罪的作用是人民银行亟待解决的问题。

二、当前可疑交易报告模式存在的弊端

(一)双向报送不完全适应风险为本和法人监管要求

目前,我国对金融机构反洗钱可疑交易报告采取基于“规则为本”的双向报送模式,即金融机构按照确定的标准向反洗钱监测中心报送一般可疑交易报告和向人民银行分支机构报送重点可疑交易报告。近年来,双向报送模式取得一定成效,但也存在一些问题:一是金融机构以合规标准筛选出海量可疑交易报送给反洗钱监测中心,但缺乏人工分析的一般可疑交易报告大多成为垃圾数据,反洗钱监测中心不得不花费大量资源进行二次研判,造成了人力物力浪费。二是金融机构向人民银行分支机构报送重点可疑交易报告具有区域局限性,给人民银行分支机构带来履职风险。重点可疑交易往往涉及全国多个省市,仅凭人民银行分支机构获取的客户信息和交易情况难窥全貌,造成重点可疑价值被人为降低,影响了挖掘利用。同时,人民银行分支机构对接收的重点可疑交易如认为价值不高,可不予接收或退回。但由于对可疑交易质量的研判没有统一标准,一旦退回的重点可疑交易线索牵涉案件,将带来履职风险。

在风险为本和法人监管模式下,带来两方面变化,一是法人监管更多强调金融机构的法人责任。从可疑交易报告方面看,金融机构法人要切实承担反洗钱可疑交易报告义务,这要求金融机构要理顺内部关系、统一内部操作,客观上需要取消双向报送,实施单向总对总报送。二是风险为本模式下,人民银行将逐步取消客观标准,主要由金融机构自主判断来报送可疑交易,可疑交易没有了一般可疑和重点可疑之分,使双向报送模式一定程度上失去了存在基础。

(二)在金融机构可疑交易报告集中处理模式下,双向报送成本更高

当前,工商银行在全国开展了可疑交易报告集中处理试点,招商银行、民生银行等金融机构也积极开展可疑集中处理准备工作,可疑交易集中处理已成为金融机构可疑交易报告的趋势。如工商银行的可疑交易集中处理中心一般设置在二级分行或省分行,在设立集中处理中心的省份,其地市分行已不再履行可疑交易分析职能。招商银行拟设立专门归总行管理的反洗钱监测分析中心,集中处理可疑交易,其他分支行不再主要承担可疑交易分析工作。在集中处理模式下,如果金融机构继续按目前的双向报送模式报送,则需要向不承担可疑交易分析的分支机构所在地人民银行报送重点可疑交易报告,这就需要其总部对已经集中分析的数据进行二次分离,并按地区筛选出重点可疑交易反馈当地分支机构,由当地分支机构再上报当地人民银行,这将进一步增加报送成本,使金融机构本已集中的可疑交易又被分离,不符合“可疑交易集中处理”降低金融机构成本的改革方向。

(三)当前人民银行分支机构、基层金融机构人力资源配备难以切实保证重点可疑交易分析质量

从人民银行层面看,一方面目前大量地市中心支行仍未设立专门的反洗钱科室。以山东省为例,全省17个地市人民银行中心支行中,11个没有专职的反洗钱部门,6个设立专职反洗钱部门的中心支行,人数多在4-5人,人力资源明显不足。另一方面,随着风险为本监管思路在人民银行的逐步贯彻,风险评估工作将全面展开,人民银行分支机构要承担风险评估、分类监管和重点检查等繁重职责,人员少、任务重的矛盾愈发突出,将进一步影响对重点可疑交易报告的分析质量和报送数量,双向报送模式难以适应最新的反洗钱监管要求。

从金融机构层面看(以商业银行为例),商业银行可疑交易分析职能目前主要前置到地市分行甚至支行,支行承担大部分可疑交易分析职能,可自行决定是否将可疑交易上报给总行和将重点可疑交易报给分行,由分行报当地人行。由于商业银行基层支行人员配备、技能储备明显不足,报送的重点可疑交易质量较差,这也是目前推行可疑交易集中分析模式的重要原因。

随着人民银行推行风险为本和法人监管,金融机构推行“可疑交易集中处理”,以往双向报送模式难以有效开展。

三、发达国家可疑交易报告模式借鉴

(一)美国

1.接收金融机构可疑交易报告的有关组织及职能

美国金融犯罪执法网络(FinCEN)负责反洗钱情报收集、处理和分配,根据“以大额现金交易报告为主、可疑交易报告为辅”的要求,综合金融机构报告的信息形成金融交易数据库,结合其他政府部门及公众的信息提供情报报告,分析可疑交易,并按需要反馈给相关部门而设立并运作的。金融犯罪执法网络主要任务一是存储和分析金融机构和非金融机构以各种形式提交的可疑行为报告和现金交易报告;二是为侦办案件提供情报和分析帮助,向政府部门提供数据接口服务,供司法部门调查人员和监管部门管理人员在其权限范围内查询可疑行为报告和现金交易报告。

2.信息收集与使用

FinCEN实施入门(Gateway)计划,将反洗钱情报在相关部门间传递和共享,使各种反洗钱力量有机结合在一起,从而以情报为纽带组织起部门间的合作。每一个加入这一计划的联邦、州和地方执法机关都需同FinCEN签订一个协议,经授权后,该机关及其人员就可以借在线访问FinCEN的数据资源。计划提供了专门的搜索和分析程序在完成使用者查询请求的同时,也自动将请求中的信息要素与已有的案例或其他执法机构的执法库的索引进行匹配,找出相关信息,满足执法部门的情报需求。为确保金融情报信息数据库安全,FinCEN与342个外部使用者签订了备忘录,明确责任,确保信息合法使用。

(二)英国

1.接收金融机构可疑交易报告的组织及职能

英国“打击严重有组织犯罪局(Serious Organized Crime Agency,SOCA)”负责收集分析与洗钱和恐怖融资有关的可疑交易报告;识别犯罪资产;开展对未知犯罪或恐怖活动的先期调查,并对有组织犯罪威胁开展评估;向执法部门提供线索,并提供协助以打击洗钱和恐怖活动;侦查刑事、民事案的犯罪收益或税收追回;负责对经济金融调查员开展培训等职责。

SOCA在其犯罪资产部内设立英国金融情报中心(FIU),负责收集分析与犯罪收益和恐怖融资有关的可疑交易报告,识别犯罪资产,开展对未知犯罪或恐怖活动的先期调查,向执法部门提供线索,并提供协助以打击洗钱和恐怖活动。金融情报中心同时还承担反假币的职能。

2.数据收集与使用

英国情报中心(UKFIU)网络数据库(ELMER)收集信息报告主体报送的可疑交易信息,并对可疑信息自动实施搜寻情报调查、汇集、分析处理,由联络中心对ELMER中搜寻到的可疑信息进行分析,将不适合的可疑报告信息返回给报告主体,适合的则向执法机构提交推荐及建议。在遵循保密安全前提下,SOCA准许其他执法机构直接接入可疑交易报告数据库,并鼓励充分使用。SOCA与多家执法机构订立合作协议,准许其直接接入可疑交易报告数据库。截至2010年末,英国已有78家执法部门可以直接接入可疑交易报告数据库,使用可疑交易报告数据来开展工作。

从发达国家可疑交易报送模式来看,反洗钱可疑交易报送均由金融机构总部报送至监管机构总部,监管机构总部统一进行分析研判,并根据情况反馈至下级机构和其他有关部门,使信息得到充分利用。同时可疑交易报告仅有一种类型,无一般可疑交易报告和重点可疑报告的区分。

四、构建我国可疑交易报告新模式的设想

根据风险为本监管要求,借鉴国外工作模式,本论文提出“金融机构总对总报送、监测中心纵横向反馈,人民银行阶梯式使用”报告模式设想。

(一)“总对总报送”

即取消可疑交易双向报送模式,由金融机构对经分析甄别的可疑交易直接总对总报送至反洗钱监测中心,金融机构的可疑交易报告质量直接由金融机构总部负责,反洗钱监测分析中心全面履行可疑交易报告的分析职能。

(二)“纵横向反馈”

即借鉴发达国家充分利用可疑交易数据库、最大限度发挥金融机构情报价值需要,由反洗钱监测中心向人民银行开放数据库。考虑到人民银行分支机构人员配备,并与反洗钱法规定的行政调查权由省级以上人民银行承担的规定相衔接,建议反洗钱监测中心可疑交易数据库反馈至总行反洗钱局和省级人民银行分支机构两个层次。对总行反洗钱局,建议中心反馈全部可疑交易数据,对省级人民银行则反馈本辖区数据。

(三)“阶梯式使用”

按照总行、省级分行、地市中心支行(含支行)三个级别,有侧重性的分级使用数据。下级机构可根据需求向上级行提出数据使用申请,由上级行可临时赋予数据查询、数据下载权限。上下级机构在分析使用数据时进行有效联动,总行、反洗钱监测中心从全国层面进行分析考虑,分支机构从辖区角度进行分析,并承接总行、反洗钱监测中心协查等工作任务,上报分析成果,确保分析质量。

1.统筹使用反馈数据进行可疑交易监测分析

人民银行总行侧重分析数额大,影响广的案件线索或可疑交易;省级分行侧重分析监测涉及本辖区金融机构和客户的数据,在分析辖区可疑线索基础上,积极配合完成总行布置的可疑线索,并向总行上报有价值的分析成果;地市中心支行(含支行)侧重现场检查领域的使用,以涉案线索进行回溯性检查。

2.深入挖掘可疑交易信息在评估中的作用

总行可在法人监管中着重考虑金融机构总行(总部)的反洗钱系统建设、董事会重视程度;省级分行可根据可疑交易报告情况,重点关注金融机构部门配合、业务风险防控情况,同时可对总行(总部)设在当地的金融机构履行人总行监管职责;地市中心支行(含支行)可根据可疑线索倒查一线业务人员履行反洗钱义务状况,同时可对总行(总部)设在当地的金融机构履行监管职责。

五、政策建议

为适应本论文提出的新的报送模式,建议修改《金融机构大额交易和可疑交易报告管理办法》并出台相关指引,明确标准,规范操作。

1.确定新的可疑交易报告标准

修改《金融机构大额交易和可疑交易报告管理办法》,将金融机构报送可疑交易的主观判断要求进行规定,为后续深入开展集中报送试点和推行全面总对总报送提供制度支撑。

2.在反洗钱监测中心向人民银行总行、人民银行省级分行反馈数据时,应明确定位、加强管理

一是制定数据反馈及使用办法,规定各级人民银行数据利用方法及获取程序。二是升级系统数据库,使反馈数据、数据下载及使用的痕迹都在系统中有日志记录,规范数据传递和使用流程,严防泄密风险。三是重新修订行政调查管理办法,对分支行行政调查及资金监测工作重新定位。

3.明确人民银行分支机构在“法人监管”和“总对总报送”模式下的反洗钱监管责任

一是对辖区有法人金融机构的,人民银行分支机构应全面实施管理,可对其外地设置的“可疑交易集中处理中心”进行延伸管理,以体现法人监管工作思路。二是在当地有“可疑交易集中处理中心”的金融机构分支机构,当地人行在反洗钱评估、风险监管和现场检查时,可以纳入可疑交易报告分析内容。三是对当地无“可疑交易集中处理中心”的金融机构分支机构,日常监管中可不予考虑金融机构操作层面的可疑交易报告情况,侧重评价其内部控制、上下级可疑交易报告流程等机制建设方面内容。

参考文献

[1]中国人民银行反洗钱局。中国反洗钱专题研究(2011)[M].北京:中国金融出版社,2012.

[2]中国人民银行反洗钱局。中国反洗钱专题研究(2010)[M].北京:中国金融出版社,2011.

[3]杜金富。银行业反洗钱与反恐怖融资培训手册[M]. 北京:中国金融出版社,2011.

数据库需求分析报告【第二篇】

[关键词] 油田分析试验数据库; 软件; 数据库; 管理信息系统

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2012 . 10. 043

[中图分类号] [文献标识码] A [文章编号] 1673 - 0194(2012)10- 0077- 03

1 分析实验数据库建设前状况

油田分析试验数据主要由采油(气)厂等二级单位试验室、勘探开发研究院分析试验中心样品分析、委托(送交)油田外单位进行的分析试验数3个渠道产生。以往,油田未建立分析试验专业数据库及其管理信息系统,分析试验资料分散、电子化程度低、难以共享、整体利用率低。

2 系统功能需求

2.1 各采油厂功能需求

各采油厂的分析试验工作主要是对油气水进行分析,业务性质相似,因此应统一标准,建立相同数据结构,采用相同的功能模块进行实施。

2.2 样品调度管理系统

样品调度管理系统是分析试验的龙头,主要包含了样品核对分发、送样清单导入,样品接收、样品分发、汇总统计、打印样品交接单、试验通知单、工作量统计报表等。

2.3 数据录入系统

数据录入系统是分析试验信息管理系统的核心。数据源为勘探开发研究院(分析试验中心)、各采油厂等二级单位,涉及检测分析项目40余项,数据项约2 969余个。数据录入的主要功能包括:灵活组织的菜单目录、根据权限录入权限允许的地质试验数据、相关数据项自动计算、关键字段值自动生成、自动提供规范值选项、错误录入数据提示与定位、数据查询检索。

2.4 综合查询系统

以表格、曲线、照片及电子文档等多种方式显示检测报告、分析试验资料、鉴定照片、综合统计信息,综合查询系统是用户访问量最大的子系统,是分析试验数据库能否取得应用成果的关键,因此要求系统具有高安全性、高稳定性、简单易用。

2.5 报表处理

分析检测报告格式多样,包括嵌入曲线、图标等多种形式,且需通过三级审核,才能,因此要求能按批或按单井生成各类带有三级审核电子签名的报告。另外也应能生成工作量统计、送样情况统计、样品动态查询等多种统计报表。

2.6 数据传输

各数据源单位向总库经过数据导入导出、一致性检查、远程数据更新等步骤传送永久数据。数据系统存储的数据大致可分为文本、图像等不同类型的数据载体,上传数据类型为关系型数据。

2.7 数据质量控制系统功能需求

开放式交互系统,允许校验人员编写校验规则及数据处理方法。对待入库及已入库数据进行数据有效性判定、冗余检查、格式处理及数据校验。

3 系统设计

3.1 系统的概念模型

分析试验数据库管理平台主要分为油田公司数据库和二级单位数据库两级,数据库结构一致,各二级单位分别录入各单位试验数据。各二级单位将收集到的数据处理后或生成报表,或在网上;分析试验数据资料有数据多、类型多样、保存期限长、保密性强的特点,所以建议使用关系型Oracle数据库存放结构化的数据,非结构化的数据如电子文档、图像等存储在文件服务器中。

3.2 系统的功能结构

系统的功能模块如图2所示。

分析试验数据库管理平台由8个子系统组成,其中:

样品管理:主要完成送样、样品调度、岗位接样等样品流转过程中的数据管理;

资料补录:采用主子表的方式,对历史资料电子化,同时采集入库;

数据录入:完成样品基本信息、各类检测样品数据录入功能;

数据质量控制:检查修正待入库、已入库数据;

综合查询:样品动态、数据信息,授权用户能查询和下载;

报表处理:生成各类电子报告及统计类报表;

3.3 系统体系结构

本系统采用三层体系结构、应用集成的设计概念作为系统总体框架,实现数据和应用的集成和共享。系统的灵活性和可维护性得到很大提高。

3.3.1 数据访问层

数据访问层包含了分析试验成果数据库、分析〈WWW.〉试验文件服务器,由数据中心集中存储和管理。

3.3.2 逻辑层

逻辑层包含了一个应用服务,面向不同的用户群提供服务。

3.3.3 表现层

表现层应用之一就是由各二级单位作为数据源单位完成样品调度、分析试验项目的数据录入与报表处理以及对生产数据的查询;表现层应用之二就是长庆油田的科研管理人员通过WEB查询分析试验成果数据。

4 系统实现

4.1 系统的实现结果

4.2 系统实现技术及特点

4.2.1 系统采用Web Service技术开发

Web Service是一种新的面向服务的体系结构,Web服务支持通过基于因特网的协议及使用基于XML的消息与其他软件应用程序直接交互,能够跨平台和语言操作,建立可互操作的分布式应用的新平台,极大扩展了程序的功能,并实现了软件的动态提供。分析试验数据库用户角色多样,分布分散,需要通过Internet网远程登陆网页进行操作,使用Web Service技术开发系统简单易用、便于维护。

4.2.2 后台存储过程实现业务处理

分析试验的计算过程用存储过程在后台实现,把业务逻辑和前台数据录入分开,用户可根据新的业务要求在业务逻辑处理层修改业务,不需开发用户界面。

4.2.3 组件式的系统平台搭建

对系统的各功能模块进行封装,可灵活地对系统某业务模块进行升级,不需对整个系统进行重新开发,同时实现网上系统安装,减轻系统维护人员的工作量。

5 开发经验

5.1 以数据流与业务流的统一为基础开发系统

数据流和业务流的不统一是导致工作效率损失的主要原因,分析试验数据库及其管理信息系统通过工作流程采集数据,实现了数据流与业务流的统一,从单一的信息数据采集转移到业务流与数据流统一的过程,保障了分析试验数据库及其管理信息系统的健康发展。送样人员通过送样模块使用导入Excel表格或填写两种方式生成样品检测审批单和样品清单,经审批部门审批后,将样品送到勘探研究院分析试验中心调度岗位,调度岗位根据样品情况进行处理后,分发样品同时发送样品通知单,检测人员接收样品,进行检测,检测完成后编写分析试验报告,分析试验报告经三级审核通过后归档至分析试验数据库,送样单位通过综合查询对报告进行查询下载。一块样品从准备送检到最后形成检测报告都有章可循、有据可查,数据产生即入库,大大提高了工作效率。

5.2 “以用促建”的高效开发模式,缩短开发周期,提高投产效率

通常信息化建设项目在验收后投产,这时才能发现大量的软件缺陷和不足,但项目验收后开发方往往只有少量的后期维护人员配合,修改周期较长,效果较差;“分析试验数据库建设及管理信息系统”项目从2009年12月至2010年12月为期一年,经过6个月的软件需求分析、数据库设计、系统设计、程序开发等阶段搭建起可运行的系统总体框架,于2010年6月完成数据迁移,采取以用促建的高效开发模式,边试运行边开发,大大缩短了开发周期,提高投产效率,项目在验收之前就已达到投产水平,为今后项目开发积累了宝贵经验。

6 结 语

《分析试验数据库建设及管理信息系统》结合油田分析试验业务流,开发适合油田分析试验业务需求的数据应用系统,为油田分析试验数据库的建设及健康运行提供了坚实的保证。该项目的实施在优化样品管理流程,辅助管理决策,提高分析试验业务质量及效率等方面发挥了较大作用;该项目的实施加强了数据质量控制,拓宽了数据采集方式,提高了分析试验数据质量和入库效率,完成了2000-2005年历史数据建设工作,实现了当年产生数据能及时、准确入库,数据的时效性显著提高;该项目的实施提高了分析试验资料成果数据(电子报告、曲线及图片)、动态信息和统计数据的共享程度,方便灵活。

主要参考文献

[1] [荷]帕派佐格. Web服务:原理和技术[M]. 北京:机械工业出版社,2010.

数据库需求分析报告【第三篇】

科技档案是指在自然科学研究、生产技术、基本建设等活动中形成的应当归档保存的图纸、图表、文字材料、计算材料、照片、影片、录像、录音带等科技文件材料。2010年以前,由于信息传播速度、信息量以及计算机技术的普及都落后于今天,全国各地的科技情报研究所都是使用人工的手段从科技档案中收集情报,然后再对数据进行筛选、去重、统计,这种方法既费时又费力。随着互联网的发展,数字档案平台、科技报告系统的兴起以及大数据时代的到来,科技情报研究部门对信息的需求量与日俱增,人工检索数据、筛选数据的方法必将被淘汰,取而代之的是利用算机技术自动地对数据进行检索、处理和分析。

从目前的情况来看,完全用计算机代替科技情报研究人员进行情报分析工作是不现实的,因为很多情报的判读需要科技情报研究人员常年累积的经验,计算机可以做的是在最大限度上用计算机代替人工做重复性的工作。此外,情报领域与计算机领域有一定距离,情报研究人员往往不懂计算机技术,甚至对软件的使用都感到棘手。针对上述实际需求,需要开发一个无监督的系统,该系统可以按照需要自动采集数据,并可以对数据进行去重、分析。

基于以上背景,本文计划在钱学森提出的综合集成研讨方法指导下,基于数字档案平台、科技报告系统等数据库设计建立一套以人为主,数据、信息、知识和智慧综合集成,高度智能化的人机结合智慧情报系统,从系统的物理构成来看,包括三部分:一是由参与情报解读的专家组成的专家体系;二是由为情报工作人员和专家提供各种信息服务的计算机软硬件技术组成的机器体系;三是由各种形式的信息资源组成的知识体系。从情报分析过程来看,该系统包括三部分:一是基于专家体系经验判读的定性情报综合集成系统;二是基于数据采集处理工具的定量情报分析综合集成系统;三是从定性情报到定量情报的综合集成系统。总之,该系统的建设不仅需要建立由不同学科、不同领域专家组成,具有能面对复杂巨系统问题所需要的合理知识结构的专家体系,而且还需要设计开发能够有效处理海量数据的工具,实现信息的高效采集与精确分析。从技术构成分析,归类能力、关联性分析能力、辅助解读能力、报告辅助生成能力是该系统应具备的几大核心能力。

文章将主要运用信息智能检索、数据统一结构化、信息抽取、机器学习、自然语言理解等前沿的数据挖掘分析技术,对各数据库的结构化与非结构化文本进行处理,实现对海量信息的数据挖掘,完成数据的关键词输入、引文爬取、数据解析分析、统计。最终形成关于学术专题情报报告雏形。

二、学术专题档案情报快速辅助生成系统功能需求分析与系统设计

大数据时代的数据特征为情报服务过程中数据采集提出了严峻的挑战,档案数据库和科技报告数据库等结构化信息异构、重复,质量参差不齐,时效性不强,使数据整合成为基础数据资源建设的难点;其次是是如何通过大数据时代高度发展的移动互联网技术,充分利用人际网络获得一手数据,并与网络、文献和数据库信息进行整合,也成为大数据环境下数据采集的难点。与此同时,无论何种数据来源,由于数据的价值密度低,数据筛选技术都是关键的技术难题。

本系统通过利用网络环境下的搜索引擎技术、本体库、SVM分类算法、聚类算法和信息筛选技术,构建面向大数据的档案数据库数据、科技报告数据库数据、人际网络数据和信息筛选的大数据采集与筛选工具,为情报服务的数据资源建设提供工具。

(一)系统需求分析

1.搜索需求:互联网数据库信息是情报服务的主要数据来源之一,搜索引擎技术的发展为互联网数据的获取提供了便捷、高效的工具,但是由于算法本身局限性,普通搜索引擎只能采集到约10-30%的信息,只能完成情报大概情况的收集,不能满足情报检索中查全率的要求,对于查准率也只能满足部分要求,这种现状对于情报服务来说,是对互联网信息资源的浪费。本系统需要在普通搜索引擎的基础上通过重点、互动、专业垂直搜索,完成深入的、交互式的、专业的科技情报搜索。本部分的科技情报专用搜索工具是由元搜索系统、重点搜索系统、互动搜索系统、垂直搜索系统和深网接口系统封装在一起构成。

2.大数据筛选:数据库数据具有数据价值密度低的特点,因此,数据的筛选对于情报服务的质量尤为重要。数据来源的广泛性使得大数据难以根据同一标准进行筛选,因而计算机难以独立完成筛选工作。本系统根据研究内容设定采集数据的范围,将采集得到的数据去噪、剔除相似数据后,根据领域词汇距离、情报点关键词录、情报报告关键词录摘录出较具情报价值的信息,力争把以十万计的海量信息压缩到600条以内,同时保存足够的核心信息,并采用人机结合的工作方式,提供专家判读的界面,为数据筛选的准确性提供保障。

3.动态情报跟踪与基于科技主体的社会网络情报需求。搜索引擎完成的是面向互联网数据库数据的静态数据获取工作,然而对于情报服务来说,动态跟踪能够展现情报研究对象的活动轨迹,对于情报分析具有十分重要的价值。根据社会网络理论,完成科技主体(单位和个人)相互关系的表达,从而确定某一主题下各个科技主体的特征,以使我们能从中找到适合进行情报分析判读的行业专家。本系统基于移动网络环境下的情报采集技术,创新情报采集模式,全面采集由情报所所内人员、行业专家、专业情报员,通过科技情报生产的规范化流程、规范化方法,依照科技情报质量控制体系,在情报分析模型方法库和情报分析方法工具包的协助下,完成情报的分析流程。

(二)系统模块设计

本系统根据关键词并行进行科技报告系统网页爬取与数字档案馆中的科技档案爬取,获取有效的网页信息与档案信息,去重、去噪后得到需要的网页信息与档案信息。对数据进行特定的处理,采用特定的算法对获取的数据进行处理分析,生成需要的图表格式并得出结论。具体流程如图1所示。

按照档案情报流程节点的不同,该学术专题情报快速辅助生成系统可以细分为几个大模块:搜索大模块,控制大模块,整理大模块,分析大模块及结论生成大模块。大模块下又可细分为几个小模块。学术专题情报快速辅助生成系统模块划分如图2所示

1.搜索模块:搜索大模块主要有科技报告系统网页搜索模块和数字档案搜索模块两大模块。网页搜索模块致力于在科技报告系统网络上搜索与关键字相关的网页集合,为后续的操作提供初始的科技报告系统网页信息材料来源。数字档案搜索模块是在制定好的数字档案馆中搜索与关键字相关的档案集合,得到与关键字有密切关系的档案集合,为之后的整理分析等工作提供初始的材料来源。

2.控制大模块:控制大模块主要有两个小模块:内存控制模K和线程控制模块。无论是从网页中获取信息还是从档案库中获取信息,系统在获取信息过程中获取的信息容量比较大,所以需要内存控制模块来高效的非配运行此系统的计算机的内存,以提高系统运行效率。由于要获取的信息内容十分多,因此采用并行技术进行获取信息的操作。

3.整理大模块:整理大模块主要有科技报告系统网页内容整理模块和档案库内容整理模块两大模块。科技报告系统网页内容整理模块只要是对获取到的网页进行去重,去噪等处理,得到干净、整齐的网页内容。档案内容整理模块是对已经获取到的档案集合进行去重,去噪等处理,获取格式整齐的档案内容,以便进行后续工作。

4.分析大模块:分析大模块主要有科技报告系统网页内容分析模块和档案内容分析模块两大模块。科技报告系统网页内容分析模块是对前边已经处理过的网页信息采用分类,对比等特定分析方法对这些内容进行分析,以帮助后边的模块得到想要的结果。档案内容分析模块是针对之前通过搜索,处理得到的整齐的档案信息内容采用特定的分类,对比等分析方法对档案内容进行分析,得到分析的结果。

5.结论生成大模块:结论生成大模块主要有科技报告系统网页生成结论模块和档案生成结论模块两大模块。科技报告系统网页生成结论模块使用通过关键词筛选出的网页信息经整理、分析得出的结果采用表格,图表等方式展现给用户,让用户对结论有一个直观的了解。档案生成模块使用通过关键词帅选出的论文信息经过整理、分析得到的记过采用与网页生成结论模块基本相同的样式,如表格、柱状图、饼图等方式向用户展示该关键词搜索的内容的结果。便于用户进行相关的决策等。

(三)系统架构设计

系统结构共包括元搜索模块、垂直搜索模块、URL调度器、数据存储器、多线程控制器、源码解析器和数据分析模块,其中元搜素模块主要是对科技报告系统网页数据进行检索;垂直搜索模块主要是对档案数据库进行检索。由于网页数据与档案库的格式差异较大,故本系统开发两个软件分别对网页数据和档案数据进行处理。从系统结构上来说,除了信息采集模块外,两个软件的结构基本一致,都是通过上述模块进行相互协调控制。用户在系统运行初始化时对相关参数进行设置,如检索的最大页数、检索的时间间隔等,然后输入关键词,系统结合上述功能模块就可以脱离人工自动对数据进行检索和处理,最终实现无监督的信息采集工作。

系统的基本流程:在传统网络爬虫的基础上进行改进对网页信息进行抽取,将下载下来的数据保存到内存中,与之前的一级链接相同,当内存中的数据超过一个阈值时,将它们输出到本地文件中。

当全部数据抓取下来后,数据被分为网页数据与档案数据,由于档案数据是标准的结构化数据,并且科技档案技术方案的重复率并极低,也不存在大量噪声数据,因此可以通过系统的数据分析模块对档案数据进行分析。

三、学术专题档案情报快速辅助生成系统的功能实现

文章以人工智能领域为例,使用本系统进行实验,验证本系统的可行性和有效性。一是本系统可以实现对档案数据库、科技报告数据库的中文数据采集搜索,可以自动实现对档案、科技报告相关词库的搜索,对相关文献详细信息(包标题、摘要、完成人、完成单位、完成时间、项目名称等)进行搜索采集,对相关文献内高频词汇进行统计分析。二是系统对采集到的数据进行归类、去噪、去重处理,筛选出较具情报价值的信息,运用文献计量学方法对筛选完的数据进行统计分析,形成清晰的档案文献相关信息统计分析表格。三是系统可以用来搜索某学术领域相关机构、相关专家,还可以对机构之间的合作关系、专家之间的合作关系、专家学术研究点之间的关系进行可视化展示。

数据库需求分析报告【第四篇】

关键词 数据库 分组阶段式 课程设计 教学模式

中图分类号:G424 文献标识码:A

0 引言

数据库课程设计是信管专业综合训练课,本课程是对数据库原理课堂教学的一个重要的补充,与理论学习起着相辅相成的作用,是实施教学的一个重要组成部分。其目的旨在加深学生对数据库基础理论和基本知识的理解,培养学生综合运用所学理论知识进行数据库设计和开发的能力。本文将结合笔者的实践教学,分析数据库设计中存在的问题,研究分组阶段式反馈教学在课程设计中的作用。

1 数据库课程设计实践教学中存在的问题

在近几年的数据库课程设计实践教学中,笔者发现存在以下几个问题。问题一,学生对课程设计的理解和认识不够。有些学生根据老师所给的题目直接在网上下载一个作业,有些学生在分组中完全依赖于组内的同学完成而没有真正参与其中。问题二,学生对课程设计的选题理解不足。在课程设计应用选题时,对所给选题的业务需求理解不够,难以完成。问题三,学生注重编程实现而不重视分析、设计。多数学生重视用编程实现数据库的连接、登陆、界面的设计以及对数据的增、删、改、查,而不注重编程所实现的系统符不符合实际的应用需求。问题四,考核方式只在最终提交阶段,忽视平时的设计的各个环节。最终的考核方式根据学生的考勤、提交的报告、系统来确定,在实现过程阶段考核较为欠缺。

2 分组阶段反馈模式教学

针对课程设计教学过程中存在的上述问题,笔者在教学的过程中摸索出分组阶段式反馈教学,在实际的操作过程中取得了一定的效果。分组阶段式反馈教学指的是在课程设计的过程中,采用分组、阶段式的方式指导学生,其中分组探讨以及阶段考核反馈是整个教学过程中的主要部分。在数据库课程设计过程中,采用分组、分阶段汇报工作的方式,在数据库设计的四个阶段规定的时间内,各个小组指派这一阶段实施的只要负责人汇报该阶段进展情况,教师根据汇报情况可针对性地进行实时点评,帮助学生发现设计过程中出现的问题,整理思路,通过这种方式,学生可以不断地反思和深化自己的思考过程,有利于学生操作能力与创新能力发展,同时学生的学习信息得到了反馈,作为教师也了解了学生在具体的哪个阶段存在的问题,并能够对症下药及时解决,为下一步的指导提供依据。具体模式如下:

第一,用分组形式。教师提供参考选题,也可学生提供感兴趣的选题,然后根据个人的兴趣选择相关题目, 每个选题一般5~6人一组,每组选出具有一定协调能力的组长,并作出设计规划。第二,小组中每个人根据数据库设计的要求步骤以及自己的特长担任不同的角色。分工协作、共同完成设计和开发任务,从而培养团队精神,变适应性学习为创造性学习。第三,阶段进展情况汇报。根据数据库设计的几个阶段即需求分析阶段、概念结构设计阶段、逻辑结构设计阶段分级提供相关结果与报告,由教师与学生共同讨论,发现并分析在设计阶段出现的问题,提出解决方案。第四,数据库的实现阶段以SQL Server 2000数据库开发环境为主,选择合适的应用开发工具,按照设计的结果建立数据库、开发应用系统、输入数据、调试运行所开发的应用系统。第五,答辩阶段由3个有数据库教学或设计经验的老师组成答辩小组,每个组的项目负责人运行、演示开发的数据库应系统,同时回答各位答辩老师或者其他组同学提出的问题,提交所有文档。第六,集体讨论、互相学习,指出各自的特点和不足,交流开发过程中的收获和体会。第七,成绩评定主要根据分组阶段的表现10%、设计成果50%,设计说明书20%,答辩成绩20%,给出成绩,最后积分按照优、良、中、及格、不及格5级评定。

3 分组阶段式反馈中主要阶段的实施

第一,课程设计的选题阶段。课程设计的题目选择的难易程度、范围的大小、行业领域直接影响学生的设计兴趣,因此在选题时要贴近学生的学习和生活实际,先选择容易开发的、实用的、与学生专业培养有关联的数据库应用系统,最好能加强与企业的联系,这样能充分了解企业的需求,既有助于学生对数据库设计的概念结构中需求的分析理解,更有助于培养学生的社会认知感。

第二,课程设计的准备。分组阶段式反馈模式中,由于学生事先没有系统开发的经历,所以教师需要精心准备多个跨行业的应用案例,教师重点演示一个已开发好的数据库管理应用系统。所演示的项目应包含所有的知识点,采用通俗易懂,循序渐进、逐层阶段式的方式将数据库各个章节中的知识点融入。这使每个组在选题的时候可以参照相关领域的设计原则,通过项目驱动、核心案例的贯穿,调动学生的设计兴趣。

第三,项目设计与实现阶段。学生根据教师所给题目或自拟题目,结合企业或行业实际应用作需求分析,提交数据字典;根据需求分析构造概念模型,并用E-R图表示;根据E-R图转换为逻辑模型,最终通规范化理论转换为物理模型在SQLSEVER2000中实现。通过这个综合项目,使学生巩固加深对知识点的理解和掌握。老师通过检查学生提交的数据字典和E-R图,对每个组进行分析和指导,指出其中存在的问题,要求学生进行修改,完成设计与实现中的反馈循环,本阶段需要注重学生在数据库设计中各种模型的转换。

分组阶段式反馈教学模式在数据库的设计中极大地提高了学生的学习兴趣,实践表明,采用该教学模式后课程设计效果较以前有较大的改进。其一,学生在课程设计的过程当中对数据库系统的理论知识进行了系统的应用,调动了学生的学习主动性;其二,课程设计中实现了教学与学生的角色转换,以学生为中心,各阶段反馈、汇报设计中存在的问题,充分发挥学生的创新意识;其三,从学生上交的总结报告中看到,不少学生反映通过该课程设计获得了成就感,树立了信息系统研发的信心,增强了进一步学习的动力。很多学生特别提到老师对同学们设计系统的点评,使他们印象深刻,收获最大。另外,课程设计而加深了学生对抽象理论的理解,提高了他们数据库分析和设计的能力,为实践教学创造了很好的条件。

参考文献

[1] 黄永慧,黄和平,何小敏,数据库课程设计中分组反馈式教学模式探索[J].广东工业大学学报,2007(6):144-145.

[2] 王向辉,崔巍,徐俊丽。基于CDIO的数据库课程教学改革方案研究[J].计算机教育,2011(2):38-40.

数据库需求分析报告【第五篇】

关键词XBRL;问题;改进方法

XBRL技术的应用主要体现在两个层面上,财务报告分类标准(XBRL-FR)和全球通用会计账簿分类标准(XBRL-GL)。XBRL财务报告和传统财务报表相比具有如下的特点及优势:(1)基于XBRL架构的财务信息可以直接在网络间自由调用,允许使用者跨系统平台传递和分析信息,一次生成后,分析师只需要有相应的数据调用软件就可以迅速地从网络服务器中获得自己需要地数据,不存在再次输入或者数据出错的问题,降低数据采集、重复输入和对比信息过程的成本,提高数据交换及流转的效率。(2)以标准化的标记来描述和识别每个财务信息项目,即为每个财务项目定义标记,使财务报告的编报标准趋向统一。(3)可以编制、发送各种不同格式的财务信息,满足不同财务信息用户的需求,避免了传统网络财务报告模式下针对不同用户编制不同报表的繁琐过程,大大降低了企业的信息报告成本,提高了财务数据的可靠性。(4)通过内置的验证机制,使计算机能够自动“分析”报告,有利于进行行业对比、深度分析和大范围比较。降低了从不同数据源提取相关商业数据的困难,显著提高了数据的可靠性和数据处理、利用的效率。XBRL-GL记录企业内部的各项财务总分类信息,对于增强企业财务信息披露能力、方便内部和外部的审计监控以及其他机构的信息分析工作有着重要意义。

XBRL技术在我国仍然处于初级阶段,目前从研发角度看,主要以制定XBRL标准规范和重点行业的XBRL分类标准为主;从应用角度看,除个别行业和领域已较成熟地开展了相应的应用外,多数领域或处于空白,或仅处于以点带面的实验阶段,目前我国企业对XBRL的应用仅仅停留在报送XBRL格式的财务报告上,而且是在报送完PDF格式的财务报表之后,运用转换工具将PDF格式的财报转换成XBRL格式的财报,它并没有真正利用XBRL分类标准进行归集和报告。目前中国还没有企业将XBRL技术应用到交易和事项层面,因此信息使用者无法从财务报表披露的信息上再向下挖掘信息,各部门无法共享数据。

1.运用REA语义模型扩充XBRL-GL分类标准

REA会计模型是一种对企业的经济业务的原始描述方法,其主要思想是对企业的重要资源、事件、参与者及其相互关系建模,把企业一切经营事件(财务的和非财务的)相关的内容,按其原本的实际语义(Semantic)而不是人为加工为借贷分录的形式输入数据库集中存储。财务信息可以以财务报表的形式表达,其受到统一准则和制度的严格要求,而非财务信息却不能在财务报表上反映,无严格的法律法规限制,主要反映在内部报告中,仅仅在企业制度层面有要求,并且这种制度相比法律很不规范严谨,各个企业的制度也千差万别,没有一个统一的标准,因此需要借助REA语义模型按业务事件对XBRL-GL分类标准进行扩充,实现高效快速地整合利用各系统地财务和非财务数据,为企业内部信息交流和共享提供格式规范。在REA语义模型中,将企业经营活动划分为四个过程:获取循环、生产循环、收入循环和财务业务活动;将事件的状态分为外部事件、已完成、执行中、合约执行和拟执行,各种业务活动能通过4个业务过程找到对应的过程,并通过时间状态来表示。

(1)扩充分类标准,企业各部门或个信息系统需要安排负责申请、审核、确认并提交REA相关信息,最后由企业信息中心专人确定扩充分类标准。

(2)利用深度优先搜索遍历整个DOM树,在遍历过程中,每访问一个节点就需要比较节点值与REA值,若所有值都相等,则不需增加标记,否则,若遍历完整棵树,仍没有找到相等值,必须添加新的标记。这样在企业个系统一出现新事件就更新分类标准,久而久之,延伸到整个行业乃至多个行业和领域,最后形成一套综合的分类标准,可适用于任何使用XBRL的机构。

2.运用混合型数据库技术作为存储XML文档的数据存储技术

XBRL存储的是XML文档,XML的推广应用产生了XML数据库技术。发展XML数据库有两种方式,一种是关系型数据库,它是支持XML的数据库,即在不变动关系型数据库内核层的基础上,将XML的树型结构数据拆散、重组转换成关系型表格数据存入数据库,其核心仍是关系数据库;另一种是原生XML数据库,它保持了XML文档的树型结构,无需在进行数据转换,且提供Schema校验功能,原生数据库也具有在文档间的横向查询的特点,目前国内数据库软件仅支持关系型数据库。关系型数据库和原生XML数据库的优缺点如下所示:

关系型数据库,优点有利于深加工数据。缺点文档间的横向查询速度较慢,不适合于频繁的数据对比分析。

原生XML数据库,优点:(1)应用速度慢。(2)数据容易失真。(3)破坏了文档内部关联关系。缺点:(1)应用数据速度快。(2)数据不失真。(3)不破坏文档内部关联关系

可见,两种方式对XML文档的存储都不是最优的,IBM的新一代数据库DB29运用了混合数据库的技术,同时容纳了关系型数据库和原生XML数据库,综合利用这两种方式的优点,避免其缺点。全它面支持原生XML文档,它以树型存储方式来对待XML数据,保持XML数据的层次结构和灵活性,同时支持传统关系型数据。由于有两种数据库引擎,可根据信息管理的需要灵活选择数据的存储组织模式和访问方法,实现二者间的灵活转换。

3.利用数字版权管理技术控制XBRL信息安全风险

本课题所涉及的信息安全技术问题指的是信息使用权限的问题,XBRL涉及到企业财务信息和非财务信息的数据库,其中主要有二类基础数据源表:一类保存企业经营管理的基础数据,如客户、职员、产品档案等;另一类保存企业经营活动的业务数据,包括经济交易业务的会计记录数据等。对不同类型的信息使用者,信息对其开放的程度也不同,如果信息使用权限的控制不得当,将产生信息泄露的风险。使用数字版权管理技术可以有助于信息使用权限问题的解决,数字版权管理技术是指对数字产品加上许可证,只有得到数字产品提供者授权的人才有权利使用该产品,该数字产品应用在这里就是指交易层面的数据通过转换工具转换成的XBRL-GL实例文档。

4.相关软件程序的研发

XBRL从根本上讲是一种计算机语言,其制定与应用都需要软件的支持,如分类标准编辑软件、实例文档编制软件、实例文档浏览软件、文件转换软件、数据挖掘软件等。而我国目前还没有软件公司介入XBRL-GL相关软件的开发,要在企业推广XBRL-GL,必须加快对XBRL-GL应用软件的研发:

首先,政府需加大对会计软件公司的支持和鼓励,投入专项资金奖励XBRL-GL应用软件的研发,确保XBRL-GL软件的应用市场,坚定软件公司的研发信心。

35 531813
");