学术咨询服务,正当时......期刊天空网是可靠的职称论文发表专业学术咨询服务平台!!!

基于光学字符识别技术的机车视频转储分析系统设计

发布时间:2020-02-08所属分类:科技论文浏览:1

摘 要: 摘要:文章通过利用高效快捷的光学字符识别技术,设计并实现了一种机车视频转储分析系统。为了提高转储分析效率,系统首先对列车运行监控装置(LKJ)文件预分析并提取关键数据,其次通过光学字符识别技术获取视频中附带时间、司机、车次等信息,最终以时间为主

  摘要:文章通过利用高效快捷的光学字符识别技术,设计并实现了一种机车视频转储分析系统。为了提高转储分析效率,系统首先对列车运行监控装置(LKJ)文件预分析并提取关键数据,其次通过光学字符识别技术获取视频中附带时间、司机、车次等信息,最终以时间为主轴建立列车运行监控装置文件和视频文件之间的信息关联。同时集成视频转码功能以增强系统兼容性。实验结果表明:系统有效提高分析效率。

基于光学字符识别技术的机车视频转储分析系统设计

  关键词:学字符识别技术;视频转储分析;列车运行监控装置

  1概述随着经济的发展,近年火车不断的提速,不仅提高了铁路的运作效率,也缩短来来去去忙碌的人们在旅途上花费的时间,提高工作效率。然而,在我们的生活节奏不断提高的同时,随之带来的安全问题和责任,也日渐加重。虽然目前国内的铁轨交通中,实施了很严密的视频监控系统[1-2],通过架设大量各种各样的摄像机来监控各个场合,配合其他的安全措施,以避免意外事件的发生。但是现有的、传统的监控系统也面临着很大的挑战。大量的视频源和LKJ[3,4]文件通过人工监管的方式,进行监督和分析。在如此多的数据流当中,人的监管工作就显得繁重而低效。视频分析技术[5]作为智能视频监控系统的核心技术,正越来越广泛地应用于中国铁路通信系统之中,为铁路安全的监控提供了一种先进可靠的技术手段。

  当前国内很多机务段车载视频图像的转储分析工作,是每天机车入段后,由技术人员取下视频文件存储硬盘,并做好相应标记(如车次、运行时间等),拿到数据管理中心进行人工挑检分析并存储,并将部分数据采用刻录光盘方式保持。这种数据存储方式,所需的硬盘和光盘数量巨大,管理难度较高并且数据分析耗时长,投入较多的人力物力且效率低下。

  针对上述问题,文中设计并实现了一种基于光学字符识别技术(OCR)[6]的机车视频转储分析系统。其主要特点是实现LKJ与视频的同步分析展示。为了提高系统的智能化水平,系统中先对列车运行监控装置文件预分析并提取关键数据,通过光学字符识别技术获取视频中附带时间、司机、车次等信息,以时间为主轴建立列车运行监控装置文件和视频文件之间的信息关联,并集成转码功能以增强系统兼容性。

  2OCR简介

  OCR(OpticalCharacterRecognition)是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。OCR识别率主要取决于:扫描分辨率,不求最“高”,只求最“佳”。根据经验,五号印刷体采用250~300dpi比较合适;字号比较大(四号以上),需要使用用150~200dpi;对比度:为了达到最佳的识别效果,对输入稿件在扫描时的要求是清晰,使扫描文件黑白分明,有利于软件的识别;偏斜程度:现在的OCR大都采用字模识别的方式,因此图像如果有一定程度的倾斜,就会严重影响识别效果,一方面需要尽量摆正扫描文件;另一方面还需要使用软件进行偏斜校正;图片模式:一般对彩色模式识别很差,黑白模式的图片识别较好;字体:印刷体识别率高,手写体识别率很低,需要人工校正。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,ICR(IntelligentCharacterRecognition)的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。

  3系统介绍

  系统分为四个功能模块、两个存储库。分别是:LKJ预分析模块、视频转储及分析模块、关联模块,和业务模块。存储库分为基础存储库和视频存储库,基础存储库存放LKJ分析结果数据、用户登录数据和LKJ与视频关联关系数据等,基础存储库存储数据量较大,读写操作相对频繁,对其性能要求较高。视频存储库主要按一定的规则存储视频文件。

  3.1LKJ预分析模块

  机车LKJ文件实时记录机车位置、速度、管压、工况、缸压等机车实时状态数据,类似于飞机的黑匣子,以二进制形式存储于IC卡或其它可移动介质中,是判断机车是否正常运行和故障排除的重要依据,分析机车LKJ文件是视频分析室首要工作。由于机车运行过程中产生的LKJ数量较多且文件较大,普通分析系统[7]对LKJ处理效率较低,且比较繁琐。

  一般情况下,LKJ分析工作主要有三部分组成:LKJ下载、LKJ分析和LKJ分析结果曲线图展示。LKJ分析耗时主要集中在LKJ下载和分析。传统串行分析方式分析效率过于低下。

  设计中采用多任务预分析机制对LKJ文件读取分析,如图1所示,每个下载任务中均集成预分析机制,相比于传统的下载后分析机制,设计中采用多任务并发、边下载边分析的机制,实际实现中根据LKJ文件的个数,确定对应的任务数,分析后得到的关键节点,比如机车启动时间、超速时间和位置等存入基础粗出库待后续处理,同时实时显示各任务分析进度。机车LKJ分析软件[8]一般以动态曲线图的方式展现给用户,相比于解析原二进制LKJ文件,加入预分析机制的LKJ曲线图更加流畅平滑,用户交互操作更加方便快捷。多线程机制能大幅提升系统分析效率。多线程无需跨进程边界,程序逻辑和控制方式简单,所有线程可以直接共享内存和变量等,线程方式消耗的总资源比进程方式好。但是,如果工作机制出现混乱或者线程工作状态出现异常会引起灾难性后果。LKJ文件以多个二进制文件的形式存储于介质中。当多个线程同时读取一个LKJ文件时,诸线程应能实时获得其它线程的读取进度和位置,当前线程使用“事件”实时通知其它线程自己工作进度。同时,LKJ曲线绘制线程需在分析线程分析完一定的LKJ数据之后才能启动绘制,两者为“生产者消费者”关系,系统中使用“信号量”结合“事件”,控制两类线程间的同步和LKJ曲线绘制线程的数量。

  3.2视频转储及分析模块

  机车中视频一般存储于机车车载NVR中,机车运行结束由相关负责人取下硬盘,通过相关软件转储到指定存储服务器,由于同一机务段不同的机车所使用的软硬件厂家不同且各个厂家之间互不兼容,所以,诸多机务段都存在多个软硬件同时存在的情况,这势必造成大量人员和时间的投入,造成浪费,且工作效率低下。为了解决这个问题,设计中为各个厂家视频监控设备提供统一转码服务,加入转码功能的分析平台,能摈弃各视频厂家差异,对于用户透明。从而减少人力物力的投入。

  期刊推荐:《甘肃科技》是甘肃省科技厅主管、甘肃省科技情报研究所主办的面向国内外公开发行的综合性指导类科技期刊。设有决策参考、技术创新、信息技术、情报工作、研究与探讨、建设科技、医学研究、农林园地等栏目。

  如图2所示。首先,对所有接入系统中的机车视频存储设备,若其编码方式非H264编码,视频转码模块会为其解码再编码,使其为标准H264码流,在解码过程中通过OCR获取一帧视频流中附带信息,如时间,车次,司机编号等,处理后的视频文件存入视频存储库,从视频中提取的信息存入基础存储库,等待与LKJ文件的关联。如图2所示。

  系统中转码服务使用FFMPEG做基础支持。转码服务主要分为:数据接口模块、存储管理模块、转码算法模块、数据处理模块、控制管理模块等。开源FFMPEG作为一款成熟的视频处理工具,随着视频分析技术的发展,其用途越加广泛。

  3.3关联模块

  机车事故分析定位或运行状态查看,现阶段主要手段是LKJ与视频相结合的方式[9,10]。现存系统主要问题是由LKJ信息定位视频信息或者由视频信息定位LKJ信息较麻烦,需由软件操作者经过多次计算、拖放去完成。定位效率低下。

  为了解决上述问题,研发信息匹配服务(如图3所示),信息匹配服务以时间和车次为依据,自动关联LKJ预分析结果和视频中提取的信息,建立关联后的记录更新到基础存储库,更新后的记录支持的业务功能有:UI同步播放展示、由LKJ信息到视频信息的定位或者由视频信息到LKJ信息的定位。有效提高视频分析或事件定位效率。

  由于LKJ预分析结果与视频中提取的信息信息量较大,频繁的读写会影响视频搜索效率。系统中只保留关键节点处的信息,比如行车过程中信号灯改变、机车进出站,速度有明显变化等状况下的信息。为了更进一步优化存储效率,在基础存储库中以时间、司机编号、车次等为索引列建立多列索引。多列建索引比对每个列分别建索引更有优势,因为索引建立得越多就越占磁盘空间,在更新数据的时候速度会更慢。

  3.4系统业务

  系统设计的总体业务架构如图4所示,总体分为输入输出两部分,存储库左侧为输入部分,存储库右侧为输出部分。

  输入部分主要完成LKJ预分析,以及LKJ预分析结果与视频关联。输出部分则为最上层与用户交互的部分。分为多路视频播放及控制、录像转储、分析结果查看、关联点播和异常报警。多路播放及控制用于事故原因查找或验证,录像转储是为保存事故证据而研发的类似于“证据上传”的功能。关联点播功能即同步展示LKJ曲线图与视频文件,异常报警:当LKJ中发现有异常信息时,即时向用户提示异常,由用户进行下一步处理。

  4系统实现

  为验证方案可行行及性能,采用CS架构搭建系统架构,开发语言为C#和C++,OCR算法由公司团队与中国科学院某研究所联合研发,数据库和视频存储库采用Oracle+FTP,客户端与服务端之间使用WCF通信。由于机车数据为保密数据,牵涉到公共安全,为保证数据传输安全性,所有需传输的数据由数据发送端使用MD5数据加密算法进行加密,数据接收方接到数据后按加密方反操作进行解密。系统部分界面如图5所示。

  为排除因实验条件对实验结果造成的影响,取同一班列车的LKJ文件和视频文件分别在博飞转储分析系统V1.0和捷信安通两款分析平台做比较,列车运行时长约2.5h,各软件参数对比见表1。

  表2中“平均耗时统计”是对本次机车多次运行记录多次分析后的平均耗时统计,从实际实验结果可以看出,新设计分析系统在分析耗时方便有了很大的改善,与“博飞V1.0”相比,系统中加入了LKJ预分析机制和LKJ与视频同步定位功能,所以分析效率有很大的提高,而捷信安通由于本身不支持多窗口播放,所以分析耗时最长。由于新平台增加了视频转码功能,减少多软件来回操作的麻烦,兼容性较好,获得用户好评。

  5总结与展望

  文中设计并实现了一种机车视频转储分析系统。通过LKJ预分析机制和LKJ与视频的关联分析提高了视频分析[11,12]效率,并在软硬件兼容性有了很大的提高,但也存在不足,比如LKJ与视频的分析需机车完成运行后才能进行分析,为事后定位方式。下一步研究方向为:针对当前铁路行业应用需求,开发离线及在线视频智能分析系统[13,14]。一方面,在线智能分析系统针对在途机车在运行过程中,对司机的值乘行为、标准操作动作、呼叫应答等进行智能音视频在线分析,同时结合前方路况实时视频图像、机车运行实时数据综合判断司机行为是否违规,并对违规行为进行在线提醒,降低行车安全事故发生几率,同时有利于地面人员实施监控管理机车乘务人员。另一方面,离线智能分析系统用于满足当前大量离线视频文件的快速、准确分析,解决传统视频分析完全依靠人工操作模式。

2023最新分区查询入口

SCISSCIAHCI