一、产品概述:
SMA-1108文档内容检索系统是一款专业的文档内容数据检查系统,对Windows系统内部数据进行无死角审查,对海量文档数据进行索引,从而实现海量数据秒级搜索,支持所有Office类文档数据、图片文字内容搜索、压缩文件内文档内容搜索、邮件文件内容搜索、邮件附件搜索等,同时支持各种音频文件、视频文件内语音内容的识别搜索、视频文件内文字内容搜索,支持文档内容预览、导出、打开功能。支持精准关键词搜索和模糊搜索。支持违规检测,一键快速对内容进行快速审查。
二、功能特点:
1.支持图片内文字内容搜索,JPEG、JPG、PNG、BMP、GIF、TIFF
2.支持压缩包内文档,文档内容搜索,ZIP、RAR、7Z、TAR、BZIP2、GZIP、LZIP。
3.支持办公文档内容搜索,DOC、DOCX、XLS、XLSX、PDF。
4.纯文本文档:TXT、XML、LOG、HTML。
5.支持音频文件,语音内容搜索,MP3、WAV、RM、FLAV、WMA。
6.支持视频文件,语音内容搜索,MP4、MOV、AVI、3GP。
7.支持视频文件,视频图像上文字搜索,MP4、MOV、AVI、3GP。
8.支持视频文件逐帧解析、关键帧解析。
9.支持EML、OST、PST等邮件文件内容搜索。
10.支持邮件附件搜索。
11.支持邮件压缩包附件解压内部文件搜索,可无限递归解压。
12.支持自定义其它后缀名文件内容搜索。
13.支持文本类文件命中关键字在文档中位置高亮显示,并记录偏移位置。
14.支持音频文件命中关键字在音频文件语音文字中高亮显示,并记录偏移位置。
15.支持视频文件命中关键字在音频文件语音文字中高亮显示,并记录偏移位置。
16.支持视频文件中文本内容在视频文件中位于第几分几秒位置记录,并直接打开截图。
17.支持图片OCR直接提取图片文本。
18.支持违规检测敏感词级别定义。
19.支持多关键词搜索,通过’;’号隔开。
20.支持文档中命中关键词展示。
21.支持历史记录导入历史索引库,无需二次加载。
22.支持敏感词违规检测,可根据词汇保密级别设置。
23.采用最新索引算法,对建完索引结果,TB级数据,实现秒级搜索,快速排查。
24.支持排查结果数据统计,快速导出审查结果报告。
25.支持文档预览,直接通过软件预览文档内容。
26.支持数据精准搜索算法。
27.支持数据模糊搜索算法。