跳到正文

Hitachi
联系我们联系我们

OCR票据机器人解决方案

OCR票据机器人解决方案

方案概述

OCR票据识别机器人

OCR票据识别机器人可对纸质或者电子版的票据(海内外各种票据)进行识别,并且提取客户指定信息,进行自动标注以及校验,从而实现录入、审核、上传下载的自动化和效率化。

* NLP:自然语言处理「Natural Language Processing」的简称。自然语言处理是指将人类的语言(自然语言)通过机器进行处理,之后进行内容抽取等操作的技术。

OCR引擎的AI学习能力

通过OCR引擎的AI学习能力,能够更好地衔接模型开发运维的全流程,通过自动化、可重复的工作流与可复用的数据与模型资产来提升开发运行效率,从而加速机器学习生命周期,提高识别精度;同时,通过监督管理模型的指标与数据,找到并分析模型出故障的原因,提升模型的可解释性。

数据分类和验证能力

文档类型自动化分类&信息提取是否正确自动化验证是OCR类工程中难点,也是是否能够真正提高人效的关键,基于以往项目的经验和积累,在分类和数据验证方面有以下综合技术方案。

引擎+业务策略 提高分类准确率

分类引擎
通过机器训练获得初步的分类引擎,每个版式200 ~ 300张,准确率80%以上
词频权重分类
易错文件,通过统计&业务经验添加权重配置作为辅助,准确率可达到90% ~ 95%
人工修正
< 10% 错误由人工修正

数据自动化验证

多语言对应能力

软硬件方面的支援能力

硬件原厂支持
与Epson、Canon达成战略合作,获得原厂技术支持。
不同机型参数存在差异,发票纸张厚度颜色不同,会对影像有一定影响,系统会自动调整硬件参数,优化对比度、亮度等。

持续优化硬件、自动处理常见问题
非发票、卡纸、不同联次等实际业务可能遇到的问题均进行相关硬软优化。若出现卡纸,用户可轻松继续。若混扫非发票,系统自动识别排除。不同联次避免误报重复等。

多种解决方案集成
根据企业的需求,可与SuperMicro、API、三方系统、RPA等进行集成和统合。