核心技术
领先融合ICR、NLP、机器学习、知识图谱、RPA等前沿技术,应用于金融行业
整体架构
核心技术介绍
ICR技术
多年的自主研发,金科览智已掌握了业内领先的ICR技术。在2021年ICDAR文档分析与识别国际会议举办的“文档影像组件分割”比赛中获得了亚军。
NLP技术
金科览智以新一代多模态文档理解预训练模型为基础,针对复杂无固定格式金融文档的抽取取得了较好的效果。 该预训练模型,不仅考虑了文本和页面布局信息,还将图像信息融合到了多模态框架内。 同时,空间感知自注意力机制的引入进一步提高了模型对文档内容的理解能力。
大规模预训练模型
基于中文大规模预训练模型CPM、预训练知识表示模型、中文大规模多模态预训练模型, 在对话生成、文本分类、自动问答、实体抽取、实体生成、视觉-语言检索、图文生成、图像标签等等任务领域保持续研发产生。
知识图谱
知识图谱掌握多元异构数据源根据业务进行构建,通过抽取非结构化的NER来进行三元组构建,有成熟的知识图谱构建工具, 支持海量数据,能够针对数据源进行精细化的ETL操作,通过的基元的三元组、关系模型的构建,通过数据映射, 实时的将已存在数据构建成知识图谱。
RPA技术
基于云共享和无代码的RPA技术,可大规模弹性调度资源,创建流程更加简单易用、执行相关脚本速度更快, 同时内置各类安全审计技术和功能,使得RPA整体上更加安全,可协作性、易用性、效率性有较大保障。