参赛单位:数库(上海)科技有限公司
案例名称:DAS-文档数字化解决方案
案例简介:
人工智能驱动金融数字化,集成了机器学习算法、标注系统、数据业务标准等系统模块,拥有一整套完整的数据自动化处理流程,能够覆盖对现有上市企业所有公开报告的数据提取,可以有效识别电子版文档和扫描件图片(结合OCR技术),结合数库积累的大量容错集,可以生产出高度标准化的元数据;实现数据的规模化生产。
创新技术/模式应用:
1、技术创新:系统具备深度学习、图像识别、NLP文本处理及各类算法为核心;
2、机器学习能力:只需要进行少量样本的标注就可以训练一个成熟的模型,并由机器进行自动提取、标注、质检和发布;
3、生产标准化:数据提取逻辑高度复用,通过模型固化在系统中,确保数据的准确性和高效性;
4、生产快速:针对不同的行业不同的业务需求,只要构建训练模型,即可快速生产;
5、自动化质检:可以根据不同的业务需求,配置相应的质检规则,完成数据生产自动化质检;
6、插拔式提取算法:支持可插拔的接口,通过加载所需的算法,能够按需从文字部分里面提取特定的指标数据,再生成相应的指标表格;
7、特有的容错体系:系统以数库多年积累的数据容错集为基础库;
项目效果评估:
1、生产模式转变:由人工手工处理转变为机器自动化处理,可实现7*24小时生产;
2、生产投入快:从耗时培训人员处理文档,转变为只要构建、训练模型, 1-2周即可投入生产;
3、生产效率高:手工处理1篇文档1人天, DAS只要几秒即可处理完成;
4、数据准确率高:自动化质检代替人工质检,标准化的质检逻辑保障了高准确率,准确率可达95%以上;
5、生产效益大:与传统人工生产相比,产生同样效益的情况下,只需1/10成本;
6、行业痛点:解决了需要投入大量经验丰富的人员手工维护的行业痛点;
“2020中国金融科技创新大赛”由中国电子银行联合宣传年、中国电子银行网共同主办,大赛以“竞逐数字时代新赛道”为主题,将收集、整理和展示商业银行和互联网企业在过去一年中重要的金融科技创新实践案例,以飨行业。大赛旨在多角度、多层次展示行业创新成果,弘扬创新与合作精神,为国内外金融学者、从业者提供高质量的学术交流平台,积极推动对金融科技领域重要问题的深入研究及最新进展的交流,为促进金融科技创新发展贡献力量。
责任编辑:Rachel
免责声明:
中国电子银行网发布的专栏、投稿以及征文相关文章,其文字、图片、视频均来源于作者投稿或转载自相关作品方;如涉及未经许可使用作品的问题,请您优先联系我们(联系邮箱:cebnet@cfca.com.cn,电话:400-880-9888),我们会第一时间核实,谢谢配合。