首页>>科技 >>内容

开源OCR,过程介绍

发布时间:2023-12-15 09:08:18编辑:温柔的背包来源:

很多朋友对开源OCR,过程介绍不是很了解,每日小编刚好整理了这方面的知识,今天就来带大家一探究竟。

开源OCR,过程介绍

前不久,百度技术团队前不久,百度技术团队在GitHub上正式开放了一款OCR神器,发布后不久便数次冲上GitHub趋势榜,引起了技术圈开发者的热议。今天,我将告诉你这个项目。

众所周知,OCR(光学字符识别)技术已经广泛应用于我们生活的方方面面,从印刷稿件的文字识别、身份证的电子信息录入,到传统的邮件自动分拣、汽车车牌识别等领域,一款OCR神器已经正式开放,发布不久就多次冲上GitHub趋势榜,引起了技术圈开发者的热议。今天,我将向你介绍这个项目。

众所周知,OCR(光学字符识别)技术已经广泛应用于我们生活的方方面面,从印刷稿件的文字识别、身份证的电子信息录入,到传统的邮件自动分拣、汽车车牌识别等领域,OCR都是不可或缺的。在工作中,我经常用一些OCR软件扫描图片,提取文字。代替人工完成一系列的文字分析和图像识别操作,我一定会用AI技术。

百度在GitHub上开放的PaddleOCR模型,大小只有8.6M,是为数不多的可以支持中英文图像和排版识别的AI深度学习模型。我们来看看PaddleOCR在GitHub上自今年年中开放以来短短几个月的表现:7月发布8.6M超轻量款,GitHub Trending全球日榜第一!8月,开源CVPR2020峰会,遇见SOTA算法,再去GitHub趋势榜!

9月GitHub Star数量已突破4.6K近期有哪些重磅更新带来?果不其然,看完9月份的最新更新,PaddleOCR再一次真诚的为大家带来真正的干货。直接看官方介绍:01。官方介绍。

在数量上,PaddleOCR一口气发布了三个系列的机型,满足移动端和服务器端各种场景的需求。而且已经妥善安排了多语种,所有训练代码和模型都是无保留开源的。其中,3.5M超轻量级字符识别模型是业界最轻的开源OCR模型。质量方面,这样的轻量化车型效果有保证吗?不看广告,只看疗效。我们先来看看几种常见的通用场景识别效果:

3.5M机型能达到这个识别精度,绝对是良心之作!门户GitHub:https://github.com/PaddlePaddle/PaddleOCR论文下载链接:https://arxiv.org/abs/2009.0994102.快速体验PaddleOCR的3.5M超轻量OCR model 1)。PC端快速尝试:(打开网页选择图片实时查看结果)https://www.paddlepaddle.org.cn/hub/scene/ocr.

2).手机APP安装体验PaddleOCR在百度大脑EasyEdge上打开了文字识别App演示。例子效果如下(可以在github首页找到下载二维码)。多种开源回购测试的比较。简单对比一下目前主流OCR开源repo的核心能力:3)。从绩效指标来看:

针对OCR的实际应用场景,包括合同、车牌、铭牌、火车票、化验单、表格、证书、街景文本、名片、数字显示屏等。收集了300张图片,每张图片平均17个文本框,PaddleOCR的F1-Score超过了0.5,已经很不错了。4).从功能齐全来看:预训车型尺寸:easyOCR目前没有超轻的车型,chineseocr_lite最新的车型在4.7M左右,PaddleOCR提供的3.5M无疑是目前业界已知的最轻的。

PIP安装:目前只支持PaddleOCR和easyOCR。自定义培训:在实际业务场景中,预培训模型往往无法满足需求。目前只有PaddleOCR支持用户自定义训练和模型微调。部署:easyOCR模型不适合端到端部署,Chineseocr_lite和PaddleOCR都有端到端部署能力。

开发者可以根据自己的实际需求选择适合自己的开源解决方案。Repo还对PaddleOCR3.5MB的超轻模型是如何实现的进行了说明。

3.5M超轻量机型采用了超轻量OCR系统PP-OCR,主要由DB文本检测、检测框校正和CRNN文本识别三部分组成。该系统从主干网络的选择和调整、预测头的设计、数据增强、学习率转换策略、正则化参数选择、预训练模型的使用、模型自动裁剪和量化八个方面,采用19种有效策略对各模块的模型进行优化和瘦身。

其中,飞桨模型压缩库PaddleSlim为PaddleOCR超轻体模型的实现提供了核心技术支持。超轻量模型从8.1M压缩到3.5M,模型大小减少了56.79%,其中检测模型的速度提高了21%,整体模型精度也有所提高。

除了3.5M超轻量级OCR模型,PaddleOCR还提供了多语言预训练模型(英语、德语、法语、韩语和日语),支持定制化训练和丰富的部署方式。

以上知识分享希望能够帮助到大家!