开源OCR，过程介绍

发布时间：2023-12-15 09:08:18编辑：温柔的背包来源：

很多朋友对开源OCR，过程介绍不是很了解，每日小编刚好整理了这方面的知识，今天就来带大家一探究竟。

开源OCR，过程介绍

前不久，百度技术团队前不久，百度技术团队在GitHub上正式开放了一款OCR神器，发布后不久便数次冲上GitHub趋势榜，引起了技术圈开发者的热议。今天，我将告诉你这个项目。

众所周知，OCR(光学字符识别)技术已经广泛应用于我们生活的方方面面，从印刷稿件的文字识别、身份证的电子信息录入，到传统的邮件自动分拣、汽车车牌识别等领域，一款OCR神器已经正式开放，发布不久就多次冲上GitHub趋势榜，引起了技术圈开发者的热议。今天，我将向你介绍这个项目。

众所周知，OCR(光学字符识别)技术已经广泛应用于我们生活的方方面面，从印刷稿件的文字识别、身份证的电子信息录入，到传统的邮件自动分拣、汽车车牌识别等领域，OCR都是不可或缺的。在工作中，我经常用一些OCR软件扫描图片，提取文字。代替人工完成一系列的文字分析和图像识别操作，我一定会用AI技术。

百度在GitHub上开放的PaddleOCR模型，大小只有8.6M，是为数不多的可以支持中英文图像和排版识别的AI深度学习模型。我们来看看PaddleOCR在GitHub上自今年年中开放以来短短几个月的表现：7月发布8.6M超轻量款，GitHub Trending全球日榜第一！8月，开源CVPR2020峰会，遇见SOTA算法，再去GitHub趋势榜！

9月GitHub Star数量已突破4.6K近期有哪些重磅更新带来？果不其然，看完9月份的最新更新，PaddleOCR再一次真诚的为大家带来真正的干货。直接看官方介绍：01。官方介绍。

在数量上，PaddleOCR一口气发布了三个系列的机型，满足移动端和服务器端各种场景的需求。而且已经妥善安排了多语种，所有训练代码和模型都是无保留开源的。其中，3.5M超轻量级字符识别模型是业界最轻的开源OCR模型。质量方面，这样的轻量化车型效果有保证吗？不看广告，只看疗效。我们先来看看几种常见的通用场景识别效果：

3.5M机型能达到这个识别精度，绝对是良心之作！门户GitHub:https://github.com/PaddlePaddle/PaddleOCR论文下载链接：https://arxiv.org/abs/2009.0994102.快速体验PaddleOCR的3.5M超轻量OCR model 1)。PC端快速尝试：(打开网页选择图片实时查看结果)https://www.paddlepaddle.org.cn/hub/scene/ocr.

2).手机APP安装体验PaddleOCR在百度大脑EasyEdge上打开了文字识别App演示。例子效果如下(可以在github首页找到下载二维码)。多种开源回购测试的比较。简单对比一下目前主流OCR开源repo的核心能力：3)。从绩效指标来看：

针对OCR的实际应用场景，包括合同、车牌、铭牌、火车票、化验单、表格、证书、街景文本、名片、数字显示屏等。收集了300张图片，每张图片平均17个文本框，PaddleOCR的F1-Score超过了0.5，已经很不错了。4).从功能齐全来看：预训车型尺寸：easyOCR目前没有超轻的车型，chineseocr_lite最新的车型在4.7M左右，PaddleOCR提供的3.5M无疑是目前业界已知的最轻的。

PIP安装：目前只支持PaddleOCR和easyOCR。自定义培训：在实际业务场景中，预培训模型往往无法满足需求。目前只有PaddleOCR支持用户自定义训练和模型微调。部署：easyOCR模型不适合端到端部署，Chineseocr_lite和PaddleOCR都有端到端部署能力。

开发者可以根据自己的实际需求选择适合自己的开源解决方案。Repo还对PaddleOCR3.5MB的超轻模型是如何实现的进行了说明。

3.5M超轻量机型采用了超轻量OCR系统PP-OCR，主要由DB文本检测、检测框校正和CRNN文本识别三部分组成。该系统从主干网络的选择和调整、预测头的设计、数据增强、学习率转换策略、正则化参数选择、预训练模型的使用、模型自动裁剪和量化八个方面，采用19种有效策略对各模块的模型进行优化和瘦身。

其中，飞桨模型压缩库PaddleSlim为PaddleOCR超轻体模型的实现提供了核心技术支持。超轻量模型从8.1M压缩到3.5M，模型大小减少了56.79%，其中检测模型的速度提高了21%，整体模型精度也有所提高。

除了3.5M超轻量级OCR模型，PaddleOCR还提供了多语言预训练模型(英语、德语、法语、韩语和日语)，支持定制化训练和丰富的部署方式。

以上知识分享希望能够帮助到大家！

上一篇：华为FreeClip耳机将于12月26日上市

下一篇：他励直流电动机能否直接启动，直流他励电机为什么不能直接启动