Python 中的光学字符识别 (OCR)
课程英文名:Optical Character Recognition (OCR) in Python
OpenCV、Tesseract、EasyOCR 和 EAST 应用于图像和视频!使用深度学习从头开始创建您自己的 OCR!
课程地址:xueshu.fun/3018
演示地址:www.udemy.com/course/ocr-…
课程内容
你将学到什么
- 使用 Tesseract、EAST 和 EasyOCR 工具进行图像和视频中的文本识别
- 了解受控环境和自然环境中 OCR 之间的差异
- 应用图像预处理技术来提高图像质量,例如:阈值处理、反演、调整大小、形态操作和降噪
- 使用EAST架构和EasyOCR库在自然场景中获得更好的性能
- 使用深度学习和卷积神经网络从头开始训练 OCR
- 自然语言处理技术在OCR(词云和命名实体识别)提取文本中的应用
- 车牌读取
要求
- 编程逻辑
- Python编程基础
描述
计算机视觉领域内有光学字符识别 (OCR) 的子领域,旨在将图像转换为文本。OCR 可以描述为将包含打字、手写或打印文本的图像转换为机器可以理解的字符。可以将扫描或拍照的文档转换为可以在任何工具(例如 Microsoft Word)中编辑的文本。一个常见的应用是自动表格读取,您可以在其中发送信用卡或驾驶执照的照片,系统可以读取您的所有数据,而无需手动输入。自动驾驶汽车可以使用OCR读取交通标志,停车场可以通过读取汽车牌照来保证通行!
为了带您进入这个领域,在本课程中您将在实践中学习如何使用 OCR 库来识别图像和视频中的文本,所有代码均使用 Python 编程语言逐步实现!我们将使用 Google Colab,因此您不必担心在计算机上安装库,因为一切都将使用 Google 的 GPU 在线开发!您还将学习如何使用深度学习和卷积神经网络从头开始构建自己的 OCR!您可以在下面查看课程的主要主题:
- 使用 Tesseract、EasyOCR 和 EAST 识别图像和视频中的文本
- 使用正则表达式搜索图像中的特定术语
- 提高图像质量的技术,例如:阈值处理、颜色反转、灰度、调整大小、噪声去除、形态操作和透视变换
- EAST架构和EasyOCR库可在自然场景中提供更好的性能
- 使用 TensorFlow 和现代深度学习技术(例如卷积神经网络)从头开始训练 OCR
- 自然语言处理技术在OCR(词云和命名实体识别)提取文本中的应用
- 车牌读取
这些只是一些主要主题!在课程结束时,您将了解使用 OCR 创建自己的文本识别项目所需的一切!
本课程适合谁:
- 任何对 OCR(光学字符识别)感兴趣的人
- 正在学习人工智能、数字图像处理或计算机视觉相关学科的本科生
- 想要增加计算机视觉知识的数据科学家
- 有兴趣开发专业光学字符识别解决方案的专业人士
- 有兴趣创建自己的自定义 OCR 的人
学术Funxueshu.fun/ 持续更新Udemy,Coursera等在线课堂上的视频教程,类别涵盖人工智能、机器学习、编程语言、游戏开发、网络安全、云计算、Linux运维、面试技巧等计算机学科的全部知识。
所有视频教程均包含中英双语字幕、练习源码及配套的补充资料。