Python 中的光学字符识别 (OCR)

2023年 10月 16日 64.7k 0

Python 中的光学字符识别 (OCR)

课程英文名:Optical Character Recognition (OCR) in Python
OpenCV、Tesseract、EasyOCR 和 EAST 应用于图像和视频!使用深度学习从头开始创建您自己的 OCR!

课程地址:xueshu.fun/3018
演示地址:www.udemy.com/course/ocr-…

课程内容

你将学到什么

  • 使用 Tesseract、EAST 和 EasyOCR 工具进行图像和视频中的文本识别
  • 了解受控环境和自然环境中 OCR 之间的差异
  • 应用图像预处理技术来提高图像质量,例如:阈值处理、反演、调整大小、形态操作和降噪
  • 使用EAST架构和EasyOCR库在自然场景中获得更好的性能
  • 使用深度学习和卷积神经网络从头开始训练 OCR
  • 自然语言处理技术在OCR(词云和命名实体识别)提取文本中的应用
  • 车牌读取

要求

  • 编程逻辑
  • Python编程基础

描述

计算机视觉领域内有光学字符识别 (OCR) 的子领域,旨在将图像转换为文本。OCR 可以描述为将包含打字、手写或打印文本的图像转换为机器可以理解的字符。可以将扫描或拍照的文档转换为可以在任何工具(例如 Microsoft Word)中编辑的文本。一个常见的应用是自动表格读取,您可以在其中发送信用卡或驾驶执照的照片,系统可以读取您的所有数据,而无需手动输入。自动驾驶汽车可以使用OCR读取交通标志,停车场可以通过读取汽车牌照来保证通行!

为了带您进入这个领域,在本课程中您将在实践中学习如何使用 OCR 库来识别图像和视频中的文本,所有代码均使用 Python 编程语言逐步实现!我们将使用 Google Colab,因此您不必担心在计算机上安装库,因为一切都将使用 Google 的 GPU 在线开发!您还将学习如何使用深度学习和卷积神经网络从头开始构建自己的 OCR!您可以在下面查看课程的主要主题:

  • 使用 Tesseract、EasyOCR 和 EAST 识别图像和视频中的文本
  • 使用正则表达式搜索图像中的特定术语
  • 提高图像质量的技术,例如:阈值处理、颜色反转、灰度、调整大小、噪声去除、形态操作和透视变换
  • EAST架构和EasyOCR库可在自然场景中提供更好的性能
  • 使用 TensorFlow 和现代深度学习技术(例如卷积神经网络)从头开始训练 OCR
  • 自然语言处理技术在OCR(词云和命名实体识别)提取文本中的应用
  • 车牌读取

这些只是一些主要主题!在课程结束时,您将了解使用 OCR 创建自己的文本识别项目所需的一切!

本课程适合谁:

  • 任何对 OCR(光学字符识别)感兴趣的人
  • 正在学习人工智能、数字图像处理或计算机视觉相关学科的本科生
  • 想要增加计算机视觉知识的数据科学家
  • 有兴趣开发专业光学字符识别解决方案的专业人士
  • 有兴趣创建自己的自定义 OCR 的人

学术Funxueshu.fun/ 持续更新Udemy,Coursera等在线课堂上的视频教程,类别涵盖人工智能、机器学习、编程语言、游戏开发、网络安全、云计算、Linux运维、面试技巧等计算机学科的全部知识。

所有视频教程均包含中英双语字幕、练习源码及配套的补充资料。

相关文章

服务器端口转发,带你了解服务器端口转发
服务器开放端口,服务器开放端口的步骤
产品推荐:7月受欢迎AI容器镜像来了,有Qwen系列大模型镜像
如何使用 WinGet 下载 Microsoft Store 应用
百度搜索:蓝易云 – 熟悉ubuntu apt-get命令详解
百度搜索:蓝易云 – 域名解析成功但ping不通解决方案

发布评论