图片识别无须借助外包api,使用这两个强大的Python库也能实现

2024年 1月 11日 112.0k 0

Python 中有多种 OCR 库可供使用,包括 Tesseract、EasyOCR、pytesseract 等。下面是一个使用 pytesseract 库进行 OCR 识别的 Python 代码示例:

python

import pytesseract

from PIL import Image



# 加载图像

image = Image.open('example.png')



# 进行 OCR 识别

text = pytesseract.image_to_string(image, lang='eng')



# 输出识别结果

print(text)

在这个示例中,我们首先使用 PIL 库加载了一个名为 "example.png" 的图像。然后,我们调用 image_to_string() 方法对图像进行 OCR 识别,并将识别结果存储在 text 变量中。最后,我们打印了识别结果。

请确保在运行代码之前,已经安装了 pytesseract 库,并将 example.png 图像文件放在正确的路径下。此外,还可以根据需要修改语言参数、输出格式等。

EasyOCR 是一个开源的光学字符识别(OCR)工具,可以用于识别图像中的文字内容。它基于深度学习技术,能够在多种语言之间进行准确的文字识别。

以下是一个使用 EasyOCR 的简单示例:

python

import easyocr



# 创建 EasyOCR 实例

reader = easyocr.Reader(['ch_sim', 'en'])



# 读取图像并进行文字识别

result = reader.readtext('example.jpg')



# 打印识别结果

for item in result:

    print(item[1])

在这个示例中,首先需要安装 EasyOCR 库。然后,我们创建了一个 EasyOCR 的实例,并指定了需要支持的语言(中文简体和英文)。接下来,我们读取一个名为 'example.jpg' 的图像,并使用 readtext() 方法进行文字识别。最后,我们遍历识别结果,并打印出每个识别到的文字。

EasyOCR 的优势是它能够处理多种语言的文字识别,并且准确度相对较高。它还提供了一些参数和选项,可以根据需要进行配置和优化。

相关文章

JavaScript2024新功能:Object.groupBy、正则表达式v标志
PHP trim 函数对多字节字符的使用和限制
新函数 json_validate() 、randomizer 类扩展…20 个PHP 8.3 新特性全面解析
使用HTMX为WordPress增效:如何在不使用复杂框架的情况下增强平台功能
为React 19做准备:WordPress 6.6用户指南
如何删除WordPress中的所有评论

发布评论