Python 中有多种 OCR 库可供使用,包括 Tesseract、EasyOCR、pytesseract 等。下面是一个使用 pytesseract 库进行 OCR 识别的 Python 代码示例:
python
import pytesseract
from PIL import Image
# 加载图像
image = Image.open('example.png')
# 进行 OCR 识别
text = pytesseract.image_to_string(image, lang='eng')
# 输出识别结果
print(text)
在这个示例中,我们首先使用 PIL 库加载了一个名为 "example.png" 的图像。然后,我们调用 image_to_string() 方法对图像进行 OCR 识别,并将识别结果存储在 text 变量中。最后,我们打印了识别结果。
请确保在运行代码之前,已经安装了 pytesseract 库,并将 example.png 图像文件放在正确的路径下。此外,还可以根据需要修改语言参数、输出格式等。
EasyOCR 是一个开源的光学字符识别(OCR)工具,可以用于识别图像中的文字内容。它基于深度学习技术,能够在多种语言之间进行准确的文字识别。
以下是一个使用 EasyOCR 的简单示例:
python
import easyocr
# 创建 EasyOCR 实例
reader = easyocr.Reader(['ch_sim', 'en'])
# 读取图像并进行文字识别
result = reader.readtext('example.jpg')
# 打印识别结果
for item in result:
print(item[1])
在这个示例中,首先需要安装 EasyOCR 库。然后,我们创建了一个 EasyOCR 的实例,并指定了需要支持的语言(中文简体和英文)。接下来,我们读取一个名为 'example.jpg' 的图像,并使用 readtext() 方法进行文字识别。最后,我们遍历识别结果,并打印出每个识别到的文字。
EasyOCR 的优势是它能够处理多种语言的文字识别,并且准确度相对较高。它还提供了一些参数和选项,可以根据需要进行配置和优化。