Python 多线程编程的十个关键概念

开发运维 2024-05-21 Escape 手机阅读

今天我们要一起探索的是Python编程中的一个超炫酷领域——多线程！想象一下，你的程序能像超人一样同时处理多个任务，是不是很激动人心？让我们以轻松愉快的方式，一步步揭开它的神秘面纱。

Python 多线程编程的十个关键概念-每日运维

1. 线程的初步认知

想象你是个厨房大厨，一边炒菜一边洗菜，这就是多线程的日常。在Python里，threading模块就是我们的厨房神器。

import threading

def cook():  # 炒菜线程
    print("炒菜中...")
    
def wash():  # 洗菜线程
    print("洗菜中...")

# 创建线程对象
thread1 = threading.Thread(target=cook)
thread2 = threading.Thread(target=wash)

# 启动线程
thread1.start()
thread2.start()

# 等待所有线程完成
thread1.join()
thread2.join()

print("饭做好啦！")

这段代码中，Thread类用来创建线程，target参数指定线程要执行的函数。start()让线程开始执行，而join()确保主线程等待这些小线程们完成它们的任务。

2. 线程同步：避免厨房混乱

在多线程世界，如果两个线程同时操作同一资源（比如共享食材），就可能出乱子。这时就需要“锁”来帮忙了，Python里的锁叫Lock。

import threading

shared_resource = 0
lock = threading.Lock()

def increase(): 
    global shared_resource
    lock.acquire()  # 上锁，防止同时访问
    shared_resource += 1
    lock.release()  # 解锁，释放控制权

threads = [threading.Thread(target=increase) for _ in range(100)]
for t in threads:
    t.start()
for t in threads:
    t.join()

print("共享资源的最终值:", shared_resource)

每次访问共享资源前，先acquire()上锁，操作完后release()解锁，这样就避免了数据混乱。

3. 死锁：可怕的厨房僵局

但锁用不好也会出问题，就像两个厨师互相等待对方手中的锅，形成了死锁。要小心设计，避免循环等待。

4. 线程池：高效管理厨房帮手

想象一下，如果你每次炒菜都要新雇一个厨师，那得多浪费？线程池(ThreadPoolExecutor)就是解决这个问题的神器，它预先创建好一些线程，重复利用。

from concurrent.futures import ThreadPoolExecutor

def task(n):
    print(f"执行任务{n}")

with ThreadPoolExecutor(max_workers=5) as executor:
    executor.map(task, range(1, 6))

这里，ThreadPoolExecutor创建了一个最多有5个线程的池，map()函数并行执行任务列表中的每个任务。

5. 守护线程：厨房的清洁工

守护线程就像厨房的清洁工，在所有其他线程完成后默默清理。通过setDaemon(True)设置线程为守护线程。

def cleaner():
    while True:  # 假设这是一个无限循环，清理任务
        print("打扫厨房...")
        if not other_threads_running():  # 假定函数检查其他线程是否还在运行
            break

clean_thread = threading.Thread(target=cleaner)
clean_thread.setDaemon(True)
clean_thread.start()

# 其他线程的代码...

print("厨房关闭，清洁完成。")

6. 线程优先级：谁先炒谁先洗

虽然Python标准库没有直接提供线程优先级的功能，但可以通过队列等间接实现。不过，大多数情况下，Python的线程调度是公平的，不需要担心。

7. 全局解释器锁（GIL）

Python的GIL是一个让人又爱又恨的东西，它保证了任何时刻只有一个线程在执行Python字节码，这对多核CPU来说不是个好消息。但在I/O密集型任务中，GIL的影响没那么大。

8. 线程局部存储：我的调料我做主

不同线程需要不同的“调料”怎么办？threading.local()来帮忙，它提供了线程本地的存储空间。

import threading

local_data = threading.local()

def set_data():
    local_data.value = "这是我的调料"

def get_data():
    print(local_data.value)

t1 = threading.Thread(target=set_data)
t2 = threading.Thread(target=get_data)

t1.start()
t2.start()

t1.join()
t2.join()

在这里，每个线程都有自己的local_data，互不影响。

9. 线程异常处理：防患于未然

线程中的异常不会自动传递到主线程，需要用try-except捕获处理。

def risky_task():
    raise ValueError("出错了!")

try:
    t = threading.Thread(target=risky_task)
    t.start()
    t.join()
except ValueError as e:
    print(f"捕获到异常: {e}")

确保即使线程出错，程序也不会突然崩溃。

10. 实战演练：多线程下载

最后，来点实战吧，比如多线程下载图片，体验速度的提升。

import requests
import threading
from queue import Queue

def download_image(url):
    response = requests.get(url)
    with open(f"image_{url[-4:]}", 'wb') as f:
        f.write(response.content)
    print(f"下载完成：{url}")

image_urls = ["http://example.com/image1.jpg", "http://example.com/image2.jpg"]  # 假设的URL
queue = Queue()
threads = []

for url in image_urls:
    queue.put(url)

def worker():
    while not queue.empty():
        url = queue.get()
        download_image(url)
        queue.task_done()

for _ in range(3):  # 启动3个下载线程
    t = threading.Thread(target=worker)
    t.start()
    threads.append(t)

# 等待所有下载任务完成
for t in threads:
    t.join()

print("所有图片下载完成！")

通过队列分配任务给多个线程，实现了并行下载，大大提高了效率。

好啦，今天的探险就到这里！希望你已经对Python多线程有了更深入的理解。

Python 多线程编程的十个关键概念

1. 线程的初步认知

2. 线程同步：避免厨房混乱

3. 死锁：可怕的厨房僵局

4. 线程池：高效管理厨房帮手

5. 守护线程：厨房的清洁工

6. 线程优先级：谁先炒谁先洗

7. 全局解释器锁（GIL）

8. 线程局部存储：我的调料我做主

9. 线程异常处理：防患于未然

10. 实战演练：多线程下载

浅析gitlab可以集成哪些扩展

Go语言与区块链技术的融合及其未来发展展望

css中important的用法

优化Zend框架的性能的方法

一个很有意思的Spring注入问题，你遇到过吗？