说再见Python循环，“向量化”让我们代码更高效

2024年 2月 22日开发运维大猫

介绍

循环在我们身边自然而然地出现，我们几乎在所有编程语言中都学过循环。因此，默认情况下，每当有重复操作时，我们就开始实现循环。但是当我们处理大量迭代（数百万/数十亿行）时，使用循环就是一种罪行。我们可能会卡住好几个小时，最后意识到它行不通。这就是在Python中实现向量化变得非常关键的地方。

什么是向量化？

向量化是在数据集上实现（NumPy）数组操作的技术。在后台，它将操作应用于数组或系列的所有元素，一次性完成（不像“for”循环一次操作一行）。在这篇文章中中，我们可以轻松地用向量化替代Python循环。这将帮助我们节省时间，并在编码方面变得更加熟练。

用例1：找到数字的和

首先，我们将看一个使用循环和Python中的向量化找到数字和的基本示例。

使用循环：

import time 
start = time.time()

# iterative sum
total = 0
# iterating through 1.5 Million numbers
for item in range(0, 1500000):
    total = total + item

print('sum is:' + str(total))
end = time.time()
print(end - start)
#1124999250000
#0.14 Seconds

使用向量化：

import numpy as np

start = time.time()
# vectorized sum - using numpy for vectorization
# np.arange create the sequence of numbers from 0 to 1499999
print(np.sum(np.arange(1500000)))
end = time.time()
print(end - start)

##1124999250000
##0.008 Seconds

相比于使用range函数进行迭代，向量化执行时间约为循环的18倍。在使用Pandas DataFrame时，这种差异将变得更为显著。

用例2：数学运算（在DataFrame上）

在数据科学中，开发人员在使用Pandas DataFrame时，使用循环进行数学运算以创建新的派生列。在以下示例中，我们可以看到如何轻松地将循环替换为这种情况下的向量化。

创建DataFrame：

DataFrame是以行和列形式的表格数据。我们创建一个具有500万行和4列，填充了0到50之间的随机值的Pandas DataFrame。

import numpy as np
import pandas as pd
df = pd.DataFrame(np.random.randint(0, 50, size=(5000000, 4)), columns=('a','b','c','d'))
df.shape
# (5000000, 5)
df.head()

前5行

我们将创建一个新列’ratio’，以找到列’d’和’c’的比率。

使用循环：

import time 
start = time.time()

# Iterating through DataFrame using iterrows
for idx, row in df.iterrows():
    # creating a new column 
    df.at[idx,'ratio'] = 100 * (row["d"] / row["c"])  
end = time.time()
print(end - start)
### 109 Seconds

使用向量化：

start = time.time()
df["ratio"] = 100 * (df["d"] / df["c"])

end = time.time()
print(end - start)
### 0.12 seconds

我们可以看到，在DataFrame中，与Python中的循环相比，向量化操作所需的时间几乎快1000倍。

用例3：if-else语句（在DataFrame上）

我们实现了许多需要使用“If-else”类型逻辑的操作。我们可以轻松地用Python中的向量化操作替换这些逻辑。让我们看下面的例子以更好地理解它（我们将使用在用例2中创建的DataFrame）：

假设我们想基于对现有列‘a’的某些条件创建一个新列‘e’。

使用循环：

import time 
start = time.time()

# Iterating through DataFrame using iterrows
for idx, row in df.iterrows():
    if row.a == 0:
        df.at[idx,'e'] = row.d    
    elif (row.a  0):
        df.at[idx,'e'] = (row.b)-(row.c)    
    else:
        df.at[idx,'e'] = row.b + row.c
end = time.time()
print(end - start)
### Time taken: 177 seconds

使用向量化：

# using vectorization 
start = time.time()

df['e'] = df['b'] + df['c']

df.loc[df['a']


                        
                                    版权声明：
                    作者：大猫
                    链接：https://www.mryunwei.com/542246.html
                    文章版权归作者所有，未经允许请勿转载。
                            
                                    
                
                    
                
                                python
                                循环
                            
                                    
                                                
                                
                    
                    
                        上一篇
                        六款前端炫酷动画库大比拼
                    
                
                                                
                    
                    
                        下一篇
                        Python中dropwhile()和takewhile()函数有什么用的?


        


    
    
                                    相关文章
    

            
    
                
            
                
            
            
                PHP + Go 双语言融合：我在生产项目中实现的架构方案
                2026-04-20
            
        
                
            
                
            
            
                国际通用语种代号表（ISO 639）中文版
                2025-09-18
            
        
                
            
                
            
            
                如何让 code-server 使用 vscode 官方插件仓库
                2025-09-18
            
        
                
            
                
            
            
                内网专用轻量级 SOCKS5 代理实现（nodejs ）
                2025-09-18
            
        
                
            
                
            
            
                Nginx 启用 HTTP/3 配置教程（含排障）
                2025-09-18
            
        
                
            
                
            
            
                使用分块传输编码突破CDN限制上传大文件
                2025-09-16


                                
                            
                    
            
                
                    
                
                
                    大猫
                
            
            这个人很懒，什么都没有留下～

            

            
                
                    本月创作热力图
                    
                        少
                        
                            
                            
                            
                            
                        
                        多
                    
                
                
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                                            
                                    
            

            
                
                作者好文
                
                作者发言
            

            
                
                    
                                                    
                                
                                
                            
                                                    
                                
                                
                            
                                                    
                                
                                
                            
                                                    
                                
                                
                            
                                                    
                                
                                
                            
                                            
                
                
                    
                                                    
                                
                                
                            
                                                    
                                
                                
                            
                                                    
                                
                                
                            
                                                    
                                
                                
                            
                                                    
                                
                                
                            
                                            
                
            
        
        
文章榜
        
            1
            
            
                怎么在Win10系统中创建本地用户或管理员帐户？
            
        
                
            2
            
                
            
            
                RocketMQ源码系列（9） — 消息消费之消费队列和索引
                                开发运维
                            
        
                
            3
            
                
            
            
                Epic 游戏商店现在可在 Steam Deck 上使用啦
                                linux中国
                            
        
                
            4
            
                
            
            
                使用 pdftk 为 PDF 文档创建书签
                                linux中国
                            
        
                
            5
            
                
            
            
                使用 Pandoc 将你的书转换成网页和电子书
                                linux中国