理解 Python 的 Dataclasses（一）

2024年 7月 18日 linux中国共饮一杯

理解 Python 的 Dataclasses（一）-1

如果你正在阅读本文，那么你已经意识到了 Python 3.7 以及它所包含的新特性。就我个人而言，我对 Dataclasses 感到非常兴奋，因为我等了它一段时间了。

本系列包含两部分：

Dataclass 特点概述

在下一篇文章概述 Dataclass 的 fields

介绍

Dataclasses 是 Python 的类（LCTT 译注：更准确的说，它是一个模块），适用于存储数据对象。你可能会问什么是数据对象？下面是定义数据对象的一个不太详细的特性列表：

它们存储数据并代表某种数据类型。例如：一个数字。对于熟悉 ORM 的人来说，模型实例就是一个数据对象。它代表一种特定的实体。它包含那些定义或表示实体的属性。
它们可以与同一类型的其他对象进行比较。例如：一个数字可以是 greater than（大于）、less than（小于）或 equal（等于）另一个数字。

当然还有更多的特性，但是这个列表足以帮助你理解问题的关键。

为了理解 Dataclasses，我们将实现一个包含数字的简单类，并允许我们执行上面提到的操作。

首先，我们将使用普通类，然后我们再使用 Dataclasses 来实现相同的结果。

但在我们开始之前，先来谈谈 Dataclasses 的用法。

Python 3.7 提供了一个装饰器 dataclass，用于将类转换为 dataclass。

你所要做的就是将类包在装饰器中：

from dataclasses import dataclass

@dataclass
class A:
 ...

现在，让我们深入了解一下 dataclass 带给我们的变化和用途。

初始化

通常是这样：

class Number:

    def __init__(self, val):
        self.val = val

>>> one = Number(1)
>>> one.val
>>> 1

用 dataclass 是这样：

@dataclass
class Number:
    val:int 

>>> one = Number(1)
>>> one.val
>>> 1

以下是 dataclass 装饰器带来的变化：

无需定义 __init__，然后将值赋给 self，dataclass 负责处理它（LCTT 译注：此处原文可能有误，提及一个不存在的 d）

我们以更加易读的方式预先定义了成员属性，以及类型提示。我们现在立即能知道 val 是 int 类型。这无疑比一般定义类成员的方式更具可读性。

Python 之禅: 可读性很重要

它也可以定义默认值：

@dataclass
class Number:
    val:int = 0

表示

对象表示指的是对象的一个有意义的字符串表示，它在调试时非常有用。

默认的 Python 对象表示不是很直观：

class Number:
    def __init__(self, val = 0):
    self.val = val

>>> a = Number(1)
>>> a
>>>

这让我们无法知悉对象的作用，并且会导致糟糕的调试体验。

一个有意义的表示可以通过在类中定义一个 __repr__ 方法来实现。

def __repr__(self):
    return self.val

现在我们得到这个对象有意义的表示：

>>> a = Number(1)
>>> a
>>> 1

dataclass 会自动添加一个 __repr__ 函数，这样我们就不必手动实现它了。

@dataclass
class Number:
    val: int = 0

>>> a = Number(1)
>>> a
>>> Number(val = 1)

数据比较

通常，数据对象之间需要相互比较。

两个对象 a 和 b 之间的比较通常包括以下操作：

a < b
a > b
a == b
a >= b
a import random >>> a = [Number(random.randint(1,10)) for _ in range(10)] #generate list of random numbers >>> a >>> [Number(val=2), Number(val=7), Number(val=6), Number(val=5), Number(val=10), Number(val=9), Number(val=1), Number(val=10), Number(val=1), Number(val=7)] >>> sorted_a = sorted(a) #Sort Numbers in ascending order >>> [Number(val=1), Number(val=1), Number(val=2), Number(val=5), Number(val=6), Number(val=7), Number(val=7), Number(val=9), Number(val=10), Number(val=10)] >>> reverse_sorted_a = sorted(a, reverse = True) #Sort Numbers in descending order >>> reverse_sorted_a
>>> [Number(val=10), Number(val=10), Number(val=9), Number(val=7), Number(val=7), Number(val=6), Number(val=5), Number(val=2), Number(val=1), Number(val=1)]

dataclass 作为一个可调用的装饰器

定义所有的 dunder（LCTT 译注：这是指双下划线方法，即魔法方法）方法并不总是值得的。你的用例可能只包括存储值和检查相等性。因此，你只需定义 __init__ 和 __eq__ 方法。如果我们可以告诉装饰器不生成其他方法，那么它会减少一些开销，并且我们将在数据对象上有正确的操作。

幸运的是，这可以通过将 dataclass 装饰器作为可调用对象来实现。

从官方文档来看，装饰器可以用作具有如下参数的可调用对象：
```
@dataclass(init=True, repr=True, eq=True, order=False, unsafe_hash=False, frozen=False)
class C:
 …
```
init：默认将生成 __init__ 方法。如果传入 False，那么该类将不会有 __init__ 方法。
repr：__repr__ 方法默认生成。如果传入 False，那么该类将不会有 __repr__ 方法。
eq：默认将生成 __eq__ 方法。如果传入 False，那么 __eq__ 方法将不会被 dataclass 添加，但默认为 object.__eq__。
order：默认将生成 __gt__、__ge__、__lt__、__le__ 方法。如果传入 False，则省略它们。

我们在接下来会讨论 frozen。由于 unsafe_hash 参数复杂的用例，它值得单独发布一篇文章。

现在回到我们的用例，以下是我们需要的：

__init__
__eq__

默认会生成这些函数，因此我们需要的是不生成其他函数。那么我们该怎么做呢？很简单，只需将相关参数作为 false 传入给生成器即可。

@dataclass(repr = False) # order, unsafe_hash and frozen are False
class Number:
    val: int = 0


>>> a = Number(1)

>>> a

>>> 

>>> b = Number(2)

>>> c = Number(1)

>>> a == b

>>> False

>>> a >> Traceback (most recent call last):
 File “”, line 1, in 
TypeError: ‘>> a = Number(10) #Assuming Number class is immutable

>>> a.val = 10 # Raises Error

有了 dataclass，就可以通过使用 dataclass 装饰器作为可调用对象配合参数 frozen=True 来定义一个 frozen 对象。

当实例化一个 frozen 对象时，任何企图修改对象属性的行为都会引发 FrozenInstanceError。

@dataclass(frozen = True) class Number: val: int = 0 >>> a = Number(1) >>> a.val >>> 1 >>> a.val = 2 >>> Traceback (most recent call last): File “”, line 1, in File “”, line 3, in __setattr__ dataclasses.FrozenInstanceError: cannot assign to field ‘val’

因此，一个 frozen 实例是一种很好方式来存储：

常数

设置

这些通常不会在应用程序的生命周期内发生变化，任何企图修改它们的行为都应该被禁止。

后期初始化处理

有了 dataclass，需要定义一个 __init__ 方法来将变量赋给 self 这种初始化操作已经得到了处理。但是我们失去了在变量被赋值之后立即需要的函数调用或处理的灵活性。

让我们来讨论一个用例，在这个用例中，我们定义一个 Float 类来包含浮点数，然后在初始化之后立即计算整数和小数部分。

通常是这样：

import math class Float: def __init__(self, val = 0): self.val = val self.process() def process(self): self.decimal, self.integer = math.modf(self.val) >>> a = Float( 2.2) >>> a.decimal >>> 0.2000 >>> a.integer >>> 2.0

幸运的是，使用 post_init 方法已经能够处理后期初始化操作。

生成的 __init__ 方法在返回之前调用 __post_init__ 返回。因此，可以在函数中进行任何处理。

import math @dataclass class FloatNumber: val: float = 0.0 def __post_init__(self): self.decimal, self.integer = math.modf(self.val) >>> a = Number(2.2) >>> a.val >>> 2.2 >>> a.integer >>> 2.0 >>> a.decimal >>> 0.2

多么方便！

继承

Dataclasses 支持继承，就像普通的 Python 类一样。

因此，父类中定义的属性将在子类中可用。

@dataclass class Person: age: int = 0 name: str @dataclass class Student(Person): grade: int >>> s = Student(20, "John Doe", 12) >>> s.age >>> 20 >>> s.name >>> "John Doe" >>> s.grade >>> 12

请注意，Student 的参数是在类中定义的字段的顺序。

继承过程中 __post_init__ 的行为是怎样的？

由于 __post_init__ 只是另一个函数，因此必须以传统方式调用它：

@dataclass class A: a: int def __post_init__(self): print("A") @dataclass class B(A): b: int def __post_init__(self): print("B") >>> a = B(1,2) >>> B

在上面的例子中，只有 B 的 __post_init__ 被调用，那么我们如何调用 A 的 __post_init__ 呢？

因为它是父类的函数，所以可以用 super 来调用它。

@dataclass class B(A): b: int def __post_init__(self): super().__post_init__() # 调用 A 的 post init print("B") >>> a = B(1,2) >>> A B

结论

因此，以上是 dataclass 使 Python 开发人员变得更轻松的几种方法。

我试着彻底覆盖大部分的用例，但是，没有人是完美的。如果你发现了错误，或者想让我注意相关的用例，请联系我。

我将在另一篇文章中介绍 dataclasses.field 和 unsafe_hash。

在 Github 和 Twitter 关注我。

更新：dataclasses.field 的文章可以在这里找到。

via: https://medium.com/mindorks/understanding-python-dataclasses-part-1-c3ccd4355c34

作者：Shikhar Chauhan 译者：MjSeven 校对：wxy

本文由 LCTT 原创编译，Linux中国荣誉推出

版权声明：

作者：共饮一杯

链接：https://www.mryunwei.com/634809.html

文章版权归作者所有，未经允许请勿转载。

dataclasses python 对象

上一篇全面教程：在 RxJS 中创建流


下一篇 Linux 用户应该换到 BSD 的 6 个理由

相关文章

2026 年 Linux 服务器选型指南：别再无脑上 Ubuntu 了

2026-04-20

Rocky Linux 10.1系统安装配置图解教程

2026-04-15

Linux 命令行的聊天工具 CenterIM

2024-07-20

Linux 桌面年仍未到来但 Linux 移动之年已到来

2024-07-20

12 个在线学习 Linux 技能网站

2024-07-20

Linux Mint ：会是另一个新的 Ubuntu 吗？

2024-07-20

共饮一杯

这个人很懒，什么都没有留下～

本月创作热力图

少

多

作者好文作者发言

文章榜

1
win10锁屏壁纸变黑白怎么办？win10锁屏壁纸变黑白解决教程？

2

Linux 平台七大桌面环境通览
linux中国

3

疫情在家5个月，我常常4点起床捉虫
数据运维

4

如何在 Rocky Linux 9 上安装 Nmap
系统运维

5

如何在Java 9中获取JShell文档？
开发运维