解密 Python 的变量和对象，它们之间有什么区别和联系呢？

开发运维 2024-05-08 剑圣无痕手机阅读

Python 中一切皆对象

在学习 Python 的时候，你肯定听过这么一句话：Python 中一切皆对象。没错，在 Python 世界里，一切都是对象。整数是一个对象、字符串是一个对象、字典是一个对象，甚至 int, str, list 以及我们使用 class 关键字自定义的类，它们也是对象。

像 int, str, list 等基本类型，以及自定义的类，由于它们可以表示类型，因此我们称之为类型对象；类型对象实例化得到的对象，我们称之为实例对象。但不管是哪种对象，它们都属于对象。

因此 Python 将面向对象理念贯彻的非常彻底，面向对象中的类和对象在 Python 中都是通过对象实现的。

在面向对象理论中，存在着类和对象两个概念，像 int、dict、tuple、以及使用 class 关键字自定义的类型对象实现了面向对象理论中类的概念，而 123、3.14，"string" 等等这些实例对象则实现了面向对象理论中对象的概念。但在 Python 里面，面向对象的类和对象都是通过对象实现的。

我们举个例子：

# dict 是一个类，因此它属于类型对象
# 类型对象实例化得到的对象属于实例对象
print(dict)
"""

"""
print(dict(a=1, b=2))
"""
{'a': 1, 'b': 2}
"""

因此可以用一张图来描述面向对象在 Python 中的体现。

解密 Python 的变量和对象，它们之间有什么区别和联系呢？-每日运维网图片

而如果想查看一个对象的类型，可以使用 type，或者通过对象的 __class__ 属性。

numbers = [1, 2, 3]
# 查看类型
print(type(numbers))
"""

"""
print(numbers.__class__)
"""

"""

如果想判断一个对象是不是指定类型的实例对象，可以使用 isinstance。

numbers = [1, 2, 3]
# 判断是不是指定类型的实例对象
print(isinstance(numbers, list))
"""
True
"""

但是问题来了，按照面向对象的理论来说，对象是由类实例化得到的，这在 Python 中也是适用的。既然是对象，那么就必定有一个类来实例化它，换句话说对象一定要有类型。

至于一个对象的类型是什么，就看这个对象是被谁实例化的，被谁实例化那么类型就是谁，比如列表的类型是 list，字典的类型是 dict 等等。

而 Python 中一切皆对象，所以像 int, str, tuple 这些内置的类对象也是具有相应的类型的，那么它们的类型又是谁呢？使用 type 查看一下就知道了。

>>> type(int)

>>> type(str)

>>> type(dict)

>>> type(type)

我们看到类型对象的类型，无一例外都是 type。而 type 我们也称其为元类，表示类型对象的类型。至于 type 本身，它的类型还是 type，所以它连自己都没放过，把自己都变成自己的对象了。

因此在 Python 中，你能看到的任何对象都是有类型的，可以使用 type 查看，也可以获取该对象的 __class__ 属性查看。所以：实例对象、类型对象、元类，Python 中任何一个对象都逃不过这三种身份。

到这里可能有人会发现一个有意思的点，我们说 int 是一个类对象，这显然是没有问题的。因为站在整数（比如 123）的角度上，int 是一个不折不扣的类对象；但如果站在 type 的角度上呢？显然我们又可以将 int 理解为实例对象，因此 class 具有二象性。

至于 type 也是同理，虽然它是元类，但本质上也是一个类对象。

注：不仅 type 是元类，那些继承了 type 的类也可以叫做元类。

然后 Python 中还有一个关键的类型（对象），叫做 object，它是所有类型对象的基类。不管是什么类，内置的类也好，我们自定义的类也罢，它们都继承自 object。因此 object 是所有类型对象的基类、或者说父类。

那如果我们想获取一个类都继承了哪些基类，该怎么做呢？方式有三种：

class A: pass

class B: pass

class C(A): pass

class D(B, C): pass

# 首先 D 继承自 B 和 C, C 又继承 A
# 我们现在要来查看 D 继承的父类

# 方法一: 使用 __base__
print(D.__base__)  
"""

"""

# 方法二: 使用 __bases__
print(D.__bases__)  
"""
(, )
"""

# 方法三: 使用 __mro__
print(D.__mro__)
"""
(, , 
 , , 
 )
"""

__base__：如果继承了多个类，那么只显示继承的第一个类，没有显式继承则返回
__bases__：返回一个元组，会显示所有直接继承的父类，没有显式继承则返回 (,)
__mro__: mro（Method Resolution Order）表示方法查找顺序，会从自身出发，找到最顶层的父类。因此返回自身、继承的基类、以及基类继承的基类, 一直找到 object

而如果想查看某个类型是不是另一个类型的子类，可以通过 issubclass。

print(issubclass(str, object))
"""
True
"""

因此，我们可以得出以下两个结论：

type 站在类型金字塔的最顶端，任何一个对象按照类型追根溯源，最终得到的都是 type；
object 站在继承金字塔的最顶端，任何一个类型对象按照继承关系追根溯源，最终得到的都是 object；

但要注意的是，我们说 type 的类型还是 type，但 object 的基类则不再是 object，而是 None。

print(
    type.__class__
)  # 

# 注：以下打印结果容易让人产生误解
# 它表达的含义是 object 的基类为空
# 而不是说 object 继承 None
print(
    object.__base__
)  # None

但为什么 object 的基类是 None，而不是它自身呢？其实答案很简单，Python 在查找属性或方法的时候，自身如果没有的话，会按照 __mro__ 指定的顺序去基类中查找。所以继承链一定会有一个终点，否则就会像没有出口的递归一样出现死循环了。

我们用一张图将对象之间的关系总结一下：

解密 Python 的变量和对象，它们之间有什么区别和联系呢？-每日运维网图片

实例对象的类型是类型对象，类型对象的类型是元类；
所有类型对象的基类都收敛于 object；
所有对象的类型都收敛于 type；

因此 Python 算是将一切皆对象的理念贯彻到了极致，也正因为如此，Python 才具有如此优秀的动态特性。

但是还没结束，我们再重新审视一下上面那张图，会发现里面有两个箭头看起来非常的奇怪。object 的类型是 type，type 又继承了 object。

>>> type.__base__

>>> object.__class__

因为 type 是所有类的元类，而 object 是所有类的基类，这就说明 type 要继承自 object，而 object 的类型是 type。很多人都会对这一点感到奇怪，这难道不是一个先有鸡还是先有蛋的问题吗？其实不是的，这两个对象是共存的，它们之间的定义其实是互相依赖的。而具体是怎么一回事，我们后续分析。

Python 的变量其实是指针

Python 的变量只是一个名字，如果站在 C 语言的角度来看，那么就是一个指针。所以 Python 的变量保存的其实是对象的内存地址，或者说指针，而指针指向的内存存储的才是对象。

所以在 Python 中，我们都说变量指向了某个对象。在其它静态语言中，变量相当于是为某块内存起的别名，获取变量等于获取这块内存所存储的值。而 Python 中变量代表的内存所存储的不是对象，而是对象的指针（或者说引用）。

我们举例说明，看一段 C 代码。

#include 

void main()
{
    int a = 666;
    printf("address of a = %p\n", &a);

    a = 667;
    printf("address of a = %p\n", &a);
}

编译执行一下：

解密 Python 的变量和对象，它们之间有什么区别和联系呢？-每日运维网图片

赋值前后地址都是 0x7fff9eda521c，没有变化，再来看一段 Python 代码。

a = 666
print(hex(id(a)))  # 0x7febf803a3d0

a = 667
print(hex(id(a)))  # 0x7fec180677b0

我们看到 Python 里面输出的地址发生了变化，下面分析一下原因。

首先在 C 中，创建一个变量的时候必须规定好类型，比如 int a = 666，那么变量 a 就是 int 类型，以后在所处的作用域中就不可以变了。如果这时候再设置 a = 777，那么等于是把内存中存储的 666 换成 777，a 的地址和类型是不会变化的。

而在 Python 中，a = 666 等于是先开辟一块内存，存储的值为 666，然后让变量 a 指向这片内存，或者说让变量 a 保存这块内存的地址。然后 a = 777 的时候，再开辟一块内存，然后让 a 指向存储 777 的内存，由于是两块不同的内存，所以它们的地址是不一样的。

解密 Python 的变量和对象，它们之间有什么区别和联系呢？-每日运维网图片

所以 Python 的变量只是一个和对象关联的名字，它代表的是对象的指针。换句话说 Python 的变量就是个便利贴，可以贴在任何对象上，一旦贴上去了，就代表这个对象被引用了。

值传递？引用传递？

再来看看变量之间的传递，在 Python 中是如何体现的。

a = 666
print(hex(id(a)))  # 0x1f4e8ca7fb0

b = a
print(hex(id(b)))  # 0x1f4e8ca7fb0

我们看到打印的地址是一样的，再用一张图解释一下。

解密 Python 的变量和对象，它们之间有什么区别和联系呢？-每日运维网图片

a = 666 的时候，先开辟一份内存，再让 a 存储对应内存的地址；然后 b = a 的时候，会把 a 拷贝一份给 b，所以 b 和 a 存储了相同的地址，它们都指向了同一个对象。

因此说 Python 是值传递、或者引用传递都是不准确的，准确的说 Python 是变量的值传递，对象的引用传递。因为 Python 的变量可以认为是 C 的一个指针，在 b = a 的时候，等于把 a 指向的对象的地址（a 本身）拷贝一份给 b，所以对于变量来说是值传递；然后 a 和 b 又都是指向对象的指针，因此对于对象来说是引用传递。

在这个过程中，对象没有重复创建，它只是多了一个引用。

另外还有最关键的一点，Python 的变量是一个指针，当传递变量的时候，传递的是指针；但是在操作变量的时候，会操作变量指向的内存。所以 id(a) 获取的不是 a 的地址，而是 a 指向的内存的地址（在底层其实就是 a 本身）；同理 b = a，是将 a 本身，或者说将 a 存储的、指向某个具体的对象的地址传递给了 b。

另外在 C 的层面，显然 a 和 b 属于指针变量，那么 a 和 b 有没有地址呢？显然是有的，只不过在 Python 中是获取不到的，解释器只允许获取对象的地址。

我们再举个函数的例子：

def some_func(num):
    print("address of local num", hex(id(num)))
    num = 667
    print("address of local num", hex(id(num)))

num = 666
print("address of global num", hex(id(num)))
some_func(num)
"""
address of global num 0x2356cd698d0
address of local num 0x2356cd698d0
address of local num 0x2356c457f90
"""

函数的参数也是一个变量，所以 some_func(num) 其实就是把全局变量 num 存储的对象的地址拷贝一份给局部变量 num，所以两个 num 指向了同一个对象，打印的地址相同。

然后在函数内部执行 num = 667，相当于让局部变量指向新的对象，或者说保存新对象的地址，因此打印的结果发生变化。

变量有类型吗？

当提到类型时，这个类型指的是变量的类型还是对象的类型呢？不用想，肯定是对象的类型。因为 Python 的变量是个指针，操作指针会自动操作它指向的内存，所以使用 type(a) 查看的其实是变量 a 指向的对象的类型。

那么问题来了，我们在创建变量的时候，并没有显式地指定类型啊，那么 Python 是如何判断一个变量指向的是什么类型的数据呢？答案是：解释器是通过靠猜的方式，通过赋的值（或者说变量引用的值）来推断类型。

因此在 Python 中，如果你想创建一个变量，那么必须在创建变量的时候同时赋值，否则解释器就不知道这个变量指向的数据是什么类型。所以 Python 是先创建相应的值，这个值在 C 中对应一个结构体，结构体里面有一个成员专门用来存储该值对应的类型，因此在 Python 中，类型是和对象绑定的，而不是和变量。当创建完值之后，再让这个变量指向它，所以 Python 中是先有值后有变量。

但显然在 C 里面不是这样的，因为 C 的变量代表的内存所存储的就是具体的值，所以在 C 里面可以直接声明一个变量的同时不赋值。因为 C 要求声明变量时必须指定类型，因此变量声明之后，其类型和内存大小就已经固定了。

而 Python 的变量存的是个地址，它只是指向了某个对象，所以由于其便利贴的特性，可以贴在任意对象上面。但是不管贴在哪个对象，都必须先有对象才可以，不然变量贴谁去。

另外，尽管 Python 在创建变量的时候不需要指定类型，但 Python 是强类型语言，而且是动态强类型。