初探Golang数据结构之Slice

开发运维 2023-09-17 贤蛋大眼萌手机阅读

在阅读Go语言圣经时，一直对数组和切片的使用场景好奇，不明白为什么推荐使用切片来代替数组。希望能通过一些梳理，能更好的理解切片和数组，找到他们合适的使用场景。

切片与数组

关于切片和数组怎么选择，我们来讨论下这个问题。

在Go中，数组是值类型，赋值和函数传参都会复制整个数组数据。

func main() {
    a := [2]int{100, 200}
    // 赋值
    var b = a
    fmt.Printf("a : %p , %v\n", &a, a)
    fmt.Printf("b : %p , %v\n", &b, b)
    // 函数传参
    f(a)
    f(b)
}

func f(array [2]int) {
    fmt.Printf("array : %p , %v\n", &array, array)
}

输出结果：

a : 0xc0000180a0 , [100 200]
b : 0xc0000180b0 , [100 200]
array : 0xc0000180f0 , [100 200]
array : 0xc000018110 , [100 200]

可以看到，四个内存地址都不相同，印证了前面的说法。当数组数据量达到百万级别时，复制数组会给内存带来巨大的压力，那能否通过传递指针来解决呢?

func main() {
    a := [1]int{100}
    f1(&a)
    fmt.Printf("array : %p , %v\n", &a, a)
}

func f1(p *[1]int) {
    fmt.Printf("f1 array : %p , %v\n", p, *p)
    (*p)[0] += 100
}

输出结果：

f1 array : 0xc0000b0008 , [100]
array : 0xc0000b0008 , [200]

可以看到，数组指针可以实现我们想要的效果，解决了复制数组带来的内存问题，不过函数接收的指针来自值拷贝，相对来说没有切片那么灵活。

func main() {
    a := [1]int{100}
    f1(&a)
    // 切片
    b := a[:]
    f2(&b)
    fmt.Printf("array : %p , %v\n", &a, a)
}

func f1(p *[1]int) {
    fmt.Printf("f1 array : %p , %v\n", p, *p)
    (*p)[0] += 100
}
func f2(p *[]int) {
    fmt.Printf("f2 array : %p , %v\n", p, *p)
    (*p)[0] += 100
}

//输出结果
f1 array : 0xc000018098 , [100]
f2 array : 0xc00000c030 , [200]
array : 0xc000018098 , [300]

可以看到，切片的指针和原来数组的指针是不同的。

总结

通常来说，使用数组进行参数传递会消耗较多内存，采用切片可以避免此问题。切片是引用传递，不会占用较多内存，效率更高一些。

切片的数据结构

切片在编译期是 cmd/compile/internal/types/type.go 包下的Slice类型，而它的运行时的数据结构位于 reflect.SliceHeader

type SliceHeader struct {
        Data uintptr // 指向数组的指针
        Len  int    // 当前切片的长度
        Cap  int    // 当前切片的容量，cap 总是 >= len
}
// 占用24个字节
fmt.Println(unsafe.Sizeof(reflect.SliceHeader{}))

切片是对数组一个连续片段的引用，这个片段可以是整个数组，也可以是数组的一部分。切片的长度可以在运行时修改，最小为0，最大为关联数组的长度，切片是一个长度可变的动态窗口。

创建切片

使用make

slice := make([]int, 4, 6)

内存空间申请了6个int类型的内存大小。由于len=4，所以后面2个空间暂时无法访问到，但是容量是存在的。此时数组里每个变量都=0。

字面量

slice := []int{0, 1, 2}

nil切片和空切片

// nil 切片
var s []int
// 空切片 
s2 := make([]int, 0)
s3 := []int{}

空切片和 nil 切片的区别在于，空切片指向的地址不是nil，指向的是一个内存地址，但是它没有分配任何内存空间，即底层元素包含0个元素。

func main() {
    var s []int
    s2 := []int{}
    s3 := make([]int, 0)
    fmt.Println(s == nil)
    fmt.Println(s2 == nil)
    fmt.Println(s3 == nil)
}
// 输出结果
true
false
false

简单说，nil切片指针值为nil；而空切片的指针值不为nil，原因详见bytetech.info/articles/71…

需要说明的一点是，不管是使用 nil 切片还是空切片，对其调用内置函数 append，len 和 cap 的效果都是一样的。

但使用append时要注意：

如果append追加的数据长度小于等于cap-len，只做一次数据拷贝。
如果append追加的数据长度大于cap-len，则会分配一块更大的内存，然后把原数据拷贝过来，再进行追加。

特别当我们需要构建一个切片，是从原有切片复制而来时，要注意值覆盖问题。

func main() {
    s1 := []int{0, 1, 2, 3} // 先定义一个现有切片
    s2 := s1[0:1]           // 复制现有的切片
    s2 = append(s2, 100)
    fmt.Print(s1)
}

输出结果

[0 100 2 3]

原因还是切片本质上是数组的一个动态窗口，当cap够用时，不会新开辟内存空间进行复制，此时对数组的任何修改，都会对其他代理此数组的切片产生连带影响。

初探Golang数据结构之Slice

总结

使用make

字面量

埃拉托斯特尼筛法：加速“交叉倍数”步骤

Mojo语言首探！能取代Python吗？

PHP数组切片如何使用？

Java 函数中的原子操作如何确保线程安全？

别再用 float 布局了，flex 才是未来！