跟我一起从零开始学python(六)数据库编程:MongoDB数据库

2023年 7月 14日 149.6k 0

前言

回顾之前讲了python语法编程 ,必修入门基础和网络编程,多线程/多进程/协程等方面的内容,昨天和今天讲到了数据库编程篇MySQL,Redis今天第三篇MongoDB篇,前面没看的也不用往前翻,系列文已经整理好了:

1.跟我一起从零开始学python(一)编程语法必修
2.跟我一起从零开始学python(二)网络编程
3.跟我一起从零开始学python(三)多线程/多进程/协程
4.跟我一起从零开始学python(四)数据库编程:MySQL数据库
5.跟我一起从零开始学python(五)数据库编程:redisL数据库

本篇讲:python数据库编程:MongoDB数据库

本系列文根据以下学习路线展开讲述,由于内容较多,:

从零开始学python到高级进阶路线图

关注公众号:python技术训练营,学习进阶一步到位

适用于零基础学习和进阶人群的python资源:

① 腾讯认证python完整项目实战教程笔记PDF
② 十几个大厂python面试专题PDF
③ python全套视频教程(零基础-高级进阶JS逆向)
④ 百个项目实战+源码+笔记
⑤ 编程语法-机器学习-全栈开发-数据分析-爬虫-APP逆向等全套项目+文档
⑥ 交流学习
⑦ 想要兼职接单

下章讲:机器学习模块

一丶MongoDB简单介绍

Python MongoDB是一种非关系型数据库,也被称为NoSQL数据库。旨在提供高性能、高可用性和可扩展性的数据存储解决方案。Python MongoDB使用JSON格式存储数据,这使得它非常适合处理大量非结构化数据。

Python MongoDB的主要特点包括:

  • 高性能:Python MongoDB使用内存映射技术,可以快速读取和写入数据。

  • 高可用性:Python MongoDB支持主从复制和分片技术,可以保证数据的可靠性和可用性。

  • 可扩展性:Python MongoDB可以轻松地扩展到多个节点,以满足不断增长的数据需求。

  • 灵活性:Python MongoDB支持动态模式,可以根据需要随时更改数据结构。

  • 易用性:Python MongoDB提供了简单易用的API,可以轻松地进行数据操作。

Python MongoDB的安装非常简单,只需要使用pip命令即可安装。安装完成后,可以使用pymongo库来连接和操作MongoDB数据库。

Python MongoDB的应用场景非常广泛,特别是在大数据处理和实时数据分析方面。它可以用于存储日志数据、社交媒体数据、物联网数据等各种类型的非结构化数据。同时,Python MongoDB也可以与其他数据存储解决方案(如关系型数据库)进行集成,以满足不同的数据处理需求。

总之,Python MongoDB是一种高性能、高可用性和可扩展性的数据存储解决方案,可以帮助开发人员轻松地处理大量非结构化数据。

二丶关于database的基础命令

MongoDB是一种非关系型数据库,它使用文档存储数据,而不是使用表格。Python是一种流行的编程语言,它可以与MongoDB数据库进行交互。在Python中,我们可以使用PyMongo库来连接和操作MongoDB数据库。

在MongoDB中,我们可以使用以下基础命令来管理数据库:

创建数据库

在MongoDB中,我们可以使用use命令来创建一个新的数据库。例如,要创建一个名为mydatabase的数据库,我们可以使用以下命令:

use mydatabase

如果数据库不存在,则MongoDB将创建一个新的数据库。如果数据库已经存在,则MongoDB将返回该数据库的引用。

显示数据库

要显示MongoDB中所有的数据库,我们可以使用以下命令:

show dbs

这将列出MongoDB中所有的数据库。

删除数据库

要删除MongoDB中的数据库,我们可以使用以下命令:

db.dropDatabase()

这将删除当前选定的数据库。

切换数据库

要切换到MongoDB中的另一个数据库,我们可以使用以下命令:

use anotherdatabase

这将切换到名为anotherdatabase的数据库。

显示当前数据库

要显示当前选定的数据库,我们可以使用以下命令:

db

这将返回当前选定的数据库的引用。

总之,Python与MongoDB数据库的交互非常方便,可以使用PyMongo库来连接和操作MongoDB数据库。在Python中,我们可以使用基础命令来管理数据库,例如创建、显示、删除和切换数据库。

三丶关于集合的基础命令

Python MongoDB数据库关于集合的基础命令

在Python中使用MongoDB数据库时,集合是MongoDB中的一个重要概念。集合类似于关系型数据库中的表,但是MongoDB是一个文档型数据库,因此集合中存储的是文档。

以下是Python MongoDB数据库关于集合的基础命令:

创建集合

要创建一个集合,可以使用MongoDB的db.create_collection()方法。在Python中,可以使用pymongo库中的Collection类的insert_one()方法来创建集合。

import pymongo

# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")

# 创建一个名为mycollection的集合
mydb = client["mydatabase"]
mycol = mydb["mycollection"]

插入文档

要向集合中插入文档,可以使用MongoDB的db.collection.insert()方法。在Python中,可以使用pymongo库中的Collection类的insert_one()方法来插入文档。

import pymongo

# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")

# 获取mycollection集合
mydb = client["mydatabase"]
mycol = mydb["mycollection"]

# 插入一条文档
mydict = { "name": "John", "address": "Highway 37" }
x = mycol.insert_one(mydict)

查询文档

要查询集合中的文档,可以使用MongoDB的db.collection.find()方法。在Python中,可以使用pymongo库中的Collection类的find()方法来查询文档。

import pymongo

# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")

# 获取mycollection集合
mydb = client["mydatabase"]
mycol = mydb["mycollection"]

# 查询所有文档
for x in mycol.find():
  print(x)

更新文档

要更新集合中的文档,可以使用MongoDB的db.collection.update()方法。在Python中,可以使用pymongo库中的Collection类的update_one()方法来更新文档。

import pymongo

# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")

# 获取mycollection集合
mydb = client["mydatabase"]
mycol = mydb["mycollection"]

# 更新一条文档
myquery = { "address": "Highway 37" }
newvalues = { "$set": { "address": "Park Lane 38" } }
mycol.update_one(myquery, newvalues)

删除文档

要删除集合中的文档,可以使用MongoDB的db.collection.remove()方法。在Python中,可以使用pymongo库中的Collection类的delete_one()方法来删除文档。

import pymongo

# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")

# 获取mycollection集合
mydb = client["mydatabase"]
mycol = mydb["mycollection"]

# 删除一条文档
myquery = { "address": "Park Lane 38" }
mycol.delete_one(myquery)

四丶数据类型

MongoDB数据库支持以下数据类型:

  • String(字符串):存储文本数据,最常用的数据类型。

  • Integer(整型):存储整数。

  • Boolean(布尔型):存储布尔值(true/false)。

  • Double(双精度浮点型):存储浮点数。

  • Min/Max keys(最小值/最大值):用于比较值的最小值和最大值。

  • Arrays(数组):用于存储数组或列表。

  • Timestamp(时间戳):记录文档修改或添加的时间。

  • Object(对象):用于嵌入式文档。

  • Null(空值):用于表示空值或不存在的字段。

  • Symbol(符号):类似于字符串,但是用于特定的上下文环境。

  • Date(日期):用于存储日期和时间。

  • Object ID(对象ID):用于唯一标识文档。

  • Binary data(二进制数据):用于存储二进制数据,如图片、音频等。

  • Code(代码):用于存储JavaScript代码。

  • Regular expression(正则表达式):用于存储正则表达式。

五丶数据操作

Python中操作MongoDB数据库的方式有多种,可以使用官方提供的pymongo库,也可以使用第三方库mongoengine等。

以下是pymongo库的基本数据操作:

连接数据库

import pymongo

client = pymongo.MongoClient('mongodb://localhost:27017/')
db = client['testdb']

插入数据

collection = db['testcollection']
data = {'name': 'Tom', 'age': 18}
collection.insert_one(data)

查询数据

# 查询所有数据
result = collection.find()
for item in result:
    print(item)

# 查询指定条件的数据
result = collection.find({'name': 'Tom'})
for item in result:
    print(item)

更新数据

# 更新一条数据
collection.update_one({'name': 'Tom'}, {'$set': {'age': 20}})

# 更新多条数据
collection.update_many({'name': 'Tom'}, {'$set': {'age': 20}})

删除数据

# 删除一条数据
collection.delete_one({'name': 'Tom'})

# 删除多条数据
collection.delete_many({'name': 'Tom'})

聚合操作

# 统计数据总数
count = collection.count_documents({})

# 按条件分组统计
result = collection.aggregate([
    {'$group': {'_id': '$name', 'count': {'$sum': 1}}}
])
for item in result:
    print(item)

以上是pymongo库的基本数据操作,其他库的操作方式也类似

六丶数据的备份与恢复

Python中备份和恢复MongoDB数据库可以使用mongodumpmongorestore命令,也可以使用pymongo库中的函数进行操作。

使用mongodumpmongorestore命令备份和恢复MongoDB数据库

备份MongoDB数据库:

mongodump --host  --port  --db  --out 

其中,是MongoDB服务器的IP地址或主机名,是MongoDB服务器的端口号,默认为27017,是要备份的数据库名称,是备份文件存放的目录。

恢复MongoDB数据库:

mongorestore --host  --port  --db  

其中,、、和的含义与备份命令相同。

使用pymongo库备份和恢复MongoDB数据库

备份MongoDB数据库:

import pymongo
import datetime

client = pymongo.MongoClient("")
db = client[""]
collection = db[""]

backup = collection.find()

with open("", "w") as f:
    for doc in backup:
        f.write(str(doc) + "n")

其中,是MongoDB服务器的URI,和是要备份的数据库和集合名称,是备份文件的路径。

恢复MongoDB数据库:

import pymongo

client = pymongo.MongoClient("")
db = client[""]
collection = db[""]

with open("", "r") as f:
    for line in f:
        doc = eval(line.strip())
        collection.insert_one(doc)

其中,、、和的含义与备份命令相同。注意,这种方法只适用于备份和恢复小型数据库,对于大型数据库,建议使用mongodumpmongorestore命令进行操作。

七丶聚合操作

MongoDB的聚合操作是指将多个文档进行分组、筛选、排序、计算等操作,以生成新的文档集合的过程。Python中可以使用pymongo库来进行MongoDB的聚合操作。

以下是一个简单的聚合操作示例,假设我们有一个名为students的集合,其中包含每个学生的姓名、年龄和成绩:

from pymongo import MongoClient

client = MongoClient()
db = client['test']
collection = db['students']

pipeline = [
    {"$group": {"_id": "$age", "avg_score": {"$avg": "$score"}}},
    {"$sort": {"_id": 1}}
]

result = collection.aggregate(pipeline)

for doc in result:
    print(doc)

上述代码中,我们使用了MongoDB的group和group和avg操作符来计算每个年龄段的平均成绩,并使用$sort操作符按年龄升序排序。最终的结果将会是一个包含每个年龄段平均成绩的文档集合。

除了group和group和avg操作符外,MongoDB还提供了许多其他的聚合操作符,如match、match、project、sort、sort、limit等,可以根据具体需求进行组合使用。

八丶索引

MongoDB中的索引是用于提高查询性能的一种数据结构。在MongoDB中,可以使用多种类型的索引,包括单字段索引、复合索引、全文索引等。

以下是使用Python操作MongoDB索引的示例:

创建单字段索引

from pymongo import MongoClient

client = MongoClient()
db = client.test_database
collection = db.test_collection

# 创建单字段索引
collection.create_index("name")

# 查询是否创建成功
print(collection.index_information())

创建复合索引

from pymongo import MongoClient

client = MongoClient()
db = client.test_database
collection = db.test_collection

# 创建复合索引
collection.create_index([("name", 1), ("age", -1)])

# 查询是否创建成功
print(collection.index_information())

创建全文索引

from pymongo import MongoClient

client = MongoClient()
db = client.test_database
collection = db.test_collection

# 创建全文索引
collection.create_index([("content", "text")])

# 查询是否创建成功
print(collection.index_information())

查询使用索引

from pymongo import MongoClient

client = MongoClient()
db = client.test_database
collection = db.test_collection

# 查询使用索引
result = collection.find({"name": "Tom"}).explain()["executionStats"]
print(result)

以上是Python操作MongoDB索引的示例,可以根据实际需求选择不同类型的索引来提高查询性能。

九丶pymongo的操作

Python中操作MongoDB数据库需要使用pymongo库,以下是pymongo库的常用操作:

连接MongoDB数据库

import pymongo

client = pymongo.MongoClient('mongodb://localhost:27017/')

选择数据库

db = client['database_name']

选择集合

collection = db['collection_name']

插入文档

data = {'name': 'John', 'age': 25}
collection.insert_one(data)

查询文档

result = collection.find_one({'name': 'John'})

更新文档

collection.update_one({'name': 'John'}, {'$set': {'age': 30}})

删除文档

collection.delete_one({'name': 'John'})

查询多个文档

results = collection.find({'age': {'$gt': 20}})
for result in results:
    print(result)

以上是pymongo库的常用操作,可以根据实际需求进行调用。

本系列文根据以下学习路线展开讲述,由于内容较多,:

从零开始学python到高级进阶路线图

关注公众号:python技术训练营,学习进阶一步到位

适用于零基础学习和进阶人群的python资源:

① 腾讯认证python完整项目实战教程笔记PDF
② 十几个大厂python面试专题PDF
③ python全套视频教程(零基础-高级进阶JS逆向)
④ 百个项目实战+源码+笔记
⑤ 编程语法-机器学习-全栈开发-数据分析-爬虫-APP逆向等全套项目+文档
⑥ 交流学习
⑦ 想要兼职接单

下章讲:机器学习模块

相关文章

JavaScript2024新功能:Object.groupBy、正则表达式v标志
PHP trim 函数对多字节字符的使用和限制
新函数 json_validate() 、randomizer 类扩展…20 个PHP 8.3 新特性全面解析
使用HTMX为WordPress增效:如何在不使用复杂框架的情况下增强平台功能
为React 19做准备:WordPress 6.6用户指南
如何删除WordPress中的所有评论

发布评论