前言
回顾之前讲了python语法编程 ,必修入门基础和网络编程,多线程/多进程/协程等方面的内容,昨天和今天讲到了数据库编程篇MySQL,Redis今天第三篇MongoDB篇,前面没看的也不用往前翻,系列文已经整理好了:
1.跟我一起从零开始学python(一)编程语法必修
2.跟我一起从零开始学python(二)网络编程
3.跟我一起从零开始学python(三)多线程/多进程/协程
4.跟我一起从零开始学python(四)数据库编程:MySQL数据库
5.跟我一起从零开始学python(五)数据库编程:redisL数据库
本篇讲:python数据库编程:MongoDB数据库
本系列文根据以下学习路线展开讲述,由于内容较多,:
从零开始学python到高级进阶路线图
关注公众号:python技术训练营,学习进阶一步到位
适用于零基础学习和进阶人群的python资源:
① 腾讯认证python完整项目实战教程笔记PDF
② 十几个大厂python面试专题PDF
③ python全套视频教程(零基础-高级进阶JS逆向)
④ 百个项目实战+源码+笔记
⑤ 编程语法-机器学习-全栈开发-数据分析-爬虫-APP逆向等全套项目+文档
⑥ 交流学习
⑦ 想要兼职接单
下章讲:机器学习模块
一丶MongoDB简单介绍
Python MongoDB是一种非关系型数据库,也被称为NoSQL数据库。旨在提供高性能、高可用性和可扩展性的数据存储解决方案。Python MongoDB使用JSON格式存储数据,这使得它非常适合处理大量非结构化数据。
Python MongoDB的主要特点包括:
-
高性能:Python MongoDB使用内存映射技术,可以快速读取和写入数据。
-
高可用性:Python MongoDB支持主从复制和分片技术,可以保证数据的可靠性和可用性。
-
可扩展性:Python MongoDB可以轻松地扩展到多个节点,以满足不断增长的数据需求。
-
灵活性:Python MongoDB支持动态模式,可以根据需要随时更改数据结构。
-
易用性:Python MongoDB提供了简单易用的API,可以轻松地进行数据操作。
Python MongoDB的安装非常简单,只需要使用pip命令即可安装。安装完成后,可以使用pymongo库来连接和操作MongoDB数据库。
Python MongoDB的应用场景非常广泛,特别是在大数据处理和实时数据分析方面。它可以用于存储日志数据、社交媒体数据、物联网数据等各种类型的非结构化数据。同时,Python MongoDB也可以与其他数据存储解决方案(如关系型数据库)进行集成,以满足不同的数据处理需求。
总之,Python MongoDB是一种高性能、高可用性和可扩展性的数据存储解决方案,可以帮助开发人员轻松地处理大量非结构化数据。
二丶关于database的基础命令
MongoDB是一种非关系型数据库,它使用文档存储数据,而不是使用表格。Python是一种流行的编程语言,它可以与MongoDB数据库进行交互。在Python中,我们可以使用PyMongo库来连接和操作MongoDB数据库。
在MongoDB中,我们可以使用以下基础命令来管理数据库:
创建数据库
在MongoDB中,我们可以使用use命令来创建一个新的数据库。例如,要创建一个名为mydatabase
的数据库,我们可以使用以下命令:
use mydatabase
如果数据库不存在,则MongoDB将创建一个新的数据库。如果数据库已经存在,则MongoDB将返回该数据库的引用。
显示数据库
要显示MongoDB中所有的数据库,我们可以使用以下命令:
show dbs
这将列出MongoDB中所有的数据库。
删除数据库
要删除MongoDB中的数据库,我们可以使用以下命令:
db.dropDatabase()
这将删除当前选定的数据库。
切换数据库
要切换到MongoDB中的另一个数据库,我们可以使用以下命令:
use anotherdatabase
这将切换到名为anotherdatabase
的数据库。
显示当前数据库
要显示当前选定的数据库,我们可以使用以下命令:
db
这将返回当前选定的数据库的引用。
总之,Python与MongoDB数据库的交互非常方便,可以使用PyMongo
库来连接和操作MongoDB数据库。在Python中,我们可以使用基础命令来管理数据库,例如创建、显示、删除和切换数据库。
三丶关于集合的基础命令
Python MongoDB数据库关于集合的基础命令
在Python中使用MongoDB数据库时,集合是MongoDB中的一个重要概念。集合类似于关系型数据库中的表,但是MongoDB是一个文档型数据库,因此集合中存储的是文档。
以下是Python MongoDB数据库关于集合的基础命令:
创建集合
要创建一个集合,可以使用MongoDB的db.create_collection()
方法。在Python中,可以使用pymongo
库中的Collection
类的insert_one()
方法来创建集合。
import pymongo
# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")
# 创建一个名为mycollection的集合
mydb = client["mydatabase"]
mycol = mydb["mycollection"]
插入文档
要向集合中插入文档,可以使用MongoDB的db.collection.insert()
方法。在Python中,可以使用pymongo
库中的Collection
类的insert_one()
方法来插入文档。
import pymongo
# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")
# 获取mycollection集合
mydb = client["mydatabase"]
mycol = mydb["mycollection"]
# 插入一条文档
mydict = { "name": "John", "address": "Highway 37" }
x = mycol.insert_one(mydict)
查询文档
要查询集合中的文档,可以使用MongoDB的db.collection.find()
方法。在Python中,可以使用pymongo
库中的Collection
类的find()
方法来查询文档。
import pymongo
# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")
# 获取mycollection集合
mydb = client["mydatabase"]
mycol = mydb["mycollection"]
# 查询所有文档
for x in mycol.find():
print(x)
更新文档
要更新集合中的文档,可以使用MongoDB的db.collection.update()
方法。在Python中,可以使用pymongo
库中的Collection
类的update_one()
方法来更新文档。
import pymongo
# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")
# 获取mycollection集合
mydb = client["mydatabase"]
mycol = mydb["mycollection"]
# 更新一条文档
myquery = { "address": "Highway 37" }
newvalues = { "$set": { "address": "Park Lane 38" } }
mycol.update_one(myquery, newvalues)
删除文档
要删除集合中的文档,可以使用MongoDB的db.collection.remove()
方法。在Python中,可以使用pymongo
库中的Collection
类的delete_one()
方法来删除文档。
import pymongo
# 连接MongoDB数据库
client = pymongo.MongoClient("mongodb://localhost:27017/")
# 获取mycollection集合
mydb = client["mydatabase"]
mycol = mydb["mycollection"]
# 删除一条文档
myquery = { "address": "Park Lane 38" }
mycol.delete_one(myquery)
四丶数据类型
MongoDB数据库支持以下数据类型:
-
String(字符串):存储文本数据,最常用的数据类型。
-
Integer(整型):存储整数。
-
Boolean(布尔型):存储布尔值(true/false)。
-
Double(双精度浮点型):存储浮点数。
-
Min/Max keys(最小值/最大值):用于比较值的最小值和最大值。
-
Arrays(数组):用于存储数组或列表。
-
Timestamp(时间戳):记录文档修改或添加的时间。
-
Object(对象):用于嵌入式文档。
-
Null(空值):用于表示空值或不存在的字段。
-
Symbol(符号):类似于字符串,但是用于特定的上下文环境。
-
Date(日期):用于存储日期和时间。
-
Object ID(对象ID):用于唯一标识文档。
-
Binary data(二进制数据):用于存储二进制数据,如图片、音频等。
-
Code(代码):用于存储JavaScript代码。
-
Regular expression(正则表达式):用于存储正则表达式。
五丶数据操作
Python中操作MongoDB数据库的方式有多种,可以使用官方提供的pymongo
库,也可以使用第三方库mongoengine
等。
以下是pymongo
库的基本数据操作:
连接数据库
import pymongo
client = pymongo.MongoClient('mongodb://localhost:27017/')
db = client['testdb']
插入数据
collection = db['testcollection']
data = {'name': 'Tom', 'age': 18}
collection.insert_one(data)
查询数据
# 查询所有数据
result = collection.find()
for item in result:
print(item)
# 查询指定条件的数据
result = collection.find({'name': 'Tom'})
for item in result:
print(item)
更新数据
# 更新一条数据
collection.update_one({'name': 'Tom'}, {'$set': {'age': 20}})
# 更新多条数据
collection.update_many({'name': 'Tom'}, {'$set': {'age': 20}})
删除数据
# 删除一条数据
collection.delete_one({'name': 'Tom'})
# 删除多条数据
collection.delete_many({'name': 'Tom'})
聚合操作
# 统计数据总数
count = collection.count_documents({})
# 按条件分组统计
result = collection.aggregate([
{'$group': {'_id': '$name', 'count': {'$sum': 1}}}
])
for item in result:
print(item)
以上是pymongo
库的基本数据操作,其他库的操作方式也类似
六丶数据的备份与恢复
Python中备份和恢复MongoDB数据库可以使用mongodump
和mongorestore
命令,也可以使用pymongo
库中的函数进行操作。
使用mongodump
和mongorestore
命令备份和恢复MongoDB数据库
备份MongoDB数据库:
mongodump --host --port --db --out
其中,是MongoDB服务器的IP地址或主机名,是MongoDB服务器的端口号,默认为27017,是要备份的数据库名称,是备份文件存放的目录。
恢复MongoDB数据库:
mongorestore --host --port --db
其中,、、和的含义与备份命令相同。
使用pymongo
库备份和恢复MongoDB数据库
备份MongoDB数据库:
import pymongo
import datetime
client = pymongo.MongoClient("")
db = client[""]
collection = db[""]
backup = collection.find()
with open("", "w") as f:
for doc in backup:
f.write(str(doc) + "n")
其中,是MongoDB服务器的URI,和是要备份的数据库和集合名称,是备份文件的路径。
恢复MongoDB数据库:
import pymongo
client = pymongo.MongoClient("")
db = client[""]
collection = db[""]
with open("", "r") as f:
for line in f:
doc = eval(line.strip())
collection.insert_one(doc)
其中,、、和的含义与备份命令相同。注意,这种方法只适用于备份和恢复小型数据库,对于大型数据库,建议使用mongodump
和mongorestore
命令进行操作。
七丶聚合操作
MongoDB的聚合操作是指将多个文档进行分组、筛选、排序、计算等操作,以生成新的文档集合的过程。Python中可以使用pymongo库来进行MongoDB的聚合操作。
以下是一个简单的聚合操作示例,假设我们有一个名为students的集合,其中包含每个学生的姓名、年龄和成绩:
from pymongo import MongoClient
client = MongoClient()
db = client['test']
collection = db['students']
pipeline = [
{"$group": {"_id": "$age", "avg_score": {"$avg": "$score"}}},
{"$sort": {"_id": 1}}
]
result = collection.aggregate(pipeline)
for doc in result:
print(doc)
上述代码中,我们使用了MongoDB的group和group和avg操作符来计算每个年龄段的平均成绩,并使用$sort操作符按年龄升序排序。最终的结果将会是一个包含每个年龄段平均成绩的文档集合。
除了group和group和avg操作符外,MongoDB还提供了许多其他的聚合操作符,如match、match、project、sort、sort、limit等,可以根据具体需求进行组合使用。
八丶索引
MongoDB中的索引是用于提高查询性能的一种数据结构。在MongoDB中,可以使用多种类型的索引,包括单字段索引、复合索引、全文索引等。
以下是使用Python操作MongoDB索引的示例:
创建单字段索引
from pymongo import MongoClient
client = MongoClient()
db = client.test_database
collection = db.test_collection
# 创建单字段索引
collection.create_index("name")
# 查询是否创建成功
print(collection.index_information())
创建复合索引
from pymongo import MongoClient
client = MongoClient()
db = client.test_database
collection = db.test_collection
# 创建复合索引
collection.create_index([("name", 1), ("age", -1)])
# 查询是否创建成功
print(collection.index_information())
创建全文索引
from pymongo import MongoClient
client = MongoClient()
db = client.test_database
collection = db.test_collection
# 创建全文索引
collection.create_index([("content", "text")])
# 查询是否创建成功
print(collection.index_information())
查询使用索引
from pymongo import MongoClient
client = MongoClient()
db = client.test_database
collection = db.test_collection
# 查询使用索引
result = collection.find({"name": "Tom"}).explain()["executionStats"]
print(result)
以上是Python操作MongoDB索引的示例,可以根据实际需求选择不同类型的索引来提高查询性能。
九丶pymongo的操作
Python中操作MongoDB数据库需要使用pymongo
库,以下是pymongo
库的常用操作:
连接MongoDB数据库
import pymongo
client = pymongo.MongoClient('mongodb://localhost:27017/')
选择数据库
db = client['database_name']
选择集合
collection = db['collection_name']
插入文档
data = {'name': 'John', 'age': 25}
collection.insert_one(data)
查询文档
result = collection.find_one({'name': 'John'})
更新文档
collection.update_one({'name': 'John'}, {'$set': {'age': 30}})
删除文档
collection.delete_one({'name': 'John'})
查询多个文档
results = collection.find({'age': {'$gt': 20}})
for result in results:
print(result)
以上是pymongo
库的常用操作,可以根据实际需求进行调用。
本系列文根据以下学习路线展开讲述,由于内容较多,:
从零开始学python到高级进阶路线图
关注公众号:python技术训练营,学习进阶一步到位
适用于零基础学习和进阶人群的python资源:
① 腾讯认证python完整项目实战教程笔记PDF
② 十几个大厂python面试专题PDF
③ python全套视频教程(零基础-高级进阶JS逆向)
④ 百个项目实战+源码+笔记
⑤ 编程语法-机器学习-全栈开发-数据分析-爬虫-APP逆向等全套项目+文档
⑥ 交流学习
⑦ 想要兼职接单
下章讲:机器学习模块