ChatGPT 近期以强大的对话和信息整合能力风靡全网。起初,她并没有引起我很大的兴趣。我认为这不过又是互联网公司寻求新的经济增长点的风口而已。
就像几年前的 区块链 ,大大小小的公司趋之若鹜,记得我当时的老东家也推出一款去中心化的 APP,用于存储自己的基因数据。现在已经没有人谈及区块链技术了。
就像最近 1-2 年的 元宇宙 ,据说甚至有学校成立了元宇宙学院,自从扎克伯格晒出一个简陋无比的元宇宙照片之后,简直是将元宇宙的破烂底裤展示在世人面前。如今,元宇宙成了个笑话。
基于我浅薄的认知,我并没有过多关注 ChatGPT 。直到今天的一些私人原因,我才开始正式了解她。
ChatGPT 是什么
ChatGPT 的全称是 Chat Generative Pre-trained Transformer 。我的理解她是一个基于 Transformer 模型 由预训练数据生成对话信息的应用。(PS:Transformer 模型,是谷歌在 2017 年推出的 NLP 经典模型)
由她的名字,我猜测,ChatGPT 并不是在全网实时搜索最佳答案,而是根据预先训练的数据,实时拼凑出一个答案。这个答案可能并不一定是正确的,但不管你信不信,反正 ChatGPT 自己是相信这个答案的。
ChatGPT 的前世今生
3分钟教你用Python搭建ChatGPT-1.png
我们所说的 ChatGPT 其实是基于 GPT-3.5 模型 开发得到的。截至目前,OpenAI 公司并没有开放 GPT-3.5 的接口。因此我们只能通过 OpenAI 的官方网站 https://chat.openai.com/ 来访问 ChatGPT。(https://ai.com 这个地址是 OpenAI 花重金购买的,同样可以跳转到 ChatGPT 官网)
现在网上出现的一些 ChatGPT 中文版,ChatGPT 微信版等等都是基于 2020 年的 GPT-3 模型 开发而来。虽然和基于GPT-3.5 模型演化而来的 ChatGPT 没法比。但是同样能带我们体验人工智能的美妙。
而我们今天要搭建的 ChatGPT 同样是基于GPT-3 模型开发。
用 Python 搭建 ChatGPT
获取 OpenAI API Key
由我的另一篇博客 超详细注册 OpenAI 接口账号的教程 获取 OpenAI API Key 。
3分钟教你用Python搭建ChatGPT-2.png
安装 openai 模块
使用如下代码安装 openai 模块。
pip install openai
调用接口获取返回信息
代码
调用 openai.Completion.create 函数获取返回信息。
import os
import openai
# 填写注册OpenAI接口账号时获取的 OpenAI API Key
openai.api_key = os.getenv("OPENAI_API_KEY")
# 提问
issue = '你是谁?'
# 访问OpenAI接口
response = openai.Completion.create(
model='text-davinci-003',
prompt=issue,
temperature=0.9,
max_tokens=150,
top_p=1,
frequency_penalty=0.0,
presence_penalty=0.6
)
# 返回信息
resText = response.choices[0].text
print(resText)
参数
- model:使用的模型,可选内容如下:
3分钟教你用Python搭建ChatGPT-3.png
- prompt:提问,提问描述越详细,回答越准确
- temperature:控制结果的随机性,如果希望结果更有差异性 0.9,或者希望有固定结果可以尝试 0.0
- max_tokens:生成结果时的最大 tokens 数。平均一个汉字是 2 个 tokens,text-davinci-003 最多是 4000 个 tokens,也就是 2000 个汉字左右
- top_p:一个可用于代替 temperature 的参数,对应机器学习中 nucleus sampling,如果设置 0.1 意味着只考虑构成前 10% 概率质量的 tokens
- frequency_penalty:控制字符的重复度,取值为 -2.0 ~ 2.0 之间的数字
- presence_penalty:控制主题的重复度,取值为 -2.0 ~ 2.0 之间的数字
测试 ChatGPT
3分钟教你用Python搭建ChatGPT-4.png3分钟教你用Python搭建ChatGPT-5.png3分钟教你用Python搭建ChatGPT-6.png
别的不敢评价,就是这个最后用 python 写冒泡排序,我给打 99 分。代码最后莫名其妙多出一个逗号,原以为这代码肯定会报错,谁知道测试了下可以正常运行,运行结果也是对的。后来查了一下资料,原来 print()后面加上逗号可以让回车符失效,ChatGPT 是故意这么做的,这是我不知道的知识点。给她扣掉一分,是因为这代码空格和回车有点太随意了,并不是特别工整。
最后
免费的 API 接口是有额度限制的。每个账号有 18 美元 的免费额度,限期 3 个月 。 不同的模式计费不同,text-davinci-003 这个模式大约每 1000 个 tokens 扣费 0.02 美元。
除此以外,OpenAI 的接口还有如下功能,静待你的挖掘。