如何使用Python下载微信聊天表情包

2024年 1月 15日 51.1k 0

实现的功能

只要有人给你发了表情包,不管是群聊还是个人发的,都将它保存到本地。

也许某天斗图的时候就能用到,不过即使有了表情包,还需要一个检索功能,不然这一张一张看也太费眼睛了。

检索表情包

检索表情包的功能实现比较麻烦,至少需要两个模型:ocr和图片描述生成,如果更复杂点的话还需要分词算法、数据库等。

需要ocr应该很容易理解,表情包里面包含文字信息,使用ocr将文字提取出来,这个文字基本就可以作为检索的信息了。

如果表情没有文字,那只能使用一些模型,为图片生成一个简单的描述,然后将这个描述作为检索的信息。

搜了一下目前开源的模型里面没看到比较合适的。后面如果遇到了再做一个简单的表情包检索程序。

开始实现

效果图

图片[1]-如何使用Python下载微信聊天表情包-不念博客

github代码

https://github.com/kanadeblisst00/WeChat-PyRobot
http://www.pygrower.cn:21180/kanadeblisst/WeChat-PyRobot

实现原理

使用Python来监听微信消息,如果收到表情包消息就提取里面的链接并下载,因为表情包xml消息里有一个未加密的链接。

代码在基础上做了如下优化:

  • 使用队列存储监听到的消息
  • 支持加载消息插件来处理消息
  • 支持注入后就自动监听消息
  • 待实现插件列表

    • 监听群聊中的群二维码
    • 监听并实时采集关注的公众号文章
    • 自动下载并解密聊天中的图片
    • chatgpt自动回复
    • 群消息关键词提醒
    • 消息保存到数据库,如sqlite、postgresql等
    • 自动接收转账
    • 监听收款信息对接发卡平台,目前可以用v免签+独角数卡

    开始监听并下载表情包

    准备工作

  • 安装支持的版本微信(目前只写了3.9.8.123.9.8.15的代码)
  • 安装32位或64位Python(取决于你安装的微信是32位还是64位),Python版本需大于等于3.8
  • pip install wechat_pyrobot==1.1.1
  • 如果国内源还没有同步最新版本,可以指定-i https://pypi.org/simple/选项使用pip官方库

    开始监听消息

    先启动并登录微信,随便创建一个文件夹,然后创建一个文件main.py(名称随意)写入以下代码:

    from py_process_hooker import inject_python_and_monitor_dir
    from wechat_pyrobot import get_on_startup
    from wechat_pyrobot.msg_plugins import PrintMsg, DownLoadEmotion
    
    
    if __name__ == "__main__":
        process_name = "WeChat.exe"
        open_console = True
        on_startup = get_on_startup(msg_plugins=[PrintMsg, DownLoadEmotion])
        
        inject_python_and_monitor_dir(process_name, __file__, open_console=open_console, on_startup=on_startup)
    

    使用Python运行这段代码,就会将Python注入到微信,并且开始监听微信收到的消息,然后将监听到的消息依次传递给msg_plugins指定的插件列表。

    DownLoadEmotion插件就是用来下载表情包的,里面的代码很简单:

    class DownLoadEmotion(MsgPluginTemplate):
        def __init__(self, **kwargs) -> None:
            self.name = os.path.basename(__file__)[:-3]
            super().__init__(**kwargs)
            self.emotion_save_path = os.path.join(kwargs["pwd"], "emotion")
            os.makedirs(self.emotion_save_path, exist_ok=True)
    
        def deal_msg(self, msg_dict):
            if msg_dict["msg_type"] != 0x2F:
                return
            xml = msg_dict["content"]
            root = ET.fromstring(xml) 
            datas = dict(root.find('.//emoji').items())
            cdnurl = datas["cdnurl"].replace('&', '&')
            filename = msg_dict["file_path"]
            if not filename:
                filename = msg_dict["msgid"]
            save_path = f"{self.emotion_save_path}{os.sep}{filename}.gif"
            with open(save_path, 'wb') as f:
                f.write(self.download_file(cdnurl))
        
        def download_file(self, url, retry=0):
            if retry > 2:
                return
            headers = {
                "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36 Edg/115.0.1901.183"
            }
            try:
                resp = requests.get(url, headers=headers, timeout=6)
            except:
                traceback.print_exc()
                time.sleep(2)
                return self.download_file(url, retry+1)
            return resp.content

    先判断一下消息类型是不是0x2F,也就是表情包的消息类型,然后提取xml数据里的cdnurl,用requests下载下来保存到本地

    编写自己的插件

    可以先参考目前已有的插件例子,代码在wechat_pyrobot/msg_plugins, 在github或者pip本地目录都可以看到

    编写一个消息保存到文件的插件

    插件需要继承MsgPluginTemplate,然后实现deal_msg方法,方法只有一个参数:字典类型的消息

    import os
    import json
    from wechat_pyrobot.plugin_class import MsgPluginTemplate
    
    
    class SaveToFile(MsgPluginTemplate):
        def __init__(self, **kwargs) -> None:
            self.name = os.path.basename(__file__)[:-3]
            super().__init__(**kwargs)
            # kwargs["pwd"]是main.py所在路径
            self.msg_save_path = os.path.join(kwargs["pwd"], "msg_save_path")
            os.makedirs(self.msg_save_path, exist_ok=True)
        
        def deal_msg(self, msg_dict):
            path = os.path.join(self.msg_save_path, f'{msg_dict["msgid"]}.json')
            with open(path, 'w', encoding='utf-8') as f:
                f.write(json.dumps(msg_dict)) 

    然后在注入的代码(main.py)里加载它,需要重新启动并注入微信

    from py_process_hooker import inject_python_and_monitor_dir
    from wechat_pyrobot import get_on_startup
    from wechat_pyrobot.msg_plugins import PrintMsg, DownLoadEmotion
    from my_msg_plugin.save_to_file import SaveToFile
    
    if __name__ == "__main__":
        process_name = "WeChat.exe"
        open_console = True
        on_startup = get_on_startup(msg_plugins=[PrintMsg, DownLoadEmotion, SaveToFile])
        
        inject_python_and_monitor_dir(process_name, __file__, open_console=open_console, on_startup=on_startup)

    这样收到的消息都会保存到文件,当然这个只是示例。实际应该按时间来分类文件,或者保存到数据库中。

    插件列表是有顺序的,在执行时会依次执行,如果之前的插件修改了消息字典,那么之后的插件得到的消息字典就是修改后的

    相关文章

    JavaScript2024新功能:Object.groupBy、正则表达式v标志
    PHP trim 函数对多字节字符的使用和限制
    新函数 json_validate() 、randomizer 类扩展…20 个PHP 8.3 新特性全面解析
    使用HTMX为WordPress增效:如何在不使用复杂框架的情况下增强平台功能
    为React 19做准备:WordPress 6.6用户指南
    如何删除WordPress中的所有评论

    发布评论