2月1日,面壁智能举办新品发布会,推出了最新的旗舰级多模态大模型“面壁MiniCPM”,参数规模为20亿,使用了1TB精选数据进行训练。
面壁智能CEO李大海在发布会上表示,MiniCPM-2B在多项主流评测榜单、中英文平均成绩均超越了开源的Mistral-7B,英文榜单的平均分甚至超越了Falcon-40B、MPT-30B等百亿参数模型。
所谓“端侧大模型”,即模型服务部署在手机、电脑、IoT设备等本地终端,直接由终端芯片完成推理过程,无需联网。作为一款端侧大模型,MiniCPM 声称“跑通国际主流手机品牌与终端 CPU 芯片,老手机也无压力”,但从吞吐量来看,实际表现或许有待提升。
开源地址(内含技术报告):
- MiniCPM GitHub:https://github.com/OpenBMB/MiniCPM
- OmniLMM GitHub:https://github.com/OpenBMB/OmniLMM