面壁智能发布端侧大模型“面壁MiniCPM”

2024年 2月 3日 66.3k 0

2月1日,面壁智能举办新品发布会,推出了最新的旗舰级多模态大模型“面壁MiniCPM”,参数规模为20亿,使用了1TB精选数据进行训练。

面壁智能CEO李大海在发布会上表示,MiniCPM-2B在多项主流评测榜单、中英文平均成绩均超越了开源的Mistral-7B,英文榜单的平均分甚至超越了Falcon-40B、MPT-30B等百亿参数模型。

所谓“端侧大模型”,即模型服务部署在手机、电脑、IoT设备等本地终端,直接由终端芯片完成推理过程,无需联网。作为一款端侧大模型,MiniCPM 声称“跑通国际主流手机品牌与终端 CPU 芯片,老手机也无压力”,但从吞吐量来看,实际表现或许有待提升。

开源地址(内含技术报告):

  • MiniCPM GitHub:https://github.com/OpenBMB/MiniCPM
  • OmniLMM GitHub:https://github.com/OpenBMB/OmniLMM

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论