面壁智能开源端侧多模态大模型:MiniCPMLlama3V 2.5

2024年 5月 21日 115.0k 0

面壁智能开源了端侧多模态模型 MiniCPM-Llama3-V 2.5,且支持 30+ 多种语言。

MiniCPM-Llama3-V 2.5 是 MiniCPM-V系列的最新、性能最佳模型。总参数量8B,多模态综合性能超越 GPT-4V-1106、Gemini Pro、Claude 3、Qwen-VL-Max 等商用闭源模型,OCR 能力及指令跟随能力进一步提升——精准识别难图长图长文本,并支持超过30种语言的多模态交互。

通过系统使用模型量化、CPU、NPU、编译优化等高效推理技术,MiniCPM-Llama3-V 2.5 可以实现高效的终端设备部署。

官方称 MiniCPM-Llama3-V 2.5 实现了「以最小参数,撬动最强性能」的最佳平衡点。

面壁智能开源端侧多模态大模型:MiniCPM-Llama3-V 2.5-1

运行示例

面壁智能开源端侧多模态大模型:MiniCPM-Llama3-V 2.5-2

➤  MiniCPM-Llama3-V 2.5 开源地址:https://github.com/OpenBMB/MiniCPM-V
➤ Hugging Face下载地址:https://huggingface.co/openbmb/MiniCPM-Llama3-V-2_5

相关文章

塑造我成为 CTO 之路的“秘诀”
“人工智能教母”的公司估值达 10 亿美金
教授吐槽:985 高校成高级蓝翔!研究生基本废了,只为房子、票子……
Windows 蓝屏中断提醒开发者:Rust 比 C/C++ 更好
Claude 3.5 Sonnet 在伽利略幻觉指数中名列前茅
上海新增 11 款已完成登记生成式 AI 服务

发布评论