元象今日发布多模态大模型 XVERSE-V,支持任意宽高比图像输入,具备不同场景下的理解能力,能够处理信息图、文献、现实场景、数理题目、科学文献、代码转化等不同需求。
据介绍,XVERSE-V在多项权威多模态评测中超过零一万物Yi-VL-34B、面壁智能OmniLMM-12B及深度求索DeepSeek-VL-7B等开源模型,在综合能力测评MMBench中超过了谷歌GeminiProVision、阿里Qwen-VL-Plus和Claude-3V Sonnet等知名闭源模型。
该模型全开源,无条件免费商用。下载地址
Hugging Face:https://huggingface.co/xverse/XVERSE-V-13B
ModelScope魔搭:https://modelscope.cn/models/xverse/XVERSE-V-13B
Github:https://github.com/xverse-ai/XVERSE-V-13B