【开源自荐】MoE-LLaVA：北大ChatLaw团队开源多模态稀疏MoE大模型！ #405

LinB203 · 2024-02-01T14:24:32Z

项目名称：

MoE-LLaVA：大型视觉语言模型的混合专家模型

项目地址：

Github: https://github.com/PKU-YuanGroup/MoE-LLaVA
Paper: https://arxiv.org/abs/2401.15947
Demo: https://huggingface.co/spaces/LanguageBind/MoE-LLaVA

项目简介 (100 字以内)：

MoE-LLaVA只有3B个稀疏激活参数，表现与LLaVA-1.5-7B在各种视觉理解数据集上相当，并且在物体幻觉基准测试中甚至超越了LLaVA-1.5-13B。通过MoE-LLaVA，我们旨在建立稀疏LVLMs的基准，并为未来研究开发更高效和有效的多模态学习系统提供宝贵的见解。并且MoE-LLaVA团队已经开放了所有的数据、代码和模型。

项目截图 (6张以内)：

20240126_205845.mp4

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

【开源自荐】MoE-LLaVA：北大ChatLaw团队开源多模态稀疏MoE大模型！ #405

【开源自荐】MoE-LLaVA：北大ChatLaw团队开源多模态稀疏MoE大模型！ #405

LinB203 commented Feb 1, 2024

【开源自荐】MoE-LLaVA：北大ChatLaw团队开源多模态稀疏MoE大模型！ #405

【开源自荐】MoE-LLaVA：北大ChatLaw团队开源多模态稀疏MoE大模型！ #405

Comments

LinB203 commented Feb 1, 2024