以下是国内一些著名的开源大模型及其下载地址和主要优势:

1. 零一万物(Yi系列)

  • 代表模型:Yi-1.5(6B/9B/34B)、Yi-34B-Chat

  • 下载地址Hugging Face

  • 优势

    • 在中文理解、推理和代码能力上表现卓越,部分评测超越GPT-47

    • 支持Apache 2.0开源协议,允许商用7

    • 34B版本在AlpacaEval排行榜上位列第二,仅次于GPT-4 Turbo1

2. 阿里通义千问(Qwen系列)

  • 代表模型:Qwen3(72B)、Qwen-Agent框架

  • 下载地址GitHub

  • 优势

    • 支持119种语言,涵盖多模态、数学、代码等领域3

    • 在OpenCompass等基准测试中表现优异,成为全球最强开源模型之一3

    • 提供轻量化版本,可在消费级显卡上运行8

3. DeepSeek(深度求索)

  • 代表模型:DeepSeek-R1(660B)、DeepSeek-R1-Zero

  • 下载地址DeepSeek官网

  • 优势

    • 采用混合专家(MoE)架构,推理成本极低,性能接近OpenAI O18

    • 强化学习优化,在数学、代码任务上表现突出3

    • 提供蒸馏小模型(32B/70B),适合轻量化部署2

4. MiniMax

  • 代表模型:MiniMax-Text-01(4560亿参数)、MiniMax-VL-01(视觉多模态)

  • 下载地址Hugging Face

  • 优势

    • 支持超长上下文(400万token),远超GPT-4o和Claude-3.52

    • 视觉多模态模型在OCR、视频理解方面表现优异5

5. 腾讯混元

  • 代表模型:混元3D生成大模型2.0

  • 下载地址腾讯混元开源社区

  • 优势

    • 支持文生3D、图生3D,几何结构和纹理质量优于行业标准3

    • 提供低门槛3D AI创作引擎,适用于游戏、设计等行业2

6. 阶跃星辰

  • 代表模型:Step-Video-T2V(300亿参数)、Step-Audio语音模型

  • 下载地址GitHub

  • 优势

    • 全球参数量最大的开源视频生成模型3

    • 语音模型支持自然对话合成,适用于智能语音助手3

7. 智谱AI(ChatGLM)

  • 代表模型:ChatGLM3、CodeGeeX(代码生成)、CogVLM(多模态)

  • 下载地址GitHub

  • 优势

    • 最早布局中文开源生态,优化中文对话体验3

    • CodeGeeX在代码生成任务上表现优秀3

8. OpenBMB(MiniCPM-V2.6)

  • 代表模型:MiniCPM-V2.6(80亿参数)

  • 下载地址GitHub

  • 优势

    • 在单图像、多图像和视频理解上超越GPT-4V5

    • 支持iPad等端侧设备实时推理,内存占用极低5

9. 商汤科技

  • 代表模型:LazyLLM(开源Agent框架)

  • 下载地址GitHub

  • 优势

    • 模块化设计,支持快速拼接意图识别、知识库检索等功能3

10. 百川智能

  • 代表模型:Baichuan-7B

  • 下载地址GitHub

  • 优势

    • 支持中英双语,在C-Eval/MMLU基准测试中表现优异9

这些模型覆盖了语言、多模态、3D生成等多个领域,适用于不同的应用场景。如需更详细的技术参数或评测数据,可访问相应的GitHub或Hugging Face页面。

更多

已搜索到 46 个网页

以下是国内更多著名的开源大模型及其主要特点、下载地址和优势:


1. 零一万物(Yi系列)

  • 代表模型:Yi-34B、Yi-1.5(6B/9B/34B)

  • 下载地址Hugging Face | GitHub

  • 优势

    • 支持 200K 超长上下文(约40万汉字),适合处理长文档(如法律、金融领域)10

    • 在 C-Eval、MMLU 等评测中超越LLaMA2-70B、Falcon-180B等国际大模型10

    • Apache 2.0 协议,可免费商用。


2. 阿里通义千问(Qwen系列)

  • 代表模型:Qwen3(72B)、Qwen-Agent(多模态框架)

  • 下载地址GitHub

  • 优势

    • 支持 119种语言,涵盖文本、代码、数学、多模态任务2

    • 在 OpenCompass 评测中位列全球开源模型前列2

    • 提供 轻量化版本,可在消费级GPU运行。


3. DeepSeek(深度求索)

  • 代表模型:DeepSeek-R1(660B)、DeepSeek-R1-70B(蒸馏版)

  • 下载地址DeepSeek官网 | OpenBayes部署教程

  • 优势

    • 采用 强化学习优化推理能力,在数学、代码任务表现突出1

    • 提供 蒸馏小模型(32B/70B),适合轻量化部署5


4. MiniMax(稀宇科技)

  • 代表模型:MiniMax-Text-01(4560亿参数)、MiniMax-VL-01(视觉多模态)

  • 下载地址Hugging Face

  • 优势

    • 400万token超长上下文,远超GPT-4o(32倍)19

    • 采用 线性注意力机制,突破传统Transformer架构瓶颈9


5. 腾讯混元(3D生成大模型)

  • 代表模型:混元3D-2.0

  • 下载地址GitHub

  • 优势

    • 支持文生3D、图生3D,几何结构精细,纹理质量高1

    • 在 CMMD、FID、CLIP-score 评测中优于闭源模型1


6. 阶跃星辰(Step系列)

  • 代表模型:Step-Video-T2V(300亿参数)、Step-Audio(语音合成)

  • 下载地址GitHub

  • 优势

    • 全球最大开源视频生成模型,支持高分辨率视频生成2

    • 与 吉利汽车 合作,适用于智能座舱、自动驾驶场景2


7. 智谱AI(ChatGLM系列)

  • 代表模型:ChatGLM3、CodeGeeX(代码生成)、CogVLM(多模态)

  • 下载地址GitHub

  • 优势

    • 最早布局中文开源生态,优化中文对话体验2

    • CodeGeeX 在代码生成任务上表现优秀2


8. 商汤科技(LazyLLM)

  • 代表模型:LazyLLM(开源Agent框架)

  • 下载地址GitHub

  • 优势

    • 模块化设计,支持快速拼接意图识别、知识库检索等功能2


9. 昆仑万维(Skywork-13B)

  • 代表模型:Skywork-13B-Base、Skywork-13B-Math

  • 下载地址ModelScope | GitHub

  • 优势

    • 无需申请即可商用,附带 600G中文数据集(1500亿tokens)8

    • 数学能力强化,在GSM8K评测中领先8


10. 百川智能(Baichuan系列)

  • 代表模型:Baichuan-7B

  • 下载地址GitHub

  • 优势

    • 中英双语优化,在C-Eval/MMLU评测表现优异2