以下是国内一些著名的开源大模型及其下载地址和主要优势:
1. 零一万物(Yi系列)
-
代表模型:Yi-1.5(6B/9B/34B)、Yi-34B-Chat
-
下载地址:Hugging Face
-
优势:
-
在中文理解、推理和代码能力上表现卓越,部分评测超越GPT-47。
-
支持Apache 2.0开源协议,允许商用7。
-
34B版本在AlpacaEval排行榜上位列第二,仅次于GPT-4 Turbo1。
-
2. 阿里通义千问(Qwen系列)
-
代表模型:Qwen3(72B)、Qwen-Agent框架
-
下载地址:GitHub
-
优势:
-
支持119种语言,涵盖多模态、数学、代码等领域3。
-
在OpenCompass等基准测试中表现优异,成为全球最强开源模型之一3。
-
提供轻量化版本,可在消费级显卡上运行8。
-
3. DeepSeek(深度求索)
-
代表模型:DeepSeek-R1(660B)、DeepSeek-R1-Zero
-
下载地址:DeepSeek官网
-
优势:
-
采用混合专家(MoE)架构,推理成本极低,性能接近OpenAI O18。
-
强化学习优化,在数学、代码任务上表现突出3。
-
提供蒸馏小模型(32B/70B),适合轻量化部署2。
-
4. MiniMax
-
代表模型:MiniMax-Text-01(4560亿参数)、MiniMax-VL-01(视觉多模态)
-
下载地址:Hugging Face
-
优势:
-
支持超长上下文(400万token),远超GPT-4o和Claude-3.52。
-
视觉多模态模型在OCR、视频理解方面表现优异5。
-
5. 腾讯混元
-
代表模型:混元3D生成大模型2.0
-
下载地址:腾讯混元开源社区
-
优势:
-
支持文生3D、图生3D,几何结构和纹理质量优于行业标准3。
-
提供低门槛3D AI创作引擎,适用于游戏、设计等行业2。
-
6. 阶跃星辰
-
代表模型:Step-Video-T2V(300亿参数)、Step-Audio语音模型
-
下载地址:GitHub
-
优势:
-
全球参数量最大的开源视频生成模型3。
-
语音模型支持自然对话合成,适用于智能语音助手3。
-
7. 智谱AI(ChatGLM)
-
代表模型:ChatGLM3、CodeGeeX(代码生成)、CogVLM(多模态)
-
下载地址:GitHub
-
优势:
-
最早布局中文开源生态,优化中文对话体验3。
-
CodeGeeX在代码生成任务上表现优秀3。
-
8. OpenBMB(MiniCPM-V2.6)
-
代表模型:MiniCPM-V2.6(80亿参数)
-
下载地址:GitHub
-
优势:
-
在单图像、多图像和视频理解上超越GPT-4V5。
-
支持iPad等端侧设备实时推理,内存占用极低5。
-
9. 商汤科技
-
代表模型:LazyLLM(开源Agent框架)
-
下载地址:GitHub
-
优势:
-
模块化设计,支持快速拼接意图识别、知识库检索等功能3。
-
10. 百川智能
-
代表模型:Baichuan-7B
-
下载地址:GitHub
-
优势:
-
支持中英双语,在C-Eval/MMLU基准测试中表现优异9。
-
这些模型覆盖了语言、多模态、3D生成等多个领域,适用于不同的应用场景。如需更详细的技术参数或评测数据,可访问相应的GitHub或Hugging Face页面。
已搜索到 46 个网页
以下是国内更多著名的开源大模型及其主要特点、下载地址和优势:
1. 零一万物(Yi系列)
-
代表模型:Yi-34B、Yi-1.5(6B/9B/34B)
-
下载地址:Hugging Face | GitHub
-
优势:
-
支持 200K 超长上下文(约40万汉字),适合处理长文档(如法律、金融领域)10。
-
在 C-Eval、MMLU 等评测中超越LLaMA2-70B、Falcon-180B等国际大模型10。
-
Apache 2.0 协议,可免费商用。
-
2. 阿里通义千问(Qwen系列)
-
代表模型:Qwen3(72B)、Qwen-Agent(多模态框架)
-
下载地址:GitHub
-
优势:
-
支持 119种语言,涵盖文本、代码、数学、多模态任务2。
-
在 OpenCompass 评测中位列全球开源模型前列2。
-
提供 轻量化版本,可在消费级GPU运行。
-
3. DeepSeek(深度求索)
-
代表模型:DeepSeek-R1(660B)、DeepSeek-R1-70B(蒸馏版)
-
下载地址:DeepSeek官网 | OpenBayes部署教程
-
优势:
-
采用 强化学习优化推理能力,在数学、代码任务表现突出1。
-
提供 蒸馏小模型(32B/70B),适合轻量化部署5。
-
4. MiniMax(稀宇科技)
-
代表模型:MiniMax-Text-01(4560亿参数)、MiniMax-VL-01(视觉多模态)
-
下载地址:Hugging Face
-
优势:
-
400万token超长上下文,远超GPT-4o(32倍)19。
-
采用 线性注意力机制,突破传统Transformer架构瓶颈9。
-
5. 腾讯混元(3D生成大模型)
-
代表模型:混元3D-2.0
-
下载地址:GitHub
-
优势:
-
支持文生3D、图生3D,几何结构精细,纹理质量高1。
-
在 CMMD、FID、CLIP-score 评测中优于闭源模型1。
-
6. 阶跃星辰(Step系列)
-
代表模型:Step-Video-T2V(300亿参数)、Step-Audio(语音合成)
-
下载地址:GitHub
-
优势:
-
全球最大开源视频生成模型,支持高分辨率视频生成2。
-
与 吉利汽车 合作,适用于智能座舱、自动驾驶场景2。
-
7. 智谱AI(ChatGLM系列)
-
代表模型:ChatGLM3、CodeGeeX(代码生成)、CogVLM(多模态)
-
下载地址:GitHub
-
优势:
-
最早布局中文开源生态,优化中文对话体验2。
-
CodeGeeX 在代码生成任务上表现优秀2。
-
8. 商汤科技(LazyLLM)
-
代表模型:LazyLLM(开源Agent框架)
-
下载地址:GitHub
-
优势:
-
模块化设计,支持快速拼接意图识别、知识库检索等功能2。
-
9. 昆仑万维(Skywork-13B)
-
代表模型:Skywork-13B-Base、Skywork-13B-Math
-
下载地址:ModelScope | GitHub
-
优势:
-
无需申请即可商用,附带 600G中文数据集(1500亿tokens)8。
-
数学能力强化,在GSM8K评测中领先8。
-
10. 百川智能(Baichuan系列)
-
代表模型:Baichuan-7B
-
下载地址:GitHub
-
优势:
-
中英双语优化,在C-Eval/MMLU评测表现优异2。
-