大模型通常指参数量达数十亿至万亿级的深度学习模型,核心以 Transformer 架构为基础,靠海量数据预训练获得通用能力与 “涌现” 特性,已从大语言模型(LLM)扩展至多模态,是当前 AI 通用智能的核心载体。
主流分类与代表模型
大语言模型(LLM)
通用:OpenAI GPT 系列、Google PaLM-2、Anthropic Claude 3
开源:Meta LLaMA 2、DeepSeek、智谱清言
国产:百度文心、阿里通义千问、华为盘古、字节豆包
多模态大模型
文生图:DALL・E 3、Midjourney
图文理解:GPT-4V、文心 4.5 Turbo
科学计算:AlphaFold(蛋白质折叠)、AlphaFold 3
垂直领域大模型
医疗:如腾讯觅影、平安好医生大模型
金融:风险控制、量化分析模型
工业:设备故障诊断、生产流程优化