Large language model Wikipedia Hugging Face LLM Course IBM: What are large language models? Cloudflare: What is a large language model? OpenAI Prompt Engineering Guide The Illustrated Transformer

LLM / 大语言模型

Q: 先用一句话抓住它

大语言模型是在海量文本和代码等材料上训练出来的深度学习模型，擅长理解、生成、改写、总结和组织语言内容。 它不是简单的搜索引擎，也不是固定问答库。它更像一个读过大量文本、能根据上下文继续组织语言的生成模型。 如果用生活里的话讲，可以把它想成一个读过很多书、文档、网页和代码示例的文字搭档。你给它一段上下文，它会根据这些材料接着写、换种说法、提炼重点或整理结构。它很会组织语言，但不等于它说出的每一句都已经被事实核验过。

AI百科编辑部2025-01-152.0万

LLM 是 Large Language Model 的缩写，中文叫“大语言模型”。ChatGPT、Claude、Gemini 这类产品背后，通常都有大语言模型作为核心能力

大语言模型LLMGPTTransformer

LLM 是 Large Language Model 的缩写，中文叫“大语言模型”。ChatGPT、Claude、Gemini 这类产品背后，通常都有大语言模型作为核心能力。

大语言模型带来的最大变化，是自然语言变成了一种操作界面。过去我们和软件打交道，要学菜单、按钮和命令；现在你可以直接说“帮我总结这份资料”“把这段话改得更口语”“列出三种方案”，模型会根据上下文生成结果。

先用一句话抓住它

大语言模型是在海量文本和代码等材料上训练出来的深度学习模型，擅长理解、生成、改写、总结和组织语言内容。

它不是简单的搜索引擎，也不是固定问答库。它更像一个读过大量文本、能根据上下文继续组织语言的生成模型。

如果用生活里的话讲，可以把它想成一个读过很多书、文档、网页和代码示例的文字搭档。你给它一段上下文，它会根据这些材料接着写、换种说法、提炼重点或整理结构。它很会组织语言，但不等于它说出的每一句都已经被事实核验过。

它为什么重要

LLM 解决的是“用自然语言处理复杂信息”的问题。用户不需要把需求拆成软件能听懂的按钮操作，而是可以直接表达目标。模型会根据问题、资料、历史对话和示例组织回答。

flowchart TD
    Context["上下文<br/>问题、资料、历史对话、示例"] --> LLM["大语言模型"]
    LLM --> Text["文本回答"]
    LLM --> Structure["清单 / 表格 / JSON"]
    LLM --> Code["代码草稿"]
    LLM --> Plan["步骤计划"]
    LLM --> Tool["配合工具执行任务"]

从技术上看，模型处理文字时会先把文本拆成 token，再把这些 token 转成可计算的表示。预训练让模型从大量文本中学习语言模式和知识关联，指令微调让模型更会按照人的要求回答。现代 LLM 常用 Transformer 架构，其中的注意力机制可以帮助模型判断上下文中哪些信息更相关。

它能做什么

LLM 的核心能力是围绕语言展开的：理解问题意图，提取资料重点，生成回答，改写风格，总结长文，翻译内容，把散乱信息整理成结构化形式，甚至生成代码草稿。它也可以根据用户给的示例临时调整输出方式，这常被称为上下文学习。

更进一步，当 LLM 接入工具后，它就不只是“说话”。它可以配合搜索、计算器、文件系统、数据库或 API 完成任务。很多 Agent 系统就是在 LLM 外面加上工具、记忆、权限和执行流程。

和生成式 AI、聊天产品的关系

LLM 属于生成式 AI 的重要类型，主要处理语言，也常常能处理代码和结构化文本。生成式 AI 的范围更大，还包括图像、音频和视频生成。

ChatGPT、Claude、Gemini 是产品或应用，不等于模型本身。产品通常会在模型外面加入检索、文件处理、图像能力、语音能力、工具调用、隐私控制和用户界面。也就是说，用户体验到的是一个完整系统，而不仅仅是裸模型。

容易误解的地方

最需要警惕的是把 LLM 当作数据库。模型生成的是基于上下文和语言模式的回答，不保证每句话都可追溯，也不天然知道最新事实。它可能把过时信息说得很顺，也可能在缺少资料时编造内容。

另一个常见误区是以为上下文窗口无限。模型一次能参考的信息有限，长文档、长对话和大型代码库都需要分块、摘要或 RAG。参数更多也不代表一定更适合所有任务，成本、延迟、工具能力和应用设计同样重要。

怎么判断它该不该用

使用 LLM 时，关键是给足上下文、说明目标、指定输出形式，并检查关键事实。对低风险任务，它很适合当草稿助手；对事实密集任务，最好提供资料或使用检索；对高风险任务，它只能作为辅助分析工具，不能替代专业判断。