McKinsey: What is a context window? TechTarget: What is a context window? Claude Docs: Context windows Context window Wikipedia

Context Window / 上下文窗口

Q: 先用一句话抓住它

上下文窗口像模型的临时工作台：这次回答时放在桌面上的资料，它能参考；没放上来的资料，它就看不到。 生活里的类比是开会。你桌上摊着会议纪要、合同和几页笔记，就能根据这些材料发言；如果某份关键文件没带进会议室，你再聪明也只能凭记忆猜。上下文窗口就是模型这次“会议桌”的大小。

AI百科编辑部2025-02-101.0万

上下文窗口是理解大语言模型时非常关键的一个词。它指的是模型一次对话或一次请求里，能够“看见”和参考的信息范围

上下文窗口Context长文本记忆

上下文窗口是理解大语言模型时非常关键的一个词。它指的是模型一次对话或一次请求里，能够“看见”和参考的信息范围。这个范围通常按 token 计算，包括系统提示、用户问题、历史对话、上传资料、检索结果，以及模型即将生成的回答。

很多人以为模型会记住整段聊天里的所有内容，其实不一定。模型能参考多少，取决于上下文窗口有多大，以及系统有没有把相关内容放进这次请求里。

先用一句话抓住它

上下文窗口像模型的临时工作台：这次回答时放在桌面上的资料，它能参考；没放上来的资料，它就看不到。

生活里的类比是开会。你桌上摊着会议纪要、合同和几页笔记，就能根据这些材料发言；如果某份关键文件没带进会议室，你再聪明也只能凭记忆猜。上下文窗口就是模型这次“会议桌”的大小。

它到底装了什么

上下文窗口不是模型训练时读过的全部资料，而是模型这一次生成回答时可用的工作记忆。Claude 文档把它解释为模型生成新文本时能回看和引用的全部文本范围；McKinsey 和 TechTarget 也都强调，它决定了 LLM 一次能处理多少输入。

flowchart LR
    System["系统提示"] --> Window["上下文窗口"]
    History["历史对话"] --> Window
    Files["上传资料 / 检索片段"] --> Window
    User["用户问题"] --> Window
    Window --> Model["模型"]
    Model --> Answer["回答"]

窗口里既有输入，也要给输出留空间。你塞进去的资料越多，模型可生成的空间和抓重点的难度都会受到影响。长上下文能让模型读更多内容，但不代表信息越多回答就越好。

为什么它重要

上下文窗口直接影响长文档处理、代码分析、多轮对话和 RAG。如果窗口太小，模型可能看不到前面的内容；如果资料太多又没有筛选，模型可能被无关信息干扰。

这也是为什么很多 AI 产品会做摘要、分块、检索和记忆管理。它们不是多此一举，而是在帮模型把真正相关的东西放进工作台。

容易误解的地方

上下文窗口大，不等于模型永远不会忘。大窗口只是能放更多 token，但模型是否能稳定找到关键细节，还受模型能力、提示方式、资料结构和任务类型影响。

另一个误区是把上下文窗口当成长期记忆。窗口是这次请求的工作范围，不等于模型永久记住你。产品里的“记忆”功能通常是额外系统设计，不是上下文窗口本身。

怎么判断它该不该用

如果你要处理长文档、长对话、大代码库、合同、会议记录或知识库问答，就要关心上下文窗口。简单聊天通常不用在意；但资料一长，就要考虑哪些内容真的需要放进去，哪些可以先摘要或通过 RAG 检索。

最实用的原则是：不要把上下文窗口当垃圾桶，而要当工作台。放上真正相关的材料，模型才更容易给出好答案。

先用一句话抓住它

它到底装了什么

为什么它重要

容易误解的地方

怎么判断它该不该用

资料来源