Gemini CLI

Google 终端 AI 编程 Agent,与 Antigravity 生态配合,多模态上下文能力强

热度AI编程开发免费额度
Gemini CLI 预览

2025 年,AI 编程 Agent 在命令行领域的竞争变得激烈:Anthropic 推出了 Claude Code,OpenAI 有 Codex CLI,GitHub 有 Copilot for CLI。Google 在这个时机发布了 Gemini CLI,一个开源的命令行 AI Agent,把 Gemini 的强大上下文处理能力带到了终端开发工作流里。作为开源项目,任何人都可以在 GitHub 上查看代码,自由使用和修改。

Gemini CLI 是什么

Gemini CLI 是 Google DeepMind 发布的开源命令行工具(发布于 2025 年),让开发者在终端里直接和 Gemini 模型交互,完成代码分析、文件处理、Shell 命令执行等任务。它是一个真正的 Agent:不只是聊天,而是可以读写文件、运行命令、在你的本地环境里执行多步骤任务。

和 Claude Code 的定位相似,Gemini CLI 的目标用户是喜欢命令行工作流的开发者——不想离开终端、不想换 IDE,但想要在开发过程中有强大的 AI 助手。

核心特性

超长上下文——Gemini 的真实优势

Gemini CLI 的最大技术亮点是它底层的 Gemini 模型提供的超长上下文窗口,最高可达 100 万 token。对比一下这个数字的含义:100 万 token 大约可以放下几十万行代码,或者一个中等规模项目的全部文件内容。

这意味着 Gemini CLI 在处理大型代码库时,不需要反复切换上下文,可以在同一个对话里保持对整个项目的理解。对于复杂项目的代码审查、架构分析、跨文件重构,这个长上下文能力是真实的竞争优势。

文件系统访问

Gemini CLI 可以直接读取你本地的文件和目录。你可以让它分析一个目录里的所有文件,理解整个代码库的结构,然后基于这个理解回答问题或者执行任务。

"读一下 src/services/ 里的所有文件,告诉我这些服务之间的依赖关系"——Gemini CLI 可以执行这样的任务,返回基于实际代码的分析,而不是笼统的推断。

Shell 命令执行

Gemini CLI 可以在你的终端环境里执行 Shell 命令。它可以运行你的构建工具、测试套件、Git 命令,看到输出结果,然后根据结果决定下一步行动。

这种"执行—观察—调整"的循环是 Agent 模式的核心,让 Gemini CLI 能够处理需要多步骤操作的任务,而不只是给你一段代码让你自己去运行。

开源,可以自托管和定制

Gemini CLI 完全开源,托管在 GitHub 上。对于有定制需求的开发者或团队,可以 fork 项目、修改代码,适配自己的工作流。对于有企业数据安全顾虑的团队,开源意味着你可以审查代码,了解数据如何处理。

对于有 Google Cloud 账号的企业用户,还可以通过 Vertex AI 接入,把数据处理完全保留在自己的云环境里,不走公共 API。

免费额度不低

Gemini CLI 使用个人 Google 账号登录,通过 Gemini API 的免费额度使用,每天有相当可观的免费请求数量——对于大多数个人开发者的日常使用,免费额度基本够用,不需要付费就能有实质性的使用体验。这一点是它和 Claude Code(需要 Anthropic API Key,按量计费)、OpenAI Codex(需要 ChatGPT Plus)的主要区别之一。

典型使用场景

代码库分析和理解:接手一个新项目,让 Gemini CLI 分析代码结构,解释主要模块的作用和相互关系,快速建立对项目的理解。

代码审查辅助:提交 PR 之前,让 Gemini CLI 检查代码变更,指出潜在的 bug、安全问题、可以改进的地方。

调试辅助:遇到难以定位的 bug,把相关的错误信息、堆栈跟踪、相关代码都给 Gemini CLI,让它分析可能的原因。

重构指导:有一段需要重构的代码,让 Gemini CLI 提出重构建议,或者直接执行重构。

脚本和自动化:需要写一个处理文件、自动化某个工作流程的脚本,让 Gemini CLI 写出来并直接测试运行。

和其他命令行 AI 工具的比较

vs Claude Code(Anthropic):两者都是命令行 AI Agent,定位最接近。Claude Code 在代码理解和编程能力上有口碑,但需要付费的 Anthropic API。Gemini CLI 的免费额度更大,长上下文是技术亮点,对于不想立即付费试用 Agent 编程的开发者是更低门槛的入口。

vs OpenAI Codex CLI:OpenAI 也有命令行版本的 Codex,集成在 OpenAI API 生态里。Gemini CLI 的开源特性和免费额度是差异化优势。

vs Aider:Aider 是一个成熟的开源命令行 AI 编程工具,支持多个 AI 模型后端(包括 Gemini)。Gemini CLI 是 Google 官方产品,但 Aider 的功能体系更成熟,有更丰富的 Git 集成和多文件编辑支持。

vs GitHub Copilot CLI:Copilot CLI 专注于帮助在命令行里写和解释 Shell 命令,定位更窄。Gemini CLI 是更通用的编程 Agent。

谁适合用

命令行开发者:日常工作在终端里,不想为了用 AI 切换到 IDE 插件或者浏览器界面。Gemini CLI 在终端里提供完整的 AI Agent 体验。

想低成本试用 Agent 编程的开发者:Gemini CLI 的免费额度让你可以认真体验 AI Agent 编程模式是否适合自己,再决定是否付费使用其他工具。

Google 技术栈的开发者:使用 Google Cloud、Firebase、Flutter 等 Google 技术栈的开发者,Gemini CLI 和这些产品的集成更自然。

大型代码库的开发者:如果你的项目代码量大,长上下文能力是 Gemini CLI 的真实优势,可以在不切换上下文的情况下分析整个项目。

开源工具偏好者:对使用闭源 AI 工具有顾虑,希望能审查工具代码的开发者,开源是一个重要的加分项。

局限

相对较新:Gemini CLI 发布于 2025 年,相比 GitHub Copilot 或者 Cursor 这些已经迭代了几年的工具,生态还不够成熟,社区资源、插件、工作流集成还在建设中。

网络访问需求:作为需要调用 Gemini API 的工具,在网络连接不稳定的环境里使用体验会受影响。

对 Google 账号的依赖:免费使用需要 Google 账号,企业用户需要 Google Cloud 账号,对于不在 Google 生态里的团队有一定门槛。

需要学习命令行工作流:对于不熟悉终端的开发者,命令行工具的学习成本比 IDE 插件高,这类工具不太适合非技术用户。

安装和使用

通过 npm 安装:npm install -g @google/gemini-cli

安装完成后,用 gemini 命令启动,使用 Google 账号授权,即可开始使用。首次配置大约只需要几分钟。

由于是开源项目,最新的安装方式以 GitHub 仓库的说明为准。

实际建议

先熟悉基础命令gemini 进入交互模式,gemini -p "你的任务" 单次执行,@filename 引用文件,!command 执行 Shell 命令——这几个基础操作掌握后,大部分日常任务就能处理了。

充分利用长上下文:不要担心把太多文件放进来。Gemini CLI 的长上下文是优势,提供更多上下文通常比担心"太多了"更有助于得到准确的结果。

结合 Git 工作流使用:在 Git 仓库根目录使用效果最好,Gemini CLI 可以理解 Git 状态、读取代码变更,和 PR 工作流配合起来很自然。

Gemini CLI 是 2025 年命令行 AI 编程工具里值得关注的新选手,免费额度大、长上下文强、完全开源,对于想低门槛体验 Agent 编程模式的开发者,是目前最值得先试试的工具之一。