开始使用 Google Gemini CLI

Google 的 Gemini CLI 将 AI 助手直接带到您的终端——开发者已经花费大部分时间的地方。如果您熟悉命令行工具并希望将 AI 集成到现有工作流程中,这个开源工具为基于 GUI 的编码助手提供了一个引人注目的替代方案。
本指南涵盖了开始使用 Gemini CLI 所需的一切:安装、身份验证、基本命令,以及自然融入您开发流程的实用工作流。
关键要点
- Gemini CLI 直接在您的终端中提供 AI 助手,具有 100 万 token 的上下文窗口
- 免费套餐通过个人 Google 账户提供每分钟 60 次请求和每天 1,000 次请求
- 支持多模态输入、MCP 扩展和 Google 搜索集成
- 通过 npm 简单安装,支持多种身份验证选项
什么是 Gemini CLI?
Gemini CLI 是 Google 的开源终端 AI 代理,直接连接到 Gemini 2.5 Pro(备用 Flash)。与基于浏览器的 AI 工具不同,它直接在您的终端中运行,与您已经使用的 git、npm 和其他命令行实用程序并行工作。
使其脱颖而出的关键特性:
- 100 万 token 上下文窗口:处理整个代码库而不丢失上下文
- 多模态输入:处理图像、PDF 和草图以及代码
- MCP 支持:通过模型上下文协议服务器扩展功能
- Google 搜索集成:通过实时网络数据支撑响应
- 免费套餐:通过个人 Google 账户每分钟 60 次请求,每天 1,000 次请求
先决条件和安装
系统要求
在安装 Gemini CLI 之前,确保您具备:
- Node.js 版本 18 或更高
- npm(随 Node.js 一起提供)
- 终端应用程序
- 用于身份验证的互联网连接
安装 Gemini CLI
您有两个安装选项:
选项 1:使用 npx 直接运行
npx @google/gemini-cli
选项 2:全局安装(推荐)
npm install -g @google/gemini-cli
gemini
全局安装提供了一个可从任何目录访问的永久 gemini
命令。
身份验证和设置
当您首次运行 gemini
时,您将经历一个快速设置过程:
- 选择主题:为 CLI 界面选择您偏好的配色方案
- 选择身份验证方法:
- 个人 Google 账户(推荐入门使用)
- Google Workspace 账户
- API 密钥
Google 账户身份验证
开始使用的最简单方法是使用个人 Google 账户:
- 在终端中运行
gemini
- 提示时选择”个人 Google 账户”
- 按照浏览器身份验证流程操作
- 返回到您的终端
这为您提供了对免费套餐限制的即时访问。
API 密钥身份验证
用于自动化或更高限制:
- 在 Google AI Studio 生成密钥
- 将其设置为环境变量:
export GEMINI_API_KEY="your-api-key-here"
Workspace 身份验证故障排除
Google Workspace 账户需要额外设置:
- 创建 Google Cloud 项目
- 启用生成式语言 API
- 设置项目 ID:
export GOOGLE_CLOUD_PROJECT="your-project-id"
基本命令和使用
命令类型
Gemini CLI 使用三种命令模式:
斜杠命令 (/) - 控制 CLI
/help
- 显示可用命令/auth
- 更改身份验证方法/clear
- 清除屏幕/exit
- 退出 CLI
文件命令 (@) - 包含文件内容
@file.js
- 包含单个文件@src/
- 包含目录中的所有文件
Shell 命令 (!) - 执行终端命令
!ls -la
- 运行单个命令!
- 切换 shell 模式
基本工作流示例
探索代码库:
cd my-project
gemini
> 解释这个项目的架构
修复 bug:
gemini
> @src/api.js 在第 42 行有 TypeError。分析并修复它
生成测试:
gemini
> 为 @utils/validation.js 使用 Jest 编写单元测试
一次性命令
用于快速任务而无需进入交互模式:
# 生成文档
gemini -p "基于 @package.json 创建 README"
# 修复 linting 错误
gemini -p "修复 @src/ 中的 ESLint 错误"
# 分析最近的更改
gemini -p "总结最近 5 次 git 提交"
Discover how at OpenReplay.com.
实际用例
1. 代码理解和导航
Gemini CLI 擅长帮助您理解不熟悉的代码库:
> 映射身份验证如何在此应用程序中流动
> 哪些文件实现了支付处理逻辑?
> 解释 @services/auth.js 如何与数据库交互
2. 自动化重构
大型上下文窗口支持跨多个文件的复杂重构:
> 将所有 API 端点重构为使用 async/await 而不是回调
> 更新所有导入以使用 ES6 模块
3. 测试驱动开发
为测试驱动修复创建反馈循环:
> 修复此项目中失败的测试。在每次更改后运行 npm test 并继续直到所有测试通过
4. 文档生成
基于实际代码生成或更新文档:
> 为 @routes/ 中的所有端点创建 API 文档
> 基于最近的提交更新 CHANGELOG.md
使用 GEMINI.md 进行配置
通过在项目根目录创建 GEMINI.md
文件来自定义 Gemini CLI 的行为:
# 项目配置
## 编码标准
- 使用严格模式的 TypeScript
- 遵循 ESLint 配置
- 偏好函数式编程模式
## 架构说明
- API 路由在 /routes 中
- 业务逻辑在 /services 中
- 数据库模型在 /models 中
## 外部文档
https://docs.ourframework.com/latest
CLI 自动读取这些文件以了解您的项目上下文。
与其他 AI CLI 的比较
Gemini CLI 与替代方案的对比:
- vs Claude MCP:更大的上下文窗口(100 万 vs 20 万 token),多模态支持
- vs GitHub Copilot CLI:提供免费套餐,在 VS Code 之外工作
- vs Cursor:基于终端的工作流,无 IDE 依赖
主要区别是 Gemini 的大型上下文窗口——非常适合大型代码库或复杂重构任务。
结论
Gemini CLI 自然地集成到基于终端的工作流中,提供 AI 助手而无需上下文切换。其开源性质和慷慨的免费套餐使个人开发者可以轻松访问,同时为团队和自动化提供扩展路径。
现在您已经运行了 Gemini CLI,尝试这些任务来探索其功能:
- 导航到现有项目并询问架构概述
- 使用多模态输入:绘制 UI 组件草图并要求 Gemini 实现它
- 设置 MCP 服务器以扩展功能
- 创建项目特定的 GEMINI.md 文件以获得更好的上下文
常见问题
免费套餐在使用个人 Google 账户时提供每分钟 60 次请求和每天 1,000 次请求。对于更高的限制,您可以使用来自 Google AI Studio 的 API 密钥或使用 Google Cloud 项目进行身份验证。
是的,Gemini CLI 在您的机器上本地运行,只发送您使用 @ 命令或提示明确包含的内容。您的代码保留在您的机器上,除非您在查询中特别共享它。
100 万 token 窗口大致相当于 75 万个单词或约 3,000 页文本。这允许您在单个对话中包含整个中等规模的代码库而不丢失上下文。
是的,需要活跃的互联网连接,因为 Gemini CLI 向 Google 的 API 服务器发送请求。该工具无法离线运行,因为 AI 处理发生在 Google 的基础设施上,而不是本地。
Understand every bug
Uncover frustrations, understand bugs and fix slowdowns like never before with OpenReplay — the open-source session replay tool for developers. Self-host it in minutes, and have complete control over your customer data. Check our GitHub repo and join the thousands of developers in our community.