Back

开始使用 Google Gemini CLI

OpenReplay Team

Sep 19, 2025 · 2 min read

Google 的 Gemini CLI 将 AI 助手直接带到您的终端——开发者已经花费大部分时间的地方。如果您熟悉命令行工具并希望将 AI 集成到现有工作流程中，这个开源工具为基于 GUI 的编码助手提供了一个引人注目的替代方案。

本指南涵盖了开始使用 Gemini CLI 所需的一切：安装、身份验证、基本命令，以及自然融入您开发流程的实用工作流。

关键要点

Gemini CLI 直接在您的终端中提供 AI 助手，具有 100 万 token 的上下文窗口
免费套餐通过个人 Google 账户提供每分钟 60 次请求和每天 1,000 次请求
支持多模态输入、MCP 扩展和 Google 搜索集成
通过 npm 简单安装，支持多种身份验证选项

什么是 Gemini CLI？

Gemini CLI 是 Google 的开源终端 AI 代理，直接连接到 Gemini 2.5 Pro（备用 Flash）。与基于浏览器的 AI 工具不同，它直接在您的终端中运行，与您已经使用的 git、npm 和其他命令行实用程序并行工作。

使其脱颖而出的关键特性：

100 万 token 上下文窗口：处理整个代码库而不丢失上下文
多模态输入：处理图像、PDF 和草图以及代码
MCP 支持：通过模型上下文协议服务器扩展功能
Google 搜索集成：通过实时网络数据支撑响应
免费套餐：通过个人 Google 账户每分钟 60 次请求，每天 1,000 次请求

先决条件和安装

系统要求

在安装 Gemini CLI 之前，确保您具备：

Node.js 版本 18 或更高
npm（随 Node.js 一起提供）
终端应用程序
用于身份验证的互联网连接

安装 Gemini CLI

您有两个安装选项：

选项 1：使用 npx 直接运行

npx @google/gemini-cli

选项 2：全局安装（推荐）

npm install -g @google/gemini-cli
gemini

全局安装提供了一个可从任何目录访问的永久 gemini 命令。

身份验证和设置

当您首次运行 gemini 时，您将经历一个快速设置过程：

选择主题：为 CLI 界面选择您偏好的配色方案
选择身份验证方法：
- 个人 Google 账户（推荐入门使用）
- Google Workspace 账户
- API 密钥

Google 账户身份验证

开始使用的最简单方法是使用个人 Google 账户：

在终端中运行 gemini
提示时选择”个人 Google 账户”
按照浏览器身份验证流程操作
返回到您的终端

这为您提供了对免费套餐限制的即时访问。

API 密钥身份验证

用于自动化或更高限制：

在 Google AI Studio 生成密钥
将其设置为环境变量：

export GEMINI_API_KEY="your-api-key-here"

Workspace 身份验证故障排除

Google Workspace 账户需要额外设置：

创建 Google Cloud 项目
启用生成式语言 API
设置项目 ID：

export GOOGLE_CLOUD_PROJECT="your-project-id"

基本命令和使用

命令类型

Gemini CLI 使用三种命令模式：

斜杠命令 (/) - 控制 CLI

/help - 显示可用命令
/auth - 更改身份验证方法
/clear - 清除屏幕
/exit - 退出 CLI

文件命令 (@) - 包含文件内容

@file.js - 包含单个文件
@src/ - 包含目录中的所有文件

Shell 命令 (!) - 执行终端命令

!ls -la - 运行单个命令
! - 切换 shell 模式

基本工作流示例

探索代码库：

cd my-project
gemini
> 解释这个项目的架构

修复 bug：

gemini
> @src/api.js 在第 42 行有 TypeError。分析并修复它

生成测试：

gemini
> 为 @utils/validation.js 使用 Jest 编写单元测试

一次性命令

用于快速任务而无需进入交互模式：

# 生成文档
gemini -p "基于 @package.json 创建 README"

# 修复 linting 错误
gemini -p "修复 @src/ 中的 ESLint 错误"

# 分析最近的更改
gemini -p "总结最近 5 次 git 提交"

实际用例

1. 代码理解和导航

Gemini CLI 擅长帮助您理解不熟悉的代码库：

> 映射身份验证如何在此应用程序中流动
> 哪些文件实现了支付处理逻辑？
> 解释 @services/auth.js 如何与数据库交互

2. 自动化重构

大型上下文窗口支持跨多个文件的复杂重构：

> 将所有 API 端点重构为使用 async/await 而不是回调
> 更新所有导入以使用 ES6 模块

3. 测试驱动开发

为测试驱动修复创建反馈循环：

> 修复此项目中失败的测试。在每次更改后运行 npm test 并继续直到所有测试通过

4. 文档生成

基于实际代码生成或更新文档：

> 为 @routes/ 中的所有端点创建 API 文档
> 基于最近的提交更新 CHANGELOG.md

使用 GEMINI.md 进行配置

通过在项目根目录创建 GEMINI.md 文件来自定义 Gemini CLI 的行为：

# 项目配置

## 编码标准
- 使用严格模式的 TypeScript
- 遵循 ESLint 配置
- 偏好函数式编程模式

## 架构说明
- API 路由在 /routes 中
- 业务逻辑在 /services 中
- 数据库模型在 /models 中

## 外部文档
https://docs.ourframework.com/latest

CLI 自动读取这些文件以了解您的项目上下文。

与其他 AI CLI 的比较

Gemini CLI 与替代方案的对比：

vs Claude MCP：更大的上下文窗口（100 万 vs 20 万 token），多模态支持
vs GitHub Copilot CLI：提供免费套餐，在 VS Code 之外工作
vs Cursor：基于终端的工作流，无 IDE 依赖

主要区别是 Gemini 的大型上下文窗口——非常适合大型代码库或复杂重构任务。

结论

Gemini CLI 自然地集成到基于终端的工作流中，提供 AI 助手而无需上下文切换。其开源性质和慷慨的免费套餐使个人开发者可以轻松访问，同时为团队和自动化提供扩展路径。

现在您已经运行了 Gemini CLI，尝试这些任务来探索其功能：

导航到现有项目并询问架构概述
使用多模态输入：绘制 UI 组件草图并要求 Gemini 实现它
设置 MCP 服务器以扩展功能
创建项目特定的 GEMINI.md 文件以获得更好的上下文

常见问题

免费套餐在使用个人 Google 账户时提供每分钟 60 次请求和每天 1,000 次请求。对于更高的限制，您可以使用来自 Google AI Studio 的 API 密钥或使用 Google Cloud 项目进行身份验证。

是的，Gemini CLI 在您的机器上本地运行，只发送您使用 @ 命令或提示明确包含的内容。您的代码保留在您的机器上，除非您在查询中特别共享它。

100 万 token 窗口大致相当于 75 万个单词或约 3,000 页文本。这允许您在单个对话中包含整个中等规模的代码库而不丢失上下文。

是的，需要活跃的互联网连接，因为 Gemini CLI 向 Google 的 API 服务器发送请求。该工具无法离线运行，因为 AI 处理发生在 Google 的基础设施上，而不是本地。

Understand every bug

Uncover frustrations, understand bugs and fix slowdowns like never before with OpenReplay — the open-source session replay tool for developers. Self-host it in minutes, and have complete control over your customer data. Check our GitHub repo and join the thousands of developers in our community.