Back

开始使用 Google Gemini CLI

开始使用 Google Gemini CLI

Google 的 Gemini CLI 将 AI 助手直接带到您的终端——开发者已经花费大部分时间的地方。如果您熟悉命令行工具并希望将 AI 集成到现有工作流程中,这个开源工具为基于 GUI 的编码助手提供了一个引人注目的替代方案。

本指南涵盖了开始使用 Gemini CLI 所需的一切:安装、身份验证、基本命令,以及自然融入您开发流程的实用工作流。

关键要点

  • Gemini CLI 直接在您的终端中提供 AI 助手,具有 100 万 token 的上下文窗口
  • 免费套餐通过个人 Google 账户提供每分钟 60 次请求和每天 1,000 次请求
  • 支持多模态输入、MCP 扩展和 Google 搜索集成
  • 通过 npm 简单安装,支持多种身份验证选项

什么是 Gemini CLI?

Gemini CLI 是 Google 的开源终端 AI 代理,直接连接到 Gemini 2.5 Pro(备用 Flash)。与基于浏览器的 AI 工具不同,它直接在您的终端中运行,与您已经使用的 git、npm 和其他命令行实用程序并行工作。

使其脱颖而出的关键特性:

  • 100 万 token 上下文窗口:处理整个代码库而不丢失上下文
  • 多模态输入:处理图像、PDF 和草图以及代码
  • MCP 支持:通过模型上下文协议服务器扩展功能
  • Google 搜索集成:通过实时网络数据支撑响应
  • 免费套餐:通过个人 Google 账户每分钟 60 次请求,每天 1,000 次请求

先决条件和安装

系统要求

在安装 Gemini CLI 之前,确保您具备:

  • Node.js 版本 18 或更高
  • npm(随 Node.js 一起提供)
  • 终端应用程序
  • 用于身份验证的互联网连接

安装 Gemini CLI

您有两个安装选项:

选项 1:使用 npx 直接运行

npx @google/gemini-cli

选项 2:全局安装(推荐)

npm install -g @google/gemini-cli
gemini

全局安装提供了一个可从任何目录访问的永久 gemini 命令。

身份验证和设置

当您首次运行 gemini 时,您将经历一个快速设置过程:

  1. 选择主题:为 CLI 界面选择您偏好的配色方案
  2. 选择身份验证方法
    • 个人 Google 账户(推荐入门使用)
    • Google Workspace 账户
    • API 密钥

Google 账户身份验证

开始使用的最简单方法是使用个人 Google 账户:

  1. 在终端中运行 gemini
  2. 提示时选择”个人 Google 账户”
  3. 按照浏览器身份验证流程操作
  4. 返回到您的终端

这为您提供了对免费套餐限制的即时访问。

API 密钥身份验证

用于自动化或更高限制:

  1. Google AI Studio 生成密钥
  2. 将其设置为环境变量:
export GEMINI_API_KEY="your-api-key-here"

Workspace 身份验证故障排除

Google Workspace 账户需要额外设置:

  1. 创建 Google Cloud 项目
  2. 启用生成式语言 API
  3. 设置项目 ID:
export GOOGLE_CLOUD_PROJECT="your-project-id"

基本命令和使用

命令类型

Gemini CLI 使用三种命令模式:

斜杠命令 (/) - 控制 CLI

  • /help - 显示可用命令
  • /auth - 更改身份验证方法
  • /clear - 清除屏幕
  • /exit - 退出 CLI

文件命令 (@) - 包含文件内容

  • @file.js - 包含单个文件
  • @src/ - 包含目录中的所有文件

Shell 命令 (!) - 执行终端命令

  • !ls -la - 运行单个命令
  • ! - 切换 shell 模式

基本工作流示例

探索代码库:

cd my-project
gemini
> 解释这个项目的架构

修复 bug:

gemini
> @src/api.js 在第 42 行有 TypeError。分析并修复它

生成测试:

gemini
> 为 @utils/validation.js 使用 Jest 编写单元测试

一次性命令

用于快速任务而无需进入交互模式:

# 生成文档
gemini -p "基于 @package.json 创建 README"

# 修复 linting 错误
gemini -p "修复 @src/ 中的 ESLint 错误"

# 分析最近的更改
gemini -p "总结最近 5 次 git 提交"

实际用例

1. 代码理解和导航

Gemini CLI 擅长帮助您理解不熟悉的代码库:

> 映射身份验证如何在此应用程序中流动
> 哪些文件实现了支付处理逻辑?
> 解释 @services/auth.js 如何与数据库交互

2. 自动化重构

大型上下文窗口支持跨多个文件的复杂重构:

> 将所有 API 端点重构为使用 async/await 而不是回调
> 更新所有导入以使用 ES6 模块

3. 测试驱动开发

为测试驱动修复创建反馈循环:

> 修复此项目中失败的测试。在每次更改后运行 npm test 并继续直到所有测试通过

4. 文档生成

基于实际代码生成或更新文档:

> 为 @routes/ 中的所有端点创建 API 文档
> 基于最近的提交更新 CHANGELOG.md

使用 GEMINI.md 进行配置

通过在项目根目录创建 GEMINI.md 文件来自定义 Gemini CLI 的行为:

# 项目配置

## 编码标准
- 使用严格模式的 TypeScript
- 遵循 ESLint 配置
- 偏好函数式编程模式

## 架构说明
- API 路由在 /routes 中
- 业务逻辑在 /services 中
- 数据库模型在 /models 中

## 外部文档
https://docs.ourframework.com/latest

CLI 自动读取这些文件以了解您的项目上下文。

与其他 AI CLI 的比较

Gemini CLI 与替代方案的对比:

  • vs Claude MCP:更大的上下文窗口(100 万 vs 20 万 token),多模态支持
  • vs GitHub Copilot CLI:提供免费套餐,在 VS Code 之外工作
  • vs Cursor:基于终端的工作流,无 IDE 依赖

主要区别是 Gemini 的大型上下文窗口——非常适合大型代码库或复杂重构任务。

结论

Gemini CLI 自然地集成到基于终端的工作流中,提供 AI 助手而无需上下文切换。其开源性质和慷慨的免费套餐使个人开发者可以轻松访问,同时为团队和自动化提供扩展路径。

现在您已经运行了 Gemini CLI,尝试这些任务来探索其功能:

  1. 导航到现有项目并询问架构概述
  2. 使用多模态输入:绘制 UI 组件草图并要求 Gemini 实现它
  3. 设置 MCP 服务器以扩展功能
  4. 创建项目特定的 GEMINI.md 文件以获得更好的上下文

常见问题

免费套餐在使用个人 Google 账户时提供每分钟 60 次请求和每天 1,000 次请求。对于更高的限制,您可以使用来自 Google AI Studio 的 API 密钥或使用 Google Cloud 项目进行身份验证。

是的,Gemini CLI 在您的机器上本地运行,只发送您使用 @ 命令或提示明确包含的内容。您的代码保留在您的机器上,除非您在查询中特别共享它。

100 万 token 窗口大致相当于 75 万个单词或约 3,000 页文本。这允许您在单个对话中包含整个中等规模的代码库而不丢失上下文。

是的,需要活跃的互联网连接,因为 Gemini CLI 向 Google 的 API 服务器发送请求。该工具无法离线运行,因为 AI 处理发生在 Google 的基础设施上,而不是本地。

Understand every bug

Uncover frustrations, understand bugs and fix slowdowns like never before with OpenReplay — the open-source session replay tool for developers. Self-host it in minutes, and have complete control over your customer data. Check our GitHub repo and join the thousands of developers in our community.

OpenReplay