Back

Начало работы с Google Gemini CLI

Начало работы с Google Gemini CLI

Google Gemini CLI предоставляет ИИ-помощь прямо в вашем терминале — там, где разработчики уже проводят большую часть времени. Если вы комфортно работаете с инструментами командной строки и хотите интегрировать ИИ в свой существующий рабочий процесс, этот инструмент с открытым исходным кодом предлагает убедительную альтернативу помощникам по программированию с графическим интерфейсом.

Данное руководство охватывает всё необходимое для начала работы с Gemini CLI: установку, аутентификацию, базовые команды и практические рабочие процессы, которые естественно вписываются в ваш процесс разработки.

Ключевые моменты

  • Gemini CLI предоставляет ИИ-помощь прямо в терминале с контекстным окном в 1 миллион токенов
  • Бесплатный тариф предлагает 60 запросов в минуту и 1000 запросов в день с личным аккаунтом Google
  • Поддерживает мультимодальный ввод, расширения MCP и интеграцию с Google Search
  • Простая установка через npm с несколькими вариантами аутентификации

Что такое Gemini CLI?

Gemini CLI — это терминальный ИИ-агент Google с открытым исходным кодом, который подключает вас напрямую к Gemini 2.5 Pro (с резервным переходом на Flash). В отличие от браузерных ИИ-инструментов, он работает прямо в вашем терминале рядом с git, npm и другими утилитами командной строки, которые вы уже используете.

Ключевые особенности, которые его выделяют:

  • Контекстное окно в 1 млн токенов: Работайте с целыми кодовыми базами без потери контекста
  • Мультимодальный ввод: Обрабатывайте изображения, PDF и эскизы наряду с кодом
  • Поддержка MCP: Расширяйте функциональность через серверы Model Context Protocol
  • Интеграция с Google Search: Подкрепляйте ответы данными веб-поиска в реальном времени
  • Бесплатный тариф: 60 запросов в минуту, 1000 запросов в день с личным аккаунтом Google

Предварительные требования и установка

Системные требования

Перед установкой Gemini CLI убедитесь, что у вас есть:

  • Node.js версии 18 или выше
  • npm (поставляется с Node.js)
  • Приложение терминала
  • Интернет-соединение для аутентификации

Установка Gemini CLI

У вас есть два варианта установки:

Вариант 1: Запуск напрямую с npx

npx @google/gemini-cli

Вариант 2: Глобальная установка (рекомендуется)

npm install -g @google/gemini-cli
gemini

Глобальная установка предоставляет постоянную команду gemini, доступную из любой директории.

Аутентификация и настройка

При первом запуске gemini вы пройдете через быстрый процесс настройки:

  1. Выберите тему: Выберите предпочитаемую цветовую схему для интерфейса CLI
  2. Выберите метод аутентификации:
    • Личный аккаунт Google (рекомендуется для начала)
    • Аккаунт Google Workspace
    • API-ключ

Аутентификация через аккаунт Google

Самый простой способ начать — использовать личный аккаунт Google:

  1. Запустите gemini в терминале
  2. Выберите “Personal Google Account” при появлении запроса
  3. Следуйте процессу аутентификации в браузере
  4. Вернитесь в терминал

Это даёт вам немедленный доступ к лимитам бесплатного тарифа.

Аутентификация через API-ключ

Для автоматизации или более высоких лимитов:

  1. Сгенерируйте ключ в Google AI Studio
  2. Установите его как переменную окружения:
export GEMINI_API_KEY="your-api-key-here"

Устранение неполадок с аутентификацией Workspace

Аккаунты Google Workspace требуют дополнительной настройки:

  1. Создайте проект Google Cloud
  2. Включите Generative Language API
  3. Установите ID проекта:
export GOOGLE_CLOUD_PROJECT="your-project-id"

Основные команды и использование

Типы команд

Gemini CLI использует три шаблона команд:

Слэш-команды (/) - Управление CLI

  • /help - Показать доступные команды
  • /auth - Изменить метод аутентификации
  • /clear - Очистить экран
  • /exit - Выйти из CLI

Файловые команды (@) - Включение содержимого файлов

  • @file.js - Включить один файл
  • @src/ - Включить все файлы в директории

Команды оболочки (!) - Выполнение команд терминала

  • !ls -la - Выполнить одну команду
  • ! - Переключить режим оболочки

Примеры базовых рабочих процессов

Изучение кодовой базы:

cd my-project
gemini
> Объясни архитектуру этого проекта

Исправление ошибки:

gemini
> В @src/api.js есть TypeError на строке 42. Проанализируй и исправь её

Генерация тестов:

gemini
> Напиши unit-тесты для @utils/validation.js используя Jest

Одноразовые команды

Для быстрых задач без входа в интерактивный режим:

# Генерация документации
gemini -p "Создай README на основе @package.json"

# Исправление ошибок линтера
gemini -p "Исправь ошибки ESLint в @src/"

# Анализ недавних изменений
gemini -p "Суммируй последние 5 git коммитов"

Практические случаи использования

1. Понимание и навигация по коду

Gemini CLI отлично помогает понимать незнакомые кодовые базы:

> Составь схему того, как аутентификация проходит через это приложение
> Какие файлы реализуют логику обработки платежей?
> Объясни, как @services/auth.js взаимодействует с базой данных

2. Автоматизированный рефакторинг

Большое контекстное окно позволяет выполнять сложный рефакторинг в нескольких файлах:

> Рефактори все API эндпоинты для использования async/await вместо колбэков
> Обнови все импорты для использования ES6 модулей

3. Разработка через тестирование

Создайте цикл обратной связи для исправлений через тестирование:

> Исправь падающие тесты в этом проекте. Запускай npm test после каждого изменения и продолжай, пока все не пройдут

4. Генерация документации

Генерируйте или обновляйте документацию на основе реального кода:

> Создай API документацию для всех эндпоинтов в @routes/
> Обнови CHANGELOG.md на основе недавних коммитов

Конфигурация с GEMINI.md

Настройте поведение Gemini CLI, создав файл GEMINI.md в корне вашего проекта:

# Конфигурация проекта

## Стандарты кодирования
- Используй TypeScript со строгим режимом
- Следуй конфигурации ESLint
- Предпочитай паттерны функционального программирования

## Заметки об архитектуре
- API маршруты находятся в /routes
- Бизнес-логика живёт в /services
- Модели базы данных в /models

## Внешняя документация
https://docs.ourframework.com/latest

CLI автоматически читает эти файлы для понимания контекста вашего проекта.

Сравнение с другими ИИ CLI

Как Gemini CLI сравнивается с альтернативами:

  • vs Claude MCP: Большее контекстное окно (1 млн против 200 тыс. токенов), мультимодальная поддержка
  • vs GitHub Copilot CLI: Доступен бесплатный тариф, работает вне VS Code
  • vs Cursor: Рабочий процесс на основе терминала, без зависимости от IDE

Главное отличие — массивное контекстное окно Gemini, идеальное для больших кодовых баз или сложных задач рефакторинга.

Заключение

Gemini CLI естественно интегрируется в рабочие процессы на основе терминала, предоставляя ИИ-помощь без переключения контекста. Его открытая природа и щедрый бесплатный тариф делают его доступным для индивидуальных разработчиков, предлагая при этом пути масштабирования для команд и автоматизации.

Теперь, когда у вас запущен Gemini CLI, попробуйте эти задачи для изучения его возможностей:

  1. Перейдите к существующему проекту и попросите обзор архитектуры
  2. Используйте мультимодальный ввод: нарисуйте UI-компонент и попросите Gemini его реализовать
  3. Настройте MCP-серверы для расширенной функциональности
  4. Создайте специфичные для проекта файлы GEMINI.md для лучшего контекста

Часто задаваемые вопросы

Бесплатный тариф предоставляет 60 запросов в минуту и 1000 запросов в день при использовании личного аккаунта Google. Для более высоких лимитов вы можете использовать API-ключ из Google AI Studio или аутентифицироваться с проектом Google Cloud.

Да, Gemini CLI работает локально на вашей машине и отправляет только тот контент, который вы явно включаете с помощью @ команд или промптов. Ваш код остаётся на вашей машине, если вы специально не поделитесь им в запросе.

Окно в 1 млн токенов примерно соответствует 750,000 словам или около 3,000 страниц текста. Это позволяет включать целые кодовые базы среднего размера в одну беседу без потери контекста.

Да, активное интернет-соединение необходимо, поскольку Gemini CLI отправляет запросы на API-серверы Google. Инструмент не может функционировать офлайн, так как обработка ИИ происходит на инфраструктуре Google, а не локально.

Understand every bug

Uncover frustrations, understand bugs and fix slowdowns like never before with OpenReplay — the open-source session replay tool for developers. Self-host it in minutes, and have complete control over your customer data. Check our GitHub repo and join the thousands of developers in our community.

OpenReplay