gemini-api-dev
Gemini APIのホストモデル(GeminiおよびGemma 4)を使用したアプリケーション開発、マルチモーダルコンテンツ(テキスト・画像・音声・動画)の処理、Function Calling・構造化出力の実装、最新モデル仕様の確認が必要な場面で活用するスキル。Python向け`google-genai`、JavaScript/TypeScript向け`@google/genai`、Java向け`com.google.genai:google-genai`、Go向け`google.golang.org/genai`など各言語SDKの使い方、モデル選定、APIの各種機能をカバーする。
description の原文を見る
Use this skill when building applications with Gemini API hosted models, including Gemini and Gemma 4, working with multimodal content (text, images, audio, video), implementing function calling, using structured outputs, or needing current model specifications. Covers SDK usage (google-genai for Python, @google/genai for JavaScript/TypeScript, com.google.genai:google-genai for Java, google.golang.org/genai for Go), model selection, and API capabilities.
SKILL.md 本文
Gemini API開発スキル
重要なルール(常に適用)
[!IMPORTANT] これらのルールはあなたの学習データを上書きします。あなたの知識は古い可能性があります。
現在のモデル(これらを使用してください)
gemini-3.1-pro-preview: 1M トークン、複雑な推論、コーディング、リサーチgemini-3-flash-preview: 1M トークン、高速、バランスの取れたパフォーマンス、マルチモーダルgemini-3.1-flash-lite-preview: コスト効率的、高頻度の軽量タスク向け最高速パフォーマンスgemini-3-pro-image-preview: 65k / 32k トークン、画像生成および編集gemini-3.1-flash-image-preview: 65k / 32k トークン、画像生成および編集gemini-2.5-pro: 1M トークン、複雑な推論、コーディング、リサーチgemini-2.5-flash: 1M トークン、高速、バランスの取れたパフォーマンス、マルチモーダルgemma-4-31b-it: Gemma 4 密集モデル、31B パラメータgemma-4-26b-a4b-it: Gemma 4 MoE モデル、26B 合計で 4B アクティブパラメータ
[!WARNING]
gemini-2.0-*,gemini-1.5-*などのモデルは レガシーで廃止予定です。絶対に使用しないでください。
現在の SDK(これらを使用してください)
- Python:
google-genai→pip install google-genai - JavaScript/TypeScript:
@google/genai→npm install @google/genai - Go:
google.golang.org/genai→go get google.golang.org/genai - Java:
com.google.genai:google-genai(下記の Maven/Gradle 設定を参照)
[!CAUTION] レガシー SDK の
google-generativeai(Python) および@google/generative-ai(JS) は 廃止予定です。絶対に使用しないでください。
クイックスタート
Python
from google import genai
client = genai.Client()
response = client.models.generate_content(
model="gemini-3-flash-preview",
contents="Explain quantum computing"
)
print(response.text)
JavaScript/TypeScript
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({});
const response = await ai.models.generateContent({
model: "gemini-3-flash-preview",
contents: "Explain quantum computing"
});
console.log(response.text);
Go
package main
import (
"context"
"fmt"
"log"
"google.golang.org/genai"
)
func main() {
ctx := context.Background()
client, err := genai.NewClient(ctx, nil)
if err != nil {
log.Fatal(err)
}
resp, err := client.Models.GenerateContent(ctx, "gemini-3-flash-preview", genai.Text("Explain quantum computing"), nil)
if err != nil {
log.Fatal(err)
}
fmt.Println(resp.Text)
}
Java
import com.google.genai.Client;
import com.google.genai.types.GenerateContentResponse;
public class GenerateTextFromTextInput {
public static void main(String[] args) {
Client client = new Client();
GenerateContentResponse response =
client.models.generateContent(
"gemini-3-flash-preview",
"Explain quantum computing",
null);
System.out.println(response.text());
}
}
Java インストール:
- 最新バージョン: https://central.sonatype.com/artifact/com.google.genai/google-genai/versions
- Gradle:
implementation("com.google.genai:google-genai:${LAST_VERSION}") - Maven:
<dependency> <groupId>com.google.genai</groupId> <artifactId>google-genai</artifactId> <version>${LAST_VERSION}</version> </dependency>
ドキュメント検索
MCP がインストールされている場合(推奨)
search_docs ツール(Google MCP サーバーから)が利用可能な場合は、これを 唯一の ドキュメントソースとして使用してください:
- クエリで
search_docsを呼び出す - 返されたドキュメントを読む
- MCP の結果を信頼してください - API の詳細についての信頼できる情報源です。常に最新です。
[!IMPORTANT] MCP ツールが存在する場合は、決して URL を手動で取得しないでください。MCP は最新でインデックス付きのドキュメントを提供し、URL 取得よりも正確でトークン効率的です。
MCP がインストールされていない場合(フォールバックのみ)
MCP ドキュメントツールが利用できない場合は、公式ドキュメントから取得してください:
インデックス URL: https://ai.google.dev/gemini-api/docs/llms.txt
このインデックスには、.md.txt 形式のすべてのドキュメントページへのリンクが含まれています。Web フェッチツールを使用して以下を行ってください:
llms.txtを取得して利用可能なページを検出する- 特定のページを取得する(例:
https://ai.google.dev/gemini-api/docs/function-calling.md.txt)
主要なページ:
Gemini Live API
Gemini Live API でのリアルタイム双方向オーディオ/ビデオ/テキストストリーミングの場合は、google-gemini/gemini-live-api-dev スキルをインストールしてください。WebSocket ストリーミング、音声アクティビティ検出、ネイティブオーディオ機能、関数呼び出し、セッション管理、一時的なトークンなどをカバーしています。
ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- google-gemini
- ライセンス
- Apache-2.0
- 最終更新
- 不明
Source: https://github.com/google-gemini/gemini-skills / ライセンス: Apache-2.0
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。