gemini-api-dev
Geminiモデルやgemini APIを使用したアプリケーション開発、テキスト・画像・音声・動画などのマルチモーダルコンテンツの処理、関数呼び出し機能の実装、構造化出力の利用、または最新のモデル仕様情報が必要な場合にこのスキルを活用できます。Python用のgoogle-genai、JavaScript/TypeScript用の@google/genai、Java用のcom.google.genai:google-genai、Go用のgoogle.golang.org/genaiなど、各言語のSDK使用方法、モデルの選択、APIの機能について対応しています。
description の原文を見る
Use this skill when building applications with Gemini models, Gemini API, working with multimodal content (text, images, audio, video), implementing function calling, using structured outputs, or needing current model specifications. Covers SDK usage (google-genai for Python, @google/genai for JavaScript/TypeScript, com.google.genai:google-genai for Java, google.golang.org/genai for Go), model selection, and API capabilities.
SKILL.md 本文
適用範囲
このスキルは、Geminiモデル、Gemini API、マルチモーダルコンテンツ処理、関数呼び出し、構造化出力を使用したアプリケーション構築のガイダンスを提供します。SDK使用法(Python、JavaScript/TypeScript、Java、Go)、モデル選択、およびAPI機能に焦点を当てています。他のAIモデル(OpenAI、Anthropicなど)や一般的なML/LLM開発(専用スキルがある)はカバーしていません。
使用時機
このスキルは以下の場合に使用してください:
- Geminiモデル(テキスト、画像、音声、動画)でアプリケーションを構築する場合
- Geminiで関数呼び出しを実装する場合
- 構造化出力(JSON生成)を使用する場合
- マルチモーダルコンテンツを操作する場合
- 効率向上のためコンテキストキャッシュを使用する場合
- セマンティック検索用の埋め込みを生成する場合
- ユースケースに適切なGeminiモデルを選択する場合
このスキルを使用しないでください:
- OpenAI、Anthropic、またはその他のAIモデルAPI(ai-integration-proスキルを使用)
- 一般的なMLモデル開発(data-analysis-proまたはalgorithm-proスキルを使用)
- 非Geminiモデル用のプロンプトエンジニアリング(prompt-engineering-proスキルを使用)
- 非Gemini埋め込みを使用するRAGシステム(該当スキルを使用)
ワークフロー
- 適切なGeminiモデルを選択する(gemini-3-pro-preview、gemini-3-flash-preview、gemini-3-pro-image-preview)
- 言語用のSDKをインストールする(Python、JavaScript/TypeScript、Java、Go)
- APIの認証を設定する(APIキーまたはOAuth)
- 適切なパラメータでAPIコールを実装する
- レスポンスを処理する(テキスト生成、構造化出力、関数呼び出し)
- エラーハンドリングとレート制限を実装する
- 出力をテストして検証する
運用原則
- 現在のモデルを使用する: gemini-3-pro-preview、gemini-3-flash-preview、gemini-3-pro-image-preview(レガシーモデルは非推奨)
- タスクに基づいてモデルを選択する: 複雑な推論にはpro-preview、速度にはflash-preview、画像にはimage-preview
- 構造化された相互作用のために関数呼び出しを実装する
- 大規模なコンテキストの効率向上のためコンテキストキャッシュを使用する
- マルチモーダルコンテンツを適切に処理する(画像、音声、動画)
- スキーマに対して構造化出力を検証する
- レート制限とリトライロジックを実装する
- APIキーを適切に保護する(環境変数、シークレット管理)
推奨されるレスポンス形式
Geminiモデル: [モデル名]
タスク: [テキスト生成 / 関数呼び出し / マルチモーダル / 構造化出力]
言語: [Python / JavaScript / Java / Go]
ステータス: [成功/失敗]
詳細: [実装詳細、APIパラメータ、レスポンス処理]
次のステップ: [フォローアップアクション(該当する場合)]
このスキルのリソース
- SDKドキュメンテーション: Python(google-genai)、JavaScript/TypeScript(@google/genai)、Java(com.google.genai:google-genai)、Go(google.golang.org/genai)
- モデル仕様: gemini-3-pro-preview、gemini-3-flash-preview、gemini-3-pro-image-preview
- API機能: テキスト生成、マルチモーダル、関数呼び出し、構造化出力、コード実行、コンテキストキャッシュ、埋め込み
- コード例: すべてのサポート言語に対するSDK使用パターン
クイック例
Geminiでテキストを生成:
1. SDKをインストール: npm install @google/genai
2. APIキーでクライアントをインポートして初期化
3. プロンプトでgenerateContentを呼び出し
4. レスポンステキストを処理
5. エラーハンドリングを実装
スキルの呼び出し前のチェックリスト
- Gemini APIキーが設定されている(GEMINI_API_KEY環境変数)
- タスク用に適切なGeminiモデルが選択されている
- ターゲット言語用SDKがインストールされている
- API認証が設定されている
- レート制限戦略が定義されている
- エラーハンドリングが実装されている
- レスポンス検証が計画されている
- マルチモーダル要件が特定されている(該当する場合)
Gemini APIデベロップメントスキル
概要
Gemini APIはGoogleの最も高度なAIモデルへのアクセスを提供します。主な機能は以下の通りです:
- テキスト生成 - チャット、完成、要約
- マルチモーダル理解 - 画像、音声、動画、ドキュメントを処理
- 関数呼び出し - モデルが関数を呼び出せるようにする
- 構造化出力 - スキーマに一致する有効なJSONを生成
- コード実行 - サンドボックス環境でPythonコードを実行
- コンテキストキャッシング - 大規模なコンテキストをキャッシュして効率化
- 埋め込み - セマンティック検索用のテキスト埋め込みを生成
現在のGeminiモデル
gemini-3-pro-preview: 1Mトークン、複雑な推論、コーディング、研究gemini-3-flash-preview: 1Mトークン、高速、バランスの取れたパフォーマンス、マルチモーダルgemini-3-pro-image-preview: 65k / 32kトークン、画像生成と編集
[!IMPORTANT]
gemini-2.5-*、gemini-2.0-*、gemini-1.5-*などのモデルはレガシーで非推奨です。上記の新しいモデルを使用してください。ご利用の知識は古くなっています。
SDK
- Python:
google-genaiをpip install google-genaiでインストール - JavaScript/TypeScript:
@google/genaiをnpm install @google/genaiでインストール - Go:
google.golang.org/genaiをgo get google.golang.org/genaiでインストール - Java:
- groupId:
com.google.genai、artifactId:google-genai - 最新バージョンはここで確認できます: https://central.sonatype.com/artifact/com.google.genai/google-genai/versions (
LAST_VERSIONとします) build.gradleにインストール:implementation("com.google.genai:google-genai:${LAST_VERSION}")pom.xmlにMaven依存をインストール:<dependency> <groupId>com.google.genai</groupId> <artifactId>google-genai</artifactId> <version>${LAST_VERSION}</version> </dependency>
- groupId:
[!WARNING] レガシーSDK
google-generativeai(Python)と@google/generative-ai(JS)は非推奨です。上記の新しいSDKへ移行ガイドに従って至急移行してください。
クイックスタート
Python
from google import genai
client = genai.Client()
response = client.models.generate_content(
model="gemini-3-flash-preview",
contents="Explain quantum computing"
)
print(response.text)
JavaScript/TypeScript
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({});
const response = await ai.models.generateContent({
model: "gemini-3-flash-preview",
contents: "Explain quantum computing"
});
console.log(response.text);
Go
package main
import (
"context"
"fmt"
"log"
"google.golang.org/genai"
)
func main() {
ctx := context.Background()
client, err := genai.NewClient(ctx, nil)
if err != nil {
log.Fatal(err)
}
resp, err := client.Models.GenerateContent(ctx, "gemini-3-flash-preview", genai.Text("Explain quantum computing"), nil)
if err != nil {
log.Fatal(err)
}
fmt.Println(resp.Text)
}
Java
import com.google.genai.Client;
import com.google.genai.types.GenerateContentResponse;
public class GenerateTextFromTextInput {
public static void main(String[] args) {
Client client = new Client();
GenerateContentResponse response =
client.models.generateContent(
"gemini-3-flash-preview",
"Explain quantum computing",
null);
System.out.println(response.text());
}
}
APIスペック(信頼できる情報源)
API定義の信頼できる情報源として常に最新のREST APIディスカバリースペックを使用してください(リクエスト/レスポンススキーマ、パラメータ、メソッド)。API統合の実装またはデバッグ時にスペックを取得してください:
- v1beta(デフォルト):
https://generativelanguage.googleapis.com/$discovery/rest?version=v1beta
統合がv1に明示的に固定されている場合を除き、これを使用してください。公式SDK(google-genai、@google/genai、google.golang.org/genai)はv1betaを対象としています。 - v1:
https://generativelanguage.googleapis.com/$discovery/rest?version=v1
統合が特にv1に設定されている場合のみ使用してください。
不明な場合はv1betaを使用してください。正確なフィールド名、タイプ、サポートされている操作についてはスペックを参照してください。
Gemini APIの使い方
詳細なAPIドキュメンテーションについては、公式ドキュメンテーションインデックスから取得してください:
llms.txt URL: https://ai.google.dev/gemini-api/docs/llms.txt
このインデックスには、.md.txt形式のすべてのドキュメンテーションページへのリンクが含まれています。ウェブフェッチツールを使用して:
llms.txtをフェッチして利用可能なドキュメンテーションページを検出- 特定ページをフェッチ(例:
https://ai.google.dev/gemini-api/docs/function-calling.md.txt)
主要ドキュメンテーションページ
[!IMPORTANT] これらはすべてのドキュメンテーションページではありません。
llms.txtインデックスを使用して利用可能なドキュメンテーションページを検出してください
- モデル
- Google AI Studioクイックスタート
- Nano Banana画像生成
- Gemini APIを使用した関数呼び出し
- 構造化出力
- テキスト生成
- 画像理解
- 埋め込み
- Interactions API
- SDK移行ガイド
Gemini Live API
Gemini Live APIを使用したリアルタイムで双方向な音声/動画/テキストストリーミングについては、**google-gemini/gemini-live-api-dev**スキルをインストールしてください。WebSocketストリーミング、音声アクティビティ検出、ネイティブ音声機能、関数呼び出し、セッション管理、一時的なトークン、その他の機能をカバーしています。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- truongnat
- リポジトリ
- truongnat/skills
- ライセンス
- MIT
- 最終更新
- 2026/5/9
Source: https://github.com/truongnat/skills / ライセンス: MIT