Agent Skills by ALSEL
Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

gemini-api

Google Gen AI SDKを使用して、Agent Platform上でのGemini APIの利用方法をガイドします。ユーザーがエンタープライズ環境でのGemini活用について質問したり、Vertex AI・Google Cloud・Agent Platformに言及した際に使用してください。Python・JS/TS・Go・Java・C#などのSDK利用方法に加え、Live API・ツール連携・マルチメディア生成・キャッシュ・バッチ予測といった機能をカバーします。

description の原文を見る

Guides the usage of the Gemini API on Agent Platform with the Google Gen AI SDK. Use when the user asks about using Gemini in an enterprise environment or explicitly mentions Vertex AI, Google Cloud, or Agent Platform. Covers SDK usage (Python, JS/TS, Go, Java, C#), capabilities like Live API, tools, multimedia generation, caching, and batch prediction.

SKILL.md 本文

重要: Agent Platform (正式名称は Gemini Enterprise Agent Platform) は以前「Vertex AI」と呼ばれており、多くのウェブリソースでは旧ブランド名を使用しています。

Agent Platform 内の Gemini API

Agent Platform 内の Gemini API を使用して、エンタープライズユースケース向けに設計された Google の最先端 AI モデルにアクセスします。

主な機能を提供します:

  • テキスト生成 - チャット、補完、要約
  • マルチモーダル理解 - 画像、音声、ビデオ、ドキュメントを処理
  • 関数呼び出し - モデルに関数を呼び出させる
  • 構造化出力 - スキーマに合致する有効な JSON を生成
  • コンテキストキャッシング - 大規模なコンテキストをキャッシュして効率化
  • 埋め込み - セマンティック検索用のテキスト埋め込みを生成
  • Live Realtime API - 低遅延の音声およびビデオインタラクションのための双方向ストリーミング
  • バッチ予測 - 大規模な非同期データセット予測ワークロードを処理

コア指針

  • 統一 SDK: 常に Gen AI SDK を使用してください (Python は google-genai、JS/TS は @google/genai、Go は google.golang.org/genai、Java は com.google.genai:google-genai、C# は Google.GenAI)。
  • レガシー SDK: google-cloud-aiplatform@google-cloud/vertexaigoogle-generativeai は使用しないでください。

SDK

  • Python: pip install google-genaigoogle-genai をインストール
  • JavaScript/TypeScript: npm install @google/genai@google/genai をインストール
  • Go: go get google.golang.org/genaigoogle.golang.org/genai をインストール
  • C#/.NET: dotnet add package Google.GenAIGoogle.GenAI をインストール
  • Java:
    • groupId: com.google.genai, artifactId: google-genai

    • 最新バージョンはこちらで確認できます: https://central.sonatype.com/artifact/com.google.genai/google-genai/versions (LAST_VERSION とします)

    • build.gradle でインストール:

      implementation("com.google.genai:google-genai:${LAST_VERSION}")
      
    • Maven 依存関係を pom.xml でインストール:

      <dependency>
          <groupId>com.google.genai</groupId>
          <artifactId>google-genai</artifactId>
          <version>${LAST_VERSION}</version>
      </dependency>
      

[!WARNING] google-cloud-aiplatform@google-cloud/vertexaigoogle-generativeai などのレガシー SDK は非推奨です。移行ガイドに従って新しい SDK への緊急の移行を行ってください。

認証と設定

クライアント作成時に、パラメータをハードコードするのではなく環境変数を使用してください。クライアントをパラメータなしで初期化すると、自動的にこれらの値が選択されます。

Application Default Credentials (ADC)

標準的な Google Cloud 認証 のために以下の変数を設定してください:

export GOOGLE_CLOUD_PROJECT='your-project-id'
export GOOGLE_CLOUD_LOCATION='global'
export GOOGLE_GENAI_USE_VERTEXAI=true
  • デフォルトでは location="global" を使用して、グローバルエンドポイントにアクセスします。これにより、利用可能な容量を備えたリージョンへの自動ルーティングが提供されます。
  • ユーザーが特定のリージョン (例: us-central1europe-west4) を明確に指定する場合は、GOOGLE_CLOUD_LOCATION パラメータでそのリージョンを指定してください。必要に応じて サポート対象リージョンのドキュメント を参照してください。

Express モードの Agent Platform

Express Mode と API キーを使用する場合は以下の変数を設定してください:

export GOOGLE_API_KEY='your-api-key'
export GOOGLE_GENAI_USE_VERTEXAI=true

初期化

環境変数を選択するためにクライアントを引数なしで初期化します:

from google import genai
client = genai.Client()

または、クライアント作成時にパラメータをハードコードすることもできます。

from google import genai
client = genai.Client(vertexai=True, project="your-project-id", location="global")

モデル

  • gemini-3.1-pro-preview を複雑な推論、コーディング、研究に使用 (1M トークン)
    • 重要: gemini-3-pro-preview を使用しないでください
  • gemini-3-flash-preview を高速でバランスの取れたパフォーマンス、マルチモーダルに使用 (1M トークン)
  • gemini-3.1-flash-lite-preview を高頻度、軽量なタスクに使用 (1M トークン)
  • gemini-3-pro-image-preview を Nano Banana Pro 画像生成および編集に使用
  • gemini-3.1-flash-image-preview を Nano Banana 2 画像生成および編集に使用
  • gemini-live-2.5-flash-native-audio をネイティブオーディオを含む Live Realtime API に使用

以下のモデルは明確にリクエストされた場合のみ使用してください:

  • gemini-2.5-flash-image
  • gemini-2.5-flash
  • gemini-2.5-flash-lite
  • gemini-2.5-pro

[!IMPORTANT] gemini-2.0-*gemini-1.5-*gemini-1.0-*gemini-pro などのモデルはレガシーおよび非推奨です。上記の新しいモデルを使用してください。あなたの知識は古い可能性があります。 本番環境については、安定したモデルバージョン (例: gemini-3-flash) についてドキュメントを参照してください。

クイックスタート

Python

from google import genai
client = genai.Client()
response = client.models.generate_content(
    model="gemini-3-flash-preview",
    contents="Explain quantum computing"
)
print(response.text)

TypeScript/JavaScript

import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({ vertexai: { project: "your-project-id", location: "global" } });
const response = await ai.models.generateContent({
    model: "gemini-3-flash-preview",
    contents: "Explain quantum computing"
});
console.log(response.text);

Go

package main

import (
	"context"
	"fmt"
	"log"
	"google.golang.org/genai"
)

func main() {
	ctx := context.Background()
	client, err := genai.NewClient(ctx, &genai.ClientConfig{
		Backend:  genai.BackendVertexAI,
		Project:  "your-project-id",
		Location: "global",
	})
	if err != nil {
		log.Fatal(err)
	}

	resp, err := client.Models.GenerateContent(ctx, "gemini-3-flash-preview", genai.Text("Explain quantum computing"), nil)
	if err != nil {
		log.Fatal(err)
	}

	fmt.Println(resp.Text)
}

Java

import com.google.genai.Client;
import com.google.genai.types.GenerateContentResponse;

public class GenerateTextFromTextInput {
  public static void main(String[] args) {
    Client client = Client.builder().vertexAi(true).project("your-project-id").location("global").build();
    GenerateContentResponse response =
        client.models.generateContent(
            "gemini-3-flash-preview",
            "Explain quantum computing",
            null);

    System.out.println(response.text());
  }
}

C#/.NET

using Google.GenAI;

var client = new Client(
    project: "your-project-id",
    location: "global",
    vertexAI: true
);

var response = await client.Models.GenerateContent(
    "gemini-3-flash-preview",
    "Explain quantum computing"
);

Console.WriteLine(response.Text);

API 仕様とドキュメント (情報源)

Agent Platform の API 統合を実装またはデバッグする場合は、公式の Agent Platform ドキュメントを参照してください:

Agent Platform 上の Gen AI SDK は v1beta1 または v1 REST API エンドポイント (例: https://{LOCATION}-aiplatform.googleapis.com/v1beta1/projects/{PROJECT}/locations/{LOCATION}/publishers/google/models/{MODEL}:generateContent) を使用しています。

[!TIP] Developer Knowledge MCP Server を使用: search_documents または get_document ツールが利用可能な場合は、それらを使用してコンテキスト内で Google Cloud と Agent Platform の公式ドキュメントを直接検索および取得してください。これが最新の API 詳細とコードスニペットを取得するための推奨方法です。

ワークフローとコードサンプル

Python Docs Samples リポジトリ を参照して、追加のコードサンプルと特定の使用シナリオを確認してください。

特定のユーザーリクエストに応じて、詳細なコードサンプルと使用パターンについては、以下のリファレンスファイルを参照してください (Python の例):

  • テキストとマルチモーダル: チャット、マルチモーダル入力 (画像、ビデオ、オーディオ)、ストリーミング。references/text_and_multimodal.md を参照
  • 埋め込み: セマンティック検索用のテキスト埋め込みを生成。references/embeddings.md を参照
  • 構造化出力とツール: JSON 生成、関数呼び出し、検索グラウンディング、コード実行。references/structured_and_tools.md を参照
  • メディア生成: 画像生成、画像編集、ビデオ生成。references/media_generation.md を参照
  • バウンディングボックス検出: 画像とビデオ内のオブジェクト検出とローカライゼーション。references/bounding_box.md を参照
  • Live API: 音声、ビジョン、テキストのリアルタイム双方向ストリーミング。references/live_api.md を参照
  • 高度な機能: コンテンツキャッシング、バッチ予測、考思/推論。references/advanced_features.md を参照
  • 安全性: 責任あり AI フィルターと閾値の調整。references/safety.md を参照
  • モデルチューニング: 教師あり微調整と選好チューニング。references/model_tuning.md を参照

ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
google
リポジトリ
google/skills
ライセンス
Apache-2.0
最終更新
不明

Source: https://github.com/google/skills / ライセンス: Apache-2.0

関連スキル

OpenAILLM・AI開発⭐ リポ 6,054

agent-browser

AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。

by JimmyLv
汎用LLM・AI開発⭐ リポ 1,982

anyskill

AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 1,982

engram

AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 21,584

skyvern

AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。

by Skyvern-AI
汎用LLM・AI開発⭐ リポ 1,149

pinchbench

PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。

by pinchbench
汎用LLM・AI開発⭐ リポ 4,693

openui

OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。

by thesysdev
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: google · google/skills · ライセンス: Apache-2.0