deep-research
Google Gemini Deep Research Agentを活用して、複数ステップにわたる自律的なリサーチを実行します。市場分析、競合調査、文献レビュー、技術調査、デューデリジェンスなどに適しており、2〜10分かかりますが引用付きの詳細なレポートを生成します。1タスクあたり$2〜5のコストが発生します。
description の原文を見る
Execute autonomous multi-step research using Google Gemini Deep Research Agent. Use for: market analysis, competitive landscaping, literature reviews, technical research, due diligence. Takes 2-10 minutes but produces detailed, cited reports. Costs $2-5 per task.
SKILL.md 本文
Gemini Deep Research スキル
計画、検索、読み取り、情報統合を自動で実行し、包括的なレポートを生成するリサーチタスクを実行します。
要件
- Python 3.8以上
- httpx:
pip install -r requirements.txt - GEMINI_API_KEY 環境変数
セットアップ
- Google AI Studio から Gemini API キーを取得する
- 環境変数を設定する:
またはスキルディレクトリにexport GEMINI_API_KEY=your-api-key-here.envファイルを作成する
使用方法
リサーチタスクを開始
python3 scripts/research.py --query "Research the history of Kubernetes"
構造化された出力形式で実行
python3 scripts/research.py --query "Compare Python web frameworks" \
--format "1. Executive Summary\n2. Comparison Table\n3. Recommendations"
リアルタイムで進行状況をストリーミング
python3 scripts/research.py --query "Analyze EV battery market" --stream
待たずに開始
python3 scripts/research.py --query "Research topic" --no-wait
実行中のリサーチのステータスを確認
python3 scripts/research.py --status <interaction_id>
完了まで待機
python3 scripts/research.py --wait <interaction_id>
前回のリサーチから続行
python3 scripts/research.py --query "Elaborate on point 2" --continue <interaction_id>
最近のリサーチを一覧表示
python3 scripts/research.py --list
出力形式
- デフォルト: 人間が読める Markdown レポート
- JSON (
--json): プログラム的に使用する構造化データ - Raw (
--raw): 処理されていない API レスポンス
コストと時間
| メトリック | 値 |
|---|---|
| 時間 | タスクあたり 2~10 分 |
| コスト | タスクあたり $2~5(複雑さにより変動) |
| トークン使用量 | 入力:約 250k~900k、出力:約 60k~80k |
最適なユースケース
- 市場分析と競争環境調査
- 技術文献レビュー
- デューディリジェンスリサーチ
- 履歴と時系列の調査
- 比較分析(フレームワーク、製品、技術)
ワークフロー
- ユーザーがリサーチをリクエスト →
--query "..."を実行 - ユーザーに推定時間(2~10 分)を通知
--streamで監視するか、--statusでポーリング- フォーマット済みの結果を返す
- フォローアップの質問に
--continueを使用
終了コード
- 0: 成功
- 1: エラー(API エラー、設定の問題、タイムアウト)
- 130: ユーザーによってキャンセル(Ctrl+C)
ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- sanjay3290
- リポジトリ
- sanjay3290/ai-skills
- ライセンス
- Apache-2.0
- 最終更新
- 不明
Source: https://github.com/sanjay3290/ai-skills / ライセンス: Apache-2.0
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。