agent-device
iOS・tvOS・macOS・Android など各種デバイス上でのアプリ操作を自動化します。アプリ内のナビゲーション、スクリーンショット取得、タップ・テキスト入力・スクロール操作、UI情報の抽出、ログ/ネットワーク/パフォーマンスデータの収集、またはagent-device CLIコマンドの立案が必要な際に使用します。
description の原文を見る
Automates Apple-platform apps (iOS, tvOS, macOS) and Android devices. Use when navigating apps, taking snapshots/screenshots, tapping, typing, scrolling, extracting UI info, collecting logs/network/perf evidence, or planning agent-device CLI commands.
SKILL.md 本文
agent-device
ルーター専用。このスキルを使用する前にプライベート設定が必要です:
agent-device --version
これが失敗するが、ユーザーが agent-device をグローバルにインストールしている可能性がある場合は、npx を使用する前にユーザーの設定されたログイン/インタラクティブシェルと環境を確認してください。ユーザーが通常のターミナルセッションから実行する場合と同じ方法でコマンドを解決し、見つかった場合は絶対バイナリパスを実行してください。これにはシェルスタートアップ動作またはパッケージマネージャー/グローバルbin ロケーションの検査が必要になる場合があります。Codex プロセスの PATH がユーザーの PATH と同じであると想定しないでください。
agent-device >= 0.14.0 が必要です。古い CLI ではこれらのヘルプトピックが不足しています。古い場合は停止し、ユーザーに信頼できるインストールのアップグレード、または正確なバージョン npm コマンドの承認を指示してください。npm install -g agent-device@latest または npx -y agent-device@latest を自律的に実行しないでください。また、最終的な計画にバージョン/アップグレードコマンドを含めないでください。
最初の agent-device コマンドまたは計画の前に、バージョン一致の CLI ガイドを読んでください:
agent-device help workflow
関連する場合のみエスカレートしてください:
agent-device help debugging
agent-device help react-native
agent-device help react-devtools
agent-device help remote
agent-device help macos
agent-device help dogfood
デフォルトループ: open -> snapshot/-i -> get/is/find または press/fill/scroll/wait -> verify -> close。
このスキルはバージョン一致の CLI ヘルプにルーティングするためにのみ使用してください。help workflow に正確なコマンド形式、プラットフォーム制限、および現在のワークフロー指針を提供させてください。
正確な位置ワークフローについては、計画する前にインストール済みの settings ヘルプを読んで、座標サポートとプラットフォーム制限がアクティブな CLI バージョンから取得されるようにしてください。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- callstackincubator
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/callstackincubator/agent-device / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。