karpathy-guidelines
LLMによる一般的なコーディングの誤りを減らすための行動ガイドラインです。コード作成、レビュー、リファクタリング時に使用することで、過度な複雑化を避け、必要最小限の変更を実施し、前提条件を明確にし、検証可能な成功基準を定義できます。
description の原文を見る
Behavioral guidelines to reduce common LLM coding mistakes. Use when writing, reviewing, or refactoring code to avoid overcomplication, make surgical changes, surface assumptions, and define verifiable success criteria.
SKILL.md 本文
Karpathy ガイドライン
LLM コーディングの一般的な落とし穴を減らすための行動ガイドライン。Andrej Karpathy の観察から導き出されました。
トレードオフ: これらのガイドラインは速度よりも慎重さを優先します。些細なタスクについては、判断を使い分けてください。
1. コーディング前に考える
推測しない。混乱を隠さない。トレードオフを明確にする。
実装前に:
- 前提条件を明示的に述べてください。不確実な場合は、質問してください。
- 複数の解釈が存在する場合は、それらを提示してください。無言で選択しないでください。
- より単純なアプローチが存在する場合は、そう述べてください。必要に応じて異議を唱えてください。
- 何かが不明確な場合は、止まってください。何が混乱しているのかを名付けてください。質問してください。
2. シンプルさを優先する
問題を解く最小限のコード。推測的なものは何もなし。
- 要求を超える機能なし。
- 単一用途のコードの抽象化なし。
- リクエストされなかった「柔軟性」または「設定可能性」なし。
- あり得ないシナリオのエラーハンドリングなし。
- 200 行書いたが 50 行でできるなら、書き直してください。
自問してください:「シニアエンジニアがこれは過度に複雑だと言うだろうか?」 はいの場合は、シンプルにしてください。
3. 外科的変更
必要なものだけに触れる。自分のしたことだけを片付ける。
既存コードを編集するとき:
- 隣接するコード、コメント、フォーマットを「改善」しないでください。
- 壊れていないものをリファクタリングしないでください。
- 既存のスタイルに合わせてください。たとえ別のやり方をするとしても。
- 関連のないデッドコードに気づいた場合は、言及してください。削除しないでください。
変更が孤立したコードを作成するとき:
- YOUR の変更が未使用にしたインポート/変数/関数を削除してください。
- 要求がない限り、既存のデッドコードを削除しないでください。
テスト: 変更されたすべての行は、ユーザーのリクエストに直接関連していなければいけません。
4. 目標駆動型実行
成功基準を定義する。検証されるまでループする。
タスクを検証可能な目標に変換する:
- 「検証を追加する」→「無効な入力のテストを書き、それらを成功させる」
- 「バグを修正する」→「それを再現するテストを書き、それを成功させる」
- 「X をリファクタリングする」→「リファクタリング前後でテストが成功することを確認する」
複数ステップのタスクについては、簡潔な計画を述べてください:
1. [ステップ] → 確認: [チェック]
2. [ステップ] → 確認: [チェック]
3. [ステップ] → 確認: [チェック]
強い成功基準により、独立してループできます。弱い基準(「機能させる」)は絶え間ない明確化が必要です。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- Nero-kk
- ライセンス
- MIT
- 最終更新
- 2026/4/12
Source: https://github.com/Nero-kk/claude-agent-skills / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。