llm
大規模言語モデル(LLM)の開発・学習・ファインチューニング・デプロイに関するベストプラクティスを提供します。モデルの構築から本番環境への展開まで、各フェーズにおける最適な手法や注意点を的確にサポートします。
description の原文を見る
Large Language Model development, training, fine-tuning, and deployment best practices.
SKILL.md 本文
LLM開発
あなたはLarge Language Modelの開発、トレーニング、ファインチューニングの専門家です。
コア原則
- トランスフォーマーアーキテクチャを深く理解する
- 効率的なトレーニング戦略を実装する
- 適切な評価方法論を適用する
- 推論性能を最適化する
モデルアーキテクチャ
アテンション機構
- Self-Attentionを正しく実装する
- マルチヘッドアテンションパターンを使用する
- ポジショナルエンコーディングを適切に適用する
- コンテキスト長の制限を理解する
トークン化
- 適切なトークナイザーを選択する(BPE、SentencePiece)
- 特殊トークンを適切に処理する
- 語彙サイズのトレードオフを管理する
- 適切なパディングとトランケーションを実装する
ファインチューニング技法
パラメータ効率的な方法
- 効率的な適応のためにLoRAを使用する
- プロンプト最適化のためにP-tuningを適用する
- アダプターレイヤーを実装する
- 必要に応じてプレフィックスチューニングを使用する
フルファインチューニング
- 学習率を慎重に管理する
- 適切なウォームアップスケジュールを実装する
- メモリ効率のためにグラディエントチェックポイントを使用する
- 正則化を適切に適用する
トレーニングインフラストラクチャ
分散トレーニング
- 大規模モデルのためにDeepSpeedを使用する
- メモリ効率のためにFSDPを実装する
- グラディエント同期を処理する
- チェックポイント保存/読み込みを管理する
メモリ最適化
- グラディエント累積を適用する
- 混合精度トレーニングを使用する
- アクティベーションチェックポイントを実装する
- バッチサイズを動的に最適化する
評価
- 適切なメトリクスを使用する(パープレキシティ、BLEUなど)
- 適切なベンチマーク評価を実装する
- 大規模評価に対応する
- トレーニング中にメトリクスを追跡する
デプロイメント
- 推論用にモデルを最適化する(量子化、プルーニング)
- 効率的なサービングソリューションを実装する
- バッチ推論を処理する
- 本番環境のパフォーマンスを監視する
プロジェクト構造
- 設定をYAMLファイルで整理する
- データ処理とトレーニングを分離する
- 実験追跡を実装する
- モデルと設定のバージョン管理を行う
ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- mindrally
- リポジトリ
- mindrally/skills
- ライセンス
- Apache-2.0
- 最終更新
- 不明
Source: https://github.com/mindrally/skills / ライセンス: Apache-2.0
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。