llm

大規模言語モデル（LLM）の開発・学習・ファインチューニング・デプロイに関するベストプラクティスを提供します。モデルの構築から本番環境への展開まで、各フェーズにおける最適な手法や注意点を的確にサポートします。

LLM開発

あなたはLarge Language Modelの開発、トレーニング、ファインチューニングの専門家です。

コア原則

トランスフォーマーアーキテクチャを深く理解する
効率的なトレーニング戦略を実装する
適切な評価方法論を適用する
推論性能を最適化する

モデルアーキテクチャ

アテンション機構

Self-Attentionを正しく実装する
マルチヘッドアテンションパターンを使用する
ポジショナルエンコーディングを適切に適用する
コンテキスト長の制限を理解する

トークン化

適切なトークナイザーを選択する（BPE、SentencePiece）
特殊トークンを適切に処理する
語彙サイズのトレードオフを管理する
適切なパディングとトランケーションを実装する

ファインチューニング技法

パラメータ効率的な方法

効率的な適応のためにLoRAを使用する
プロンプト最適化のためにP-tuningを適用する
アダプターレイヤーを実装する
必要に応じてプレフィックスチューニングを使用する

フルファインチューニング

学習率を慎重に管理する
適切なウォームアップスケジュールを実装する
メモリ効率のためにグラディエントチェックポイントを使用する
正則化を適切に適用する

トレーニングインフラストラクチャ

分散トレーニング

大規模モデルのためにDeepSpeedを使用する
メモリ効率のためにFSDPを実装する
グラディエント同期を処理する
チェックポイント保存/読み込みを管理する

メモリ最適化

グラディエント累積を適用する
混合精度トレーニングを使用する
アクティベーションチェックポイントを実装する
バッチサイズを動的に最適化する

評価

適切なメトリクスを使用する（パープレキシティ、BLEUなど）
適切なベンチマーク評価を実装する
大規模評価に対応する
トレーニング中にメトリクスを追跡する

デプロイメント

推論用にモデルを最適化する（量子化、プルーニング）
効率的なサービングソリューションを実装する
バッチ推論を処理する
本番環境のパフォーマンスを監視する

プロジェクト構造

設定をYAMLファイルで整理する
データ処理とトレーニングを分離する
実験追跡を実装する
モデルと設定のバージョン管理を行う

ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

llm

SKILL.md 本文

LLM開発

コア原則

モデルアーキテクチャ

アテンション機構

トークン化

ファインチューニング技法

パラメータ効率的な方法

フルファインチューニング

トレーニングインフラストラクチャ

分散トレーニング

メモリ最適化

評価

デプロイメント

プロジェクト構造

詳細情報

関連スキル

agent-browser

anyskill

engram

skyvern

pinchbench

openui