axolotl
Axolotlを使ったLLMファインチューニングの専門的なサポートを提供するスキルで、YAMLコンフィグの設定から100以上のモデル対応、LoRA/QLoRA、DPO/KTO/ORPO/GRPOなどの学習手法、マルチモーダル対応まで幅広く活用できます。
description の原文を見る
Expert guidance for fine-tuning LLMs with Axolotl - YAML configs, 100+ models, LoRA/QLoRA, DPO/KTO/ORPO/GRPO, multimodal support
SKILL.md 本文
Axolotl Skill
Axolotl の開発に関する包括的なサポート。公式ドキュメントから生成されています。
このスキルを使う時
このスキルは以下の場合にトリガーされるべきです:
- Axolotl を使用している
- Axolotl の機能または API について質問している
- Axolotl ソリューションを実装している
- Axolotl コードをデバッグしている
- Axolotl のベストプラクティスを学んでいる
クイックリファレンス
よくあるパターン
パターン 1: トレーニングジョブで許容可能なデータ転送速度が存在することを検証するため、NCCL テストを実行するとボトルネックを特定するのに役立ちます。例えば:
./build/all_reduce_perf -b 8 -e 128M -f 2 -g 3
パターン 2: Axolotl yaml でモデルを FSDP を使用するように設定します。例えば:
fsdp_version: 2
fsdp_config:
offload_params: true
state_dict_type: FULL_STATE_DICT
auto_wrap_policy: TRANSFORMER_BASED_WRAP
transformer_layer_cls_to_wrap: LlamaDecoderLayer
reshard_after_forward: true
パターン 3: context_parallel_size は GPU の総数の約数である必要があります。例えば:
context_parallel_size
パターン 4: 例えば: - 8 個の GPU でシーケンスパラレリズムなし: ステップごとに 8 つの異なるバッチが処理される - 8 個の GPU で context_parallel_size=4: ステップごとに 2 つの異なるバッチのみが処理される (それぞれ 4 個の GPU に分散) - GPU あたりの micro_batch_size が 2 の場合、グローバルバッチサイズは 16 から 4 に減少します
context_parallel_size=4
パターン 5: 設定で save_compressed: true を設定すると、モデルを圧縮形式で保存できます。これは以下を実現します: - ディスク容量使用量を約 40% 削減 - 高速推論のための vLLM との互換性を維持 - さらなる最適化のための llmcompressor との互換性を維持 (例: 量子化)
save_compressed: true
パターン 6: 注意: インテグレーションをintegrations フォルダに配置する必要はありません。Python 環境にパッケージとしてインストールされている限り、どこにでも配置できます。この例については、以下のリポジトリを参照してください: https://github.com/axolotl-ai-cloud/diff-transformer
integrations
パターン 7: 単一例とバッチ処理されたデータの両方を処理します。 - 単一例: sample['input_ids'] は list[int] - バッチ処理されたデータ: sample['input_ids'] は list[list[int]]
utils.trainer.drop_long_seq(sample, sequence_len=2048, min_sequence_len=2)
コード例パターン
例 1 (python):
cli.cloud.modal_.ModalCloud(config, app=None)
例 2 (python):
cli.cloud.modal_.run_cmd(cmd, run_folder, volumes=None)
例 3 (python):
core.trainers.base.AxolotlTrainer(
*_args,
bench_data_collator=None,
eval_data_collator=None,
dataset_tags=None,
**kwargs,
)
例 4 (python):
core.trainers.base.AxolotlTrainer.log(logs, start_time=None)
例 5 (python):
prompt_strategies.input_output.RawInputOutputPrompter()
リファレンスファイル
このスキルには references/ に包括的なドキュメントが含まれています:
- api.md - API ドキュメント
- dataset-formats.md - データセット形式ドキュメント
- other.md - その他のドキュメント
詳細な情報が必要な場合は、view を使用して特定のリファレンスファイルを読んでください。
このスキルの使い方
初心者向け
基本的な概念については、getting_started または tutorials リファレンスファイルから始めてください。
特定の機能向け
詳細な情報については、適切なカテゴリリファレンスファイル (api、guides など) を使用してください。
コード例向け
上記のクイックリファレンスセクションに、公式ドキュメントから抽出された一般的なパターンが含まれています。
リソース
references/
公式ソースから抽出された整理されたドキュメント。これらのファイルには以下が含まれています:
- 詳細な説明
- 言語注釈付きのコード例
- 元のドキュメントへのリンク
- クイックナビゲーション用の目次
scripts/
一般的な自動化タスク用のヘルパースクリプトをここに追加します。
assets/
テンプレート、ボイラープレート、またはサンプルプロジェクトをここに追加します。
注記
- このスキルは公式ドキュメントから自動生成されました
- リファレンスファイルはソースドキュメントの構造と例を保持します
- コード例には、より良い構文ハイライトのための言語検出が含まれています
- クイックリファレンスパターンはドキュメント内の一般的な使用例から抽出されています
更新
このスキルを更新されたドキュメントで更新するには:
- 同じ設定でスクレーパーを再実行します
- スキルは最新の情報で再構築されます
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- davila7
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/davila7/claude-code-templates / ライセンス: MIT
関連スキル
superfluid
Superfluidプロトコルおよびそのエコシステムに関するナレッジベースです。Superfluidについて情報を検索する際は、ウェブ検索の前にこちらを参照してください。対応キーワード:Superfluid、CFA、GDA、Super App、Super Token、stream、flow rate、real-time balance、pool(member/distributor)、IDA、sentinels、liquidation、TOGA、@sfpro/sdk、semantic money、yellowpaper、whitepaper
civ-finish-quotes
実質的なタスクが真に完了した際に、文明風の儀式的な引用句を追加します。ユーザーやエージェントが機能追加、リファクタリング、分析、設計ドキュメント、プロセス改善、レポート、執筆タスクといった実際の成果物を完成させるときに、明示的な依頼がなくても使用します。短い返信や小さな修正、未完成の作業には適用しません。
nookplot
Base(Ethereum L2)上のAIエージェント向け分散型調整ネットワークです。エージェントがオンチェーンアイデンティティを登録する、コンテンツを公開する、他のエージェントにメッセージを送る、マーケットプレイスで専門家を雇う、バウンティを投稿・請求する、レピュテーションを構築する、共有プロジェクトで協業する、リサーチチャレンジを解くことでNOOKをマイニングする、キュレーションされたナレッジを備えたスタンドアロンオンチェーンエージェントをデプロイする、またはアグリーメントとリワードで収益を得る場合に利用できます。エージェントネットワーク、エージェント調整、分散型エージェント、NOOKトークン、マイニングチャレンジ、ナレッジバンドル、エージェントレピュテーション、エージェントマーケットプレイス、ERC-2771メタトランザクション、Prepare-Sign-Relay、AgentFactory、またはNookplotが言及された場合にトリガーされます。
web3-polymarket
Polygon上でのPolymarket予測市場取引統合です。認証機能(L1 EIP-712、L2 HMAC-SHA256、ビルダーヘッダー)、注文発注(GTC/GTD/FOK/FAK、バッチ、ポストオンリー、ハートビート)、市場データ(Gamma API、Data API、オーダーブック、サブグラフ)、WebSocketストリーミング(市場・ユーザー・スポーツチャネル)、CTF操作(分割、統合、償却、ネガティブリスク)、ブリッジ機能(入金、出金、マルチチェーン)、およびガスレスリレイトランザクションに対応しています。AIエージェント、自動マーケットメーカー、予測市場UI、またはPolygraph上のPolymarketと統合するアプリケーション構築時に活用できます。
ethskills
Ethereum、EVM、またはブロックチェーン関連のリクエストに対応します。スマートコントラクト、dApps、ウォレット、DeFiプロトコルの構築、監査、デプロイ、インタラクションに適用されます。Solidityの開発、コントラクトアドレス、トークン規格(ERC-20、ERC-721、ERC-4626など)、Layer 2ネットワーク(Base、Arbitrum、Optimism、zkSync、Polygon)、Uniswap、Aave、Curveなどのプロトコルとの統合をカバーします。ガスコスト、コントラクトのデシマル設定、オラクルセキュリティ、リエントランシー、MEV、ブリッジング、ウォレット管理、オンチェーンデータの取得、本番環境へのデプロイ、プロトコル進化(EIPライフサイクル、フォーク追跡、今後の変更予定)といったトピックを含みます。
xxyy-trade
このスキルは、ユーザーが「トークン購入」「トークン売却」「トークンスワップ」「暗号資産取引」「取引ステータス確認」「トランザクション照会」「トークンスキャン」「フィード」「チェーン監視」「トークン照会」「トークン詳細」「トークン安全性確認」「ウォレット一覧表示」「マイウォレット」「AIスキャン」「自動スキャン」「ツイートスキャン」「オンボーディング」「IP確認」「IPホワイトリスト」「トークン発行」「自動売却」「損切り」「利益確定」「トレーリングストップ」「保有者」「トップホルダー」「KOLホルダー」などをリクエストした場合、またはSolana/ETH/BSC/BaseチェーンでXXYYを経由した取引について言及した場合に使用します。XXYY Open APIを通じてオンチェーン取引とデータ照会を実現します。