Agent Skills by ALSEL
汎用LLM・AI開発⭐ リポ 2品質スコア 59/100

flow-map-trajectory-tilting

フロー地図をルックアヘッド演算子として使用し、ノイジング除去の各ステップで軌跡の終点を予測することで、報酬ガイド付き拡散を実現します。生成プロセス全体で意味のある勾配を保ちながら、拡散軌跡に報酬や嗜好を適用する場合に活用できます。

description の原文を見る

Uses flow maps as look-ahead operators to enable principled reward-guided diffusion by predicting trajectory endpoints at any denoising step. Deploy when applying rewards or preferences to diffusion trajectories with meaningful gradients throughout generation.

SKILL.md 本文

注意: このスキルのライセンスは ライセンス未確認 です。本サイトでは本文プレビューのみを表示しています。利用前に GitHub の原本でライセンス条件をご確認ください。

概要

Test-Time Scaling of Diffusions は Flow Map Trajectory Tilting (FMTT) を導入しており、フローマップを「先読み」演算子として活用することで、原理に基づいた報酬ガイダンス生成を実現します。ヒューリスティックなノイズ除去器の近似を用いる代わりに、FMTT はフローマップを使用して、生成プロセス中のあらゆるポイントで軌跡がどこに到達するかを正確に予測し、ノイズ除去全体を通じて意味のある報酬勾配を実現します。

コア技術

予測器としてのフローマップ: フローマップ φ_t は、任意のタイムステップ t における最終出力を予測します。勾配をヒューリスティックに近似する代わりに、FMTT はフローマップを使用して「この報酬の方向に一歩進めば、この軌跡はどこに到達するのか?」という計算を行います。これにより、ノイズ除去全体を通じて正確な報酬信号が実現されます。

軌跡重要度重み付け: 報酬ガイダンス用の重要度重みは、フローマップ軌跡に沿った報酬の積分に帰着します (命題 2.2)。この原理に基づいた重み付けにより、初期段階の軌跡決定が、後段の洗練に対して適切にペナルティを受けます。

報酬勾配計算: フローマップ予測を通じてバックプロパゲーションを行い、dℒ/dz_t を計算します。勾

...

詳細情報

作者
ADu2021
リポジトリ
ADu2021/skillXiv
ライセンス
不明
最終更新
2026/3/26

Source: https://github.com/ADu2021/skillXiv / ライセンス: 未指定

本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: ADu2021 · ADu2021/skillXiv · ライセンス: ライセンス未確認