dagster-expert
Dagsterおよび`dg` CLIに関する専門的なガイダンスを提供するスキルです。アセット、マテリアライゼーション、コンポーネント、データツール、データパイプラインに関わる作業や、Dagster固有の知識が必要なタスクを行う前には必ず使用してください。新規プロジェクトの作成、定義の追加、プロジェクト構造の把握、アセット・スケジュール・センサー・コンポーネント・ジョブ定義の検索、問題のデバッグ、特定のDagsterコンセプトに関する詳細情報の提供など、幅広い用途に対応します。
description の原文を見る
Expert guidance for working with Dagster and the dg CLI. ALWAYS use before doing any task that requires knowledge specific to Dagster, or that references assets, materialization, components, data tools or data pipelines. Common tasks may include creating a new project, adding new definitions, understanding the current project structure, answering general questions about the codebase (finding asset, schedule, sensor, component or job definitions), debugging issues, or providing deep information about a specific Dagster concept.
SKILL.md 本文
Dagster のコア概念
簡潔な定義のみ(詳細な例はリファレンスファイルを参照):
- Asset: パイプラインによって生成される永続的なオブジェクト(テーブル、ファイル、モデルなど)
- Component: 特定のドメインに関連する定義(アセット、スケジュール、センサー、ジョブなど)を生成する再利用可能な構成要素。
統合ワークフロー
ANY の外部ツールやサービスと統合する場合は、Integration libraries index を読んでください。このドキュメントには、どの統合ライブラリが存在するか、および公開されたライブラリが存在しないツール用のカスタム統合を作成する方法に関する情報が含まれています。
dg CLI
dg CLI は、Dagster と プログラム的にやりとりするための推奨方法です(定義の追加、実行の起動、プロジェクト構造の探索など)。これは dagster-dg-cli パッケージの一部として インストールされます。特定のタスクに関連する CLI コマンドが存在する場合は、常にそれを使用するよう試みてください。
既存のプロジェクト構造は、ユーザーの目標を達成するために厳密に必要な場合にのみ探索してください。多くの場合、既存の CLI ツールはプロジェクト構造を十分に理解しているため、既存ファイルのリストと読み取りは無駄で不要です。
ほとんどの dg コマンドが情報を返す場合、--json フラグを使用して機械可読形式で情報を取得できます。ユーザーに直接情報を表示する場合を除き、デフォルトの表形式出力より --json を優先すべきです。
UV 互換性
プロジェクトは通常、依存関係管理に uv を使用し、可能な限り dg コマンドで使用することが推奨されます:
uv run dg list defs
uv run dg launch --assets my_asset
重大: 回答前に必ずリファレンスファイルを読む
メモリからの回答や CLI コマンド、API、構文の推測は絶対にしないでください。回答する前に、以下のリファレンス インデックスを使用して関連するリファレンス ファイルを必ず読んでください。
すべての質問に対して、インデックスの説明を使用して関連するリファレンス ファイルを特定し、それらを読んでから、読んだ内容に基づいて回答してください。
リファレンス インデックス
<!-- BEGIN GENERATED INDEX -->Asset Selection Syntax— タグ、グループ、種類、上流、下流によるアセットのフィルタリング;Python での AssetSelection、UI 検索バー、または CLIEnvironment Variables— 異なる環境全体での環境変数の設定Asset Patterns— アセット定義、依存関係、メタデータ、パーティション、またはマルチアセット定義の定義Choosing an Automation Approach— スケジュール、センサー、宣言型自動化の間での決定Schedules— cron 式を使用した時間ベースの自動化Declarative Automation— AutomationCondition を使用したアセット中心の条件ベースの自動化Asset Sensors— アセット マテリアライゼーション イベントのトリガーBasic Sensors— ファイル監視またはカスタム ポーリングを使用したイベント駆動型自動化Run Status Sensors— 実行の成功、失敗、またはその他のステータス変更への対応dg check— プロジェクト設定または定義の検証create-dagster— ゼロから Dagster プロジェクトを作成dg dev— ローカル Dagster 開発インスタンスの起動dg launch— アセットのマテリアライゼーションまたはジョブの実行dg list components— スキャフォルディング用の利用可能なコンポーネント タイプの確認dg list defs— 登録されている定義のリストまたはフィルタリングDagster Plus API— dg api、Dagster Plus リソース(アセット、実行、デプロイメント、コードロケーション、スケジュール、センサー、シークレット、問題など)のプログラム的なクエリまたは管理dg list— プロジェクト構造の探索(コンポーネントツリー、環境変数、ワークスペースプロジェクト)Dagster Plus CLI— dg plus、Dagster Plus 認証、設定、デプロイメント;ログイン、設定の設定、API トークンの作成、コードのデプロイ、環境変数の取得、dbt マニフェストの管理dg scaffold component— カスタム再利用可能なコンポーネント タイプの作成dg scaffold defs— プロジェクトへの新しい定義(アセット、スケジュール、センサー、コンポーネント)の追加dg utilities— dg utils、コンポーネント タイプの検査、統合の表示、ステートバック コンポーネント キャッシュの更新Creating Components— ゼロからカスタム コンポーネントを構築Designing Component Integrations— 外部サービスまたはツールをラップするコンポーネントの設計;カスタム統合Resolved Framework— Resolver、Model、または Resolvable を使用したカスタム YAML スキーマタイプの定義Subclassing Components— 既存のコンポーネントをサブクラス化して拡張;dagster 統合コンポーネントをカスタマイズTemplate Variables— コンポーネント YAML で Jinja2 テンプレート変数を使用(env、dg、context、またはカスタムスコープ)Creating State-Backed Components— 外部ステートをフェッチしてキャッシュするコンポーネントの構築Using State-Backed Components— 本番環境、CI/CD、またはステートのリフレッシュでのステートバック コンポーネント管理Deployment Configuration Files— build.yaml、container_context.yaml、dagster_cloud.yaml;Dagster Plus デプロイメント設定;Docker レジストリ、コンテナコンテキスト、エージェント キューの設定;ハイブリッド デプロイメント ファイルIntegration libraries index for 40+ tools and technologies (dbt, Fivetran, Snowflake, AWS, etc.).— 統合、外部ツール、dagster-*;dbt、fivetran、airbyte、snowflake、bigquery、sling、aws、gcpMigration Guides— センサーから宣言型自動化への移行、センサーから自動化条件への移行
ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- dagster-io
- リポジトリ
- dagster-io/skills
- ライセンス
- Apache-2.0
- 最終更新
- 不明
Source: https://github.com/dagster-io/skills / ライセンス: Apache-2.0
関連スキル
hugging-face-trackio
Trackioを使用してMLトレーニング実験を追跡・可視化できます。トレーニング中のメトリクスログ記録(Python API)、トレーニング診断のアラート発火、ログされたメトリクスの取得・分析(CLI)が必要な場合に活用してください。リアルタイムダッシュボード表示、Webhookを使用したアラート、HF Space同期、自動化向けのJSON出力に対応しています。
btc-bottom-model
ビットコインのサイクルタイミングモデルで、加重スコアリングシステムを搭載しています。日次パルス(4指標、32ポイント)とウィークリー構造(9指標、68ポイント)の2カテゴリーにわたる13の指標を追跡し、0~100のマーケットヒートスコアを算出します。ETFフロー、ファンディングレート、ロング/ショート比率、恐怖・貪欲指数、LTH-MVRV、NUPL、SOPR(LTH+STH)、LTH供給率、移動平均倍率(365日MA、200週MA)、週次RSI、出来高トレンドに対応します。市場サイクル全体を通じて買いと売りの両方の推奨を提供します。ビットコインの底値拾い、BTCサイクルポジション、買い時・売り時、オンチェーン指標、MVRV、NUPL、SOPR、LTH動向、ETFの流出入、ファンディングレート、恐怖指数、ビットコインが過熱状態か、マイナーコスト、暗号資産市場のセンチメント、BTCのポジションサイジング、「今ビットコインを買うべきか」「BTCが天井をつけているか」「オンチェーン指標は何を示しているか」といった質問の際にこのスキルを活用します。
protein_solubility_optimization
タンパク質の溶解性最適化 - タンパク質の溶解性を最適化します。タンパク質の特性を計算し、溶解性と親水性を予測し、有効な変異を提案します。タンパク質配列の特性計算、タンパク質機能の予測、親水性計算、ゼロショット配列予測を含むタンパク質エンジニアリング業務に使用できます。3つのSCPサーバーから4つのツールを統合しています。
research-lookup
Parallel Chat APIまたはPerplexity sonar-pro-searchを使用して、最新の研究情報を検索できます。学術論文の検索にも対応しています。クエリは自動的に最適なバックエンドにルーティングされるため、論文の検索、研究データの収集、科学情報の検証に活用できます。
tree-formatting
ggtree(R)またはiTOL(ウェブ)を使用して、系統樹の可視化とフォーマットを行います。系統樹を図として描画する際、ツリーレイアウトの選択、分類学に基づく枝やラベルの色付け、クレードの折りたたみ、サポート値の表示、またはツリーへのオーバーレイ追加が必要な場合に使用してください。系統推定(protein-phylogenyスキルを使用)やドメイン注釈(今後の独立したスキル)には使用しないでください。
querying-indonesian-gov-data
インドネシア政府の50以上のAPIとデータソースに接続できます。BPJPH(ハラール認証)、BOM(食品安全)、OJK(金融適正性)、BPS(統計)、BMKG(気象・地震)、インドネシア中央銀行(為替レート)、IDX(株式)、CKAN公開データポータル、pasal.id(第三者法MCP)に対応しています。インドネシア政府データを活用したアプリ開発、.go.idウェブサイトのスクレイピング、ハラール認証の確認、企業の法的適正性の検証、金融機関ステータスの照会、またはインドネシアMCPサーバーへの接続時に使用できます。CSRF処理、CKAN API使用方法、IP制限回避など、すぐに実行可能なPythonパターンを含んでいます。