checking-freshness
データの鮮度をすばやく確認するスキルです。ユーザーがデータの最新性を問い合わせたり、テーブルの最終更新日時を知りたい場合、データが古くなっていないか、または利用前にデータの有効性を検証する必要があるときに使用します。
description の原文を見る
Quick data freshness check. Use when the user asks if data is up to date, when a table was last updated, if data is stale, or needs to verify data currency before using it.
SKILL.md 本文
データ鮮度チェック
データが使用に十分なほど最新かどうかをすばやく判定します。
鮮度チェックプロセス
チェック対象の各テーブルについて:
1. タイムスタンプ列を見つける
データがいつロードまたは更新されたかを示す列を探します:
_loaded_at,_updated_at,_created_at(一般的な ETL パターン)updated_at,created_at,modified_at(アプリケーションタイムスタンプ)load_date,etl_timestamp,ingestion_timedate,event_date,transaction_date(ビジネス日付)
列名を確認する必要がある場合は、INFORMATION_SCHEMA.COLUMNS をクエリします。
2. 最後の更新時刻をクエリする
SELECT
MAX(<timestamp_column>) as last_update,
CURRENT_TIMESTAMP() as current_time,
TIMESTAMPDIFF('hour', MAX(<timestamp_column>), CURRENT_TIMESTAMP()) as hours_ago,
TIMESTAMPDIFF('minute', MAX(<timestamp_column>), CURRENT_TIMESTAMP()) as minutes_ago
FROM <table>
3. 時間別の行数をチェック
定期的に更新されるテーブルの場合、最近のアクティビティをチェックします:
SELECT
DATE_TRUNC('day', <timestamp_column>) as day,
COUNT(*) as row_count
FROM <table>
WHERE <timestamp_column> >= DATEADD('day', -7, CURRENT_DATE())
GROUP BY 1
ORDER BY 1 DESC
鮮度ステータス
このスケールを使用してステータスを報告します:
| ステータス | 経過時間 | 意味 |
|---|---|---|
| Fresh | 4 時間未満 | データは最新 |
| Stale | 4~24 時間 | 古い可能性がある。期待通りかを確認 |
| Very Stale | 24 時間超 | バッチジョブでない限り、問題の可能性が高い |
| Unknown | タイムスタンプなし | 鮮度を判定できない |
データが古い場合
ソースパイプラインについて Airflow をチェックします:
-
DAG を見つける: このテーブルにデータを入力する DAG は何か?
af dags listを使用して、一致する名前を探します。 -
DAG ステータスをチェック:
- DAG が一時停止中?
af dags get <dag_id>を使用 - 前回の実行に失敗?
af dags statsを使用 - 現在実行中のランはあるか?
- DAG が一時停止中?
-
必要に応じて診断: DAG が失敗した場合、debugging-dags スキルを使用して調査します。
Astro の場合
Astro で実行している場合は、以下も可能です:
- Astro UI の DAG 履歴: デプロイメントの DAG 実行履歴を確認して、最近の実行とその結果をビジュアルタイムラインで表示
- SLA 監視向け Astro アラート: DAG が期待される完了ウィンドウを逃したときに通知を受け取るアラートを設定し、ユーザーが報告する前に古さをキャッチ
OSS Airflow の場合
- Airflow UI: DAGs ビューとタスクログを使用して、最後の成功した実行と SLA ミスを確認
出力形式
わかりやすくスキャン可能なレポートを提供します:
鮮度レポート
================
テーブル: database.schema.table_name
最後の更新: 2024-01-15 14:32:00 UTC
経過時間: 2 時間 15 分
ステータス: Fresh
テーブル: database.schema.other_table
最後の更新: 2024-01-14 03:00:00 UTC
経過時間: 37 時間
ステータス: Very Stale
ソース DAG: daily_etl_pipeline (失敗)
アクション: **debugging-dags** スキルで調査
クイックチェック
ユーザーが単純なはい/いいえの答えを望んでいる場合:
- 「X は最新か?」-> チェックして、ステータス + 1 行で応答
- 「朝 9 時のミーティングに X を使用できるか?」-> チェックしてコンテキスト付きではっきりしたはい/いいえで回答
ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- astronomer
- リポジトリ
- astronomer/agents
- ライセンス
- Apache-2.0
- 最終更新
- 不明
Source: https://github.com/astronomer/agents / ライセンス: Apache-2.0
関連スキル
hugging-face-trackio
Trackioを使用してMLトレーニング実験を追跡・可視化できます。トレーニング中のメトリクスログ記録(Python API)、トレーニング診断のアラート発火、ログされたメトリクスの取得・分析(CLI)が必要な場合に活用してください。リアルタイムダッシュボード表示、Webhookを使用したアラート、HF Space同期、自動化向けのJSON出力に対応しています。
btc-bottom-model
ビットコインのサイクルタイミングモデルで、加重スコアリングシステムを搭載しています。日次パルス(4指標、32ポイント)とウィークリー構造(9指標、68ポイント)の2カテゴリーにわたる13の指標を追跡し、0~100のマーケットヒートスコアを算出します。ETFフロー、ファンディングレート、ロング/ショート比率、恐怖・貪欲指数、LTH-MVRV、NUPL、SOPR(LTH+STH)、LTH供給率、移動平均倍率(365日MA、200週MA)、週次RSI、出来高トレンドに対応します。市場サイクル全体を通じて買いと売りの両方の推奨を提供します。ビットコインの底値拾い、BTCサイクルポジション、買い時・売り時、オンチェーン指標、MVRV、NUPL、SOPR、LTH動向、ETFの流出入、ファンディングレート、恐怖指数、ビットコインが過熱状態か、マイナーコスト、暗号資産市場のセンチメント、BTCのポジションサイジング、「今ビットコインを買うべきか」「BTCが天井をつけているか」「オンチェーン指標は何を示しているか」といった質問の際にこのスキルを活用します。
protein_solubility_optimization
タンパク質の溶解性最適化 - タンパク質の溶解性を最適化します。タンパク質の特性を計算し、溶解性と親水性を予測し、有効な変異を提案します。タンパク質配列の特性計算、タンパク質機能の予測、親水性計算、ゼロショット配列予測を含むタンパク質エンジニアリング業務に使用できます。3つのSCPサーバーから4つのツールを統合しています。
research-lookup
Parallel Chat APIまたはPerplexity sonar-pro-searchを使用して、最新の研究情報を検索できます。学術論文の検索にも対応しています。クエリは自動的に最適なバックエンドにルーティングされるため、論文の検索、研究データの収集、科学情報の検証に活用できます。
tree-formatting
ggtree(R)またはiTOL(ウェブ)を使用して、系統樹の可視化とフォーマットを行います。系統樹を図として描画する際、ツリーレイアウトの選択、分類学に基づく枝やラベルの色付け、クレードの折りたたみ、サポート値の表示、またはツリーへのオーバーレイ追加が必要な場合に使用してください。系統推定(protein-phylogenyスキルを使用)やドメイン注釈(今後の独立したスキル)には使用しないでください。
querying-indonesian-gov-data
インドネシア政府の50以上のAPIとデータソースに接続できます。BPJPH(ハラール認証)、BOM(食品安全)、OJK(金融適正性)、BPS(統計)、BMKG(気象・地震)、インドネシア中央銀行(為替レート)、IDX(株式)、CKAN公開データポータル、pasal.id(第三者法MCP)に対応しています。インドネシア政府データを活用したアプリ開発、.go.idウェブサイトのスクレイピング、ハラール認証の確認、企業の法的適正性の検証、金融機関ステータスの照会、またはインドネシアMCPサーバーへの接続時に使用できます。CSRF処理、CKAN API使用方法、IP制限回避など、すぐに実行可能なPythonパターンを含んでいます。