dask-mcp-docs-first
DaskのPythonコードを生成または確認する際は、インデックス化されたMCPドキュメントを参照した上で、厳密なバージョン検索と焦点を絞ったクエリテンプレートを使用して、最新のAPIとベストプラクティスに対応します。
description の原文を見る
Generate or review Dask Python code only after consulting indexed MCP documentation, using strict version lookup and focused query templates for current APIs and best practices.
SKILL.md 本文
Dask MCP Docs First
このスキルは、Dask を使用する Python コードを記述、修正、確認、または説明する際に使用します。
使用場面
以下に適用します:
dask.dataframedask.array- 分散クライアント/スケジューラの使用
- Dask での Parquet または S3 ワークフロー
- Dask + Datashader パイプライン
- パフォーマンスおよびベストプラクティスに関する質問
手順
1. インデックス化された Dask バージョンを最初に解決する
常に以下から開始してください:
mcp_docs_find_version(library="dask")
最適なマッチを記録します。バージョン指定されていないドキュメントも利用可能な場合は、タスクが特定のバージョンを必要としない限り、現在のリファレンスとして扱います。
2. コーディング前に、フォーカスされたドキュメントクエリを実行する
広い検索に頼らないでください。要求された操作に合わせた複数のターゲット化されたクエリを使用します。
コア取り込み/データフレームクエリ
read_parquet partitionsread_parquet storage optionsdataframe best practicespersist best practicesrepartition partition sizemap_partitions metadatacategorize dataframe
分散実行クエリ
distributed client schedulerlocalcluster exampleclient persist computeavoid large graphdashboard diagnostics
パフォーマンス/正確性クエリ
best practices avoid full shuffleknown divisions set_indexlazy evaluation compute persistmetadata meta parameterpartition size guidance
Array/混合ワークロードクエリ
dask array chunking best practicesoverlap map_blocksarray persist compute
Dask + Datashader クエリ
datashader dask dataframe aggregationpoints canvas daskshade export image
3. 重要な結果の場合はより深いページコンテンツを取得する
回答の中核として表示されるすべての結果について、ページを取得して詳しく読んでください:
mcp_docs_fetch_url(url="<result-url>")
4. グラウンディング後にのみコードを記述する
MCP の結果を使用して以下を決定します:
- API 名
- 引数名
- 推奨されるワークフローの順序
persist()、compute()、再パーティショニング、メタデータヒント、または分散クライアントを使用するかどうか
5. Dask コードの出力標準
コードを返すときは:
- すべてのインポートを明示的に含める
- 廃止予定の API や推測された API を避ける
- タスクが本当により複雑さを必要としない限り、グラフをシンプルに保つ
- パーティション認識コードを優先する
- pandas への即座な変換を避ける
- 関連がある場合は、参照した Dask ドキュメントのバージョンを簡潔に記載する
記載例:
Dask 2024.0.0 / 現在インデックス化されたドキュメントの MCP 結果に基づきます。
6. 最終化前の必須確認チェックリスト
Dask コードを提示する前に、以下を確認してください:
- インデックス化された Dask バージョンを検索しましたか?
- メモリから答えるのではなく、正確な API/トピックを検索しましたか?
- 不要な
.compute()呼び出しを避けましたか? - パーティションサイジング/再パーティショニングを関連する場所で検討しましたか?
- 非常に大きなグラフを作成する可能性のあるパターンを避けましたか?
map_partitionsを使用している場合、メタデータ処理を確認しましたか?
落とし穴
- MCP ドキュメントが利用可能な場合、メモリから Dask API に関する質問に答えないでください。
- ユーザーが明示的にメモリ内ローカル結果を望まない限り、
read_parquetから.compute()に直接進まないでください。 - 曖昧な検索クエリ 1 つを使用して停止しないでください。
map_partitionsスタイルの変換に対するメタデータ要件を無視しないでください。- 古いブログ投稿のイディオムが現在の Dask ベストプラクティスと同じであると仮定しないでください。
検証
mcp_docs_find_version(library="dask")が最初にチェックされました。- コーディング前に、少なくとも 2 つのフォーカスされた Dask ドキュメントクエリが使用されました。
- 最終的なコードは取得したドキュメントに準拠し、現在の Dask ベストプラクティスに従っています。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- arm2arm
- ライセンス
- MIT
- 最終更新
- 2026/5/7
Source: https://github.com/arm2arm/AstroAgentAssistant / ライセンス: MIT