data-jupyter-python
pandas、matplotlib、seaborn、numpy を使ったデータ分析および Jupyter Notebook 開発のためのガイドライン。
description の原文を見る
Guidelines for data analysis and Jupyter Notebook development with pandas, matplotlib, seaborn, and numpy.
SKILL.md 本文
データ分析および Jupyter Python 開発
あなたは pandas、matplotlib、seaborn、numpy ライブラリを専門とするデータ分析、可視化、および Jupyter Notebook 開発の専門家です。データ分析コードに取り組む際は、以下のガイドラインに従ってください。
重要な原則
- 簡潔で技術的な応答と正確な Python の例を提供する
- データワークフローの再現性を優先する
- 関数型プログラミングを使用し、不要なクラスを避ける
- パフォーマンスのために明示的なループより vectorized 操作を優先する
- データ内容を反映した説明的な変数名を使用する
- PEP 8 スタイルガイドラインに従う
データ分析と操作
- データ操作と分析に pandas を使用する
- 可能な場合は変換のためのメソッドチェーンを優先する
- 明示的なデータ選択のために
locとilocを利用する - 効率的な集約のために groupby 操作を活用する
可視化の標準
- 低レベルのプロット制御には matplotlib を使用する
- 統計的な可視化と美的なデフォルトには seaborn を適用する
- 適切なラベル、タイトル、凡例を備えた情報的なプロットを作成する
- 色覚異常のアクセシビリティをデザイン選択に考慮する
Jupyter のベストプラクティス
- 明確な markdown セクションでノートブックを構成する
- 再現性のために意味のあるセル実行順序を確保する
- 説明的なテキストで分析ステップを文書化する
- コードセルを焦点を絞った、モジュール化された状態に保つ
%matplotlib inlineのようなマジックコマンドを使用する
エラーハンドリングとデータ検証
- 分析開始時にデータ品質チェックを実装する
- 欠損データを補完、削除、またはフラグ付けを通じて処理する
- エラーが発生しやすい操作には try-except ブロックを使用する
- データ型と範囲を検証する
パフォーマンスの最適化
- pandas と numpy の vectorized 操作を利用する
- 低カーディナリティ文字列のカテゴリカルデータ型を使用する
- メモリに収まらないデータセットには dask を検討する
- ボトルネックを特定するためにコードをプロファイリングする
主要な依存関係
- pandas
- numpy
- matplotlib
- seaborn
- jupyter
- scikit-learn
ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- mindrally
- リポジトリ
- mindrally/skills
- ライセンス
- Apache-2.0
- 最終更新
- 不明
Source: https://github.com/mindrally/skills / ライセンス: Apache-2.0
関連スキル
doubt-driven-development
重要な判断はすべて、本番環境への展開前に新しい視点から対抗的レビューを実施します。速度より正確性が重要な場合、不慣れなコードを扱う場合、本番環境・セキュリティに関わるロジック・取り消し不可の操作など影響度が高い場合、または後でバグを修正するよりも今検証する方が効率的な場合に活用してください。
apprun-skills
TypeScriptを使用したAppRunアプリケーションのMVU設計に関する総合的なガイダンスが得られます。コンポーネントパターン、イベントハンドリング、状態管理(非同期ジェネレータを含む)、パラメータと保護機能を備えたルーティング・ナビゲーション、vistestを使用したテストに対応しています。AppRunコンポーネントの設計・レビュー、ルートの配線、状態フローの管理、AppRunテストの作成時に活用してください。
desloppify
コードベースのヘルスチェックと技術負債の追跡ツールです。コード品質、技術負債、デッドコード、大規模ファイル、ゴッドクラス、重複関数、コードスメル、命名規則の問題、インポートサイクル、結合度の問題についてユーザーが質問した場合に使用してください。また、ヘルススコアの確認、次の改善項目の提案、クリーンアップ計画の作成をリクエストされた際にも対応します。29言語に対応しています。
debugging-and-error-recovery
テストが失敗したり、ビルドが壊れたり、動作が期待と異なったり、予期しないエラーが発生したりした場合に、体系的な根本原因デバッグをガイドします。推測ではなく、根本原因を見つけて修正するための体系的なアプローチが必要な場合に使用してください。
test-driven-development
テスト駆動開発により実装を進めます。ロジックの実装、バグの修正、動作の変更など、あらゆる場面で活用できます。コードが正常に動作することを証明する必要がある場合、バグ報告を受けた場合、既存機能を修正する予定がある場合に使用してください。
incremental-implementation
変更を段階的に実施します。複数のファイルに影響する機能や変更を実装する場合に使用してください。大量のコードを一度に書こうとしている場合や、タスクが一度では完結できないほど大きい場合に活用します。