senior-data-engineer
シニアデータエンジニアは、大規模なデータシステムの設計・構築・保守を行う経験豊富な技術者です。データベース管理、データパイプライン開発、分析基盤の構築などを担当し、チーム全体の技術的リーダーシップを発揮します。複雑なデータ課題の解決策を提案し、他のエンジニアの育成も行う重要な役割です。
description の原文を見る
senior-data-engineer
SKILL.md 本文
Senior Data Engineer
name: Senior Data Engineer level: senior group: data
概要
シニアデータエンジニアは、大規模で複雑なデータパイプライン、アーキテクチャ、および分析システムの設計と実装を専門としています。彼らはデータガバナンス、データ品質、スケーラビリティに関する戦略的決定をリードします。シニアデータエンジニアは技術的なスキル、ビジネス理解、およびチームリーダーシップを組み合わせて、データ駆動型の組織を構築します。
スキル
エンタープライズデータアーキテクチャ
シニアデータエンジニアは、大規模組織向けのエンタープライズスケールのデータアーキテクチャを設計できます。彼らはデータレイク、ウェアハウス、マートのための包括的なシステムを構築し、複数のデータソースとシンク全体で一貫性を確保します。彼らはスケーラビリティ、ディザスタリカバリー、セキュリティ、およびコンプライアンス要件を考慮した設計を行います。
期待される成果:
- マルチシステムデータフロー、統合パターン、およびアーキテクチャ決定文書を作成
- レイテンシー、スループット、ストレージ、およびコストの最適化
- 複数の部門または複雑な要件にわたるメタデータ管理フレームワークの構築
高度な分散システムの最適化
シニアデータエンジニアは、Spark、Kafka、Flink、または他の分散処理エンジンで複雑なパフォーマンスボトルネックを特定し解決できます。彼らはスケーラビリティ、リソース利用率、およびシステムの信頼性を確保します。
期待される成果:
- 大規模なデータセットで並列化、シャーディング、およびパーティショニングを最適化
- クラスタとジョブパフォーマンスの診断とチューニング
- マイグレーションやスケールアップ時のメモリ、CPU、およびネットワークの問題を解決
データガバナンスと品質戦略
シニアデータエンジニアは、組織全体のデータガバナンスフレームワーク、データリネージ、および品質アシュランスプロセスの実装をリードします。彼らはメタデータ管理、データディスカバリー、およびデータ品質監視のためのシステムを設計します。
期待される成果:
- 複雑なデータリネージの実装とクロスシステムの依存関係の追跡
- スケーラブルなデータ品質フレームワークとテスト自動化の構築
- データスチュワードシップモデルと監査ログメカニズムの確立
大規模機械学習パイプラインのエンジニアリング
シニアデータエンジニアは、本番環境での機械学習モデルの展開をサポートするエンタープライズMLOpsパイプラインを構築します。彼らはリアルタイムのスコアリング、バッチ処理、特徴工学、およびモデル監視システムを設計します。
期待される成果:
- 低レイテンシーのリアルタイムスコアリングと高スループットのバッチスコアリングシステムの実装
- 自動再学習、モデル監視、およびドリフト検出のためのシステムの構築
- データ品質、特徴の一貫性、およびモデル性能に関するエンドツーエンド監視の確保
クラウドデータプラットフォームの最適化
シニアデータエンジニアは、AWS Glue、BigQuery、Snowflake、Azure Synapse、または他のマネージドサービスのようなクラウドプラットフォームを最適化できます。彼らはコスト効率、パフォーマンス、およびセキュリティのトレードオフを管理します。
期待される成果:
- マルチテナント、複数地域、または複雑なパーティショニング戦略の実装
- ストレージ層とコンピュートクラスターのコスト最適化
- クラウドセキュリティ、IAM、およびネットワーク隔離の実装
インフラストラクチャコードと自動化
シニアデータエンジニアは、Terraform、CloudFormation、または Kubernetes を使用して、データインフラストラクチャを本番対応で再現可能なコードで定義します。彼らはCI/CDパイプライン、デプロイメント自動化、およびインフラストラクチャテストを実装します。
期待される成果:
- マルチ環境デプロイメント、ステージング、および本番システムのためのインフラストラクチャコードの構築
- デプロイメント自動化、ロールバック戦略、およびインフラストラクチャの変更管理の実装
- インフラストラクチャテストとコンプライアンスチェックの自動化
メンタリングと技術的リーダーシップ
シニアデータエンジニアは他のエンジニアをメンタリングし、データチーム内の技術的決定をリードします。彼らは複雑な技術的課題を説明し、ベストプラクティスを提唱し、チームの技術的成長を促進します。
期待される成果:
- ジュニアおよび中級エンジニアへのメンタリング、コード審査、およびフィードバック
- 技術的な提案、アーキテクチャレビュー、および技術的ディスカッションの主導
- データエンジニアリングの技術的スキルセットの進化と知識転移
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- alirezarezvani
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/alirezarezvani/claude-skills / ライセンス: MIT
関連スキル
hugging-face-trackio
Trackioを使用してMLトレーニング実験を追跡・可視化できます。トレーニング中のメトリクスログ記録(Python API)、トレーニング診断のアラート発火、ログされたメトリクスの取得・分析(CLI)が必要な場合に活用してください。リアルタイムダッシュボード表示、Webhookを使用したアラート、HF Space同期、自動化向けのJSON出力に対応しています。
btc-bottom-model
ビットコインのサイクルタイミングモデルで、加重スコアリングシステムを搭載しています。日次パルス(4指標、32ポイント)とウィークリー構造(9指標、68ポイント)の2カテゴリーにわたる13の指標を追跡し、0~100のマーケットヒートスコアを算出します。ETFフロー、ファンディングレート、ロング/ショート比率、恐怖・貪欲指数、LTH-MVRV、NUPL、SOPR(LTH+STH)、LTH供給率、移動平均倍率(365日MA、200週MA)、週次RSI、出来高トレンドに対応します。市場サイクル全体を通じて買いと売りの両方の推奨を提供します。ビットコインの底値拾い、BTCサイクルポジション、買い時・売り時、オンチェーン指標、MVRV、NUPL、SOPR、LTH動向、ETFの流出入、ファンディングレート、恐怖指数、ビットコインが過熱状態か、マイナーコスト、暗号資産市場のセンチメント、BTCのポジションサイジング、「今ビットコインを買うべきか」「BTCが天井をつけているか」「オンチェーン指標は何を示しているか」といった質問の際にこのスキルを活用します。
protein_solubility_optimization
タンパク質の溶解性最適化 - タンパク質の溶解性を最適化します。タンパク質の特性を計算し、溶解性と親水性を予測し、有効な変異を提案します。タンパク質配列の特性計算、タンパク質機能の予測、親水性計算、ゼロショット配列予測を含むタンパク質エンジニアリング業務に使用できます。3つのSCPサーバーから4つのツールを統合しています。
research-lookup
Parallel Chat APIまたはPerplexity sonar-pro-searchを使用して、最新の研究情報を検索できます。学術論文の検索にも対応しています。クエリは自動的に最適なバックエンドにルーティングされるため、論文の検索、研究データの収集、科学情報の検証に活用できます。
tree-formatting
ggtree(R)またはiTOL(ウェブ)を使用して、系統樹の可視化とフォーマットを行います。系統樹を図として描画する際、ツリーレイアウトの選択、分類学に基づく枝やラベルの色付け、クレードの折りたたみ、サポート値の表示、またはツリーへのオーバーレイ追加が必要な場合に使用してください。系統推定(protein-phylogenyスキルを使用)やドメイン注釈(今後の独立したスキル)には使用しないでください。
querying-indonesian-gov-data
インドネシア政府の50以上のAPIとデータソースに接続できます。BPJPH(ハラール認証)、BOM(食品安全)、OJK(金融適正性)、BPS(統計)、BMKG(気象・地震)、インドネシア中央銀行(為替レート)、IDX(株式)、CKAN公開データポータル、pasal.id(第三者法MCP)に対応しています。インドネシア政府データを活用したアプリ開発、.go.idウェブサイトのスクレイピング、ハラール認証の確認、企業の法的適正性の検証、金融機関ステータスの照会、またはインドネシアMCPサーバーへの接続時に使用できます。CSRF処理、CKAN API使用方法、IP制限回避など、すぐに実行可能なPythonパターンを含んでいます。