parallel-data-enrichment
企業・人物・製品のリストに対して、CEOの氏名・資金調達情報・連絡先などのフィールドをWeb上の情報から一括追加するデータエンリッチメントスキル。CSVファイルやインラインデータの補完に活用でき、`--previous-interaction-id`を指定することで過去のリサーチタスクのコンテキストを引き継いだマルチターン処理にも対応。
description の原文を見る
Bulk data enrichment. Adds web-sourced fields (CEO names, funding, contact info) to lists of companies, people, or products. Use for enriching CSV files or inline data. Supports multi-turn: pass --previous-interaction-id from a prior research task to carry context forward.
SKILL.md 本文
データ エンリッチメント
エンリッチメント: $ARGUMENTS
開始前に
ユーザーに対して、行数とリクエストされたフィールド数に応じて、エンリッチメントに数分かかる可能性があることを通知してください。
オプション: 出力列の提案
ユーザーの意図が曖昧な場合(「これらの企業を有用な情報で充実させて」など)で、どの列を追加するかが不確かな場合は、実行を開始する前に API に提案を求めてください:
parallel-cli enrich suggest "Find CEO and recent funding info" --json
レスポンスはエンベロープ形式です: {title, processor, enriched_columns, warnings}。enriched_columns 配列(エンベロープ全体ではなく)のみを抽出し、それを enrich run の --intent の代わりに --enriched-columns の値として渡してください。この 2 つのフラグは組み合わせではなく、何をエンリッチするかを指定するための代替方法です。suggest が processor を返した場合は、run 呼び出しで --processor を使用して明示的に渡してください(スキーマのための調整済み推奨事項です)。ユーザーが既に追加したいフィールドを指定している場合は、このセクション全体をスキップしてください。
enrich suggestにはparallel-cli≥ 0.3.0 が必要です。no such command/No such command/unknown commandのようなエラーで失敗する場合は、中止せず 提案ステップをスキップし、--intentを使用してステップ 1 に進み、実行を完了してください。最終応答でparallel-cli update(またはpipx upgrade parallel-web-tools)を記載すれば、ユーザーは次回このフィーチャーを利用できるようになります。
ステップ 1: エンリッチメントを開始する
以下のコマンドパターンの 1 つを使用してください(ユーザーの実際のデータに置き換えてください):
インラインデータの場合:
parallel-cli enrich run --data '[{"company": "Google"}, {"company": "Microsoft"}]' --intent "CEO name and founding year" --target "output.csv" --no-wait --json
CSV ファイルの場合:
parallel-cli enrich run --source-type csv --source "input.csv" --target "output.csv" --source-columns '[{"name": "company", "description": "Company name"}]' --intent "CEO name and founding year" --no-wait --json
これが以前のリサーチタスクのフォローアップであり、その interaction_id がある場合は、コンテキストチェーンを追加してください:
parallel-cli enrich run --data '...' --intent "..." --target "output.csv" --no-wait --json --previous-interaction-id "$INTERACTION_ID"
エンリッチメントは、その前のリサーチの完全なコンテキストで実行されます。そのため、既に見つかった内容を再度述べることなく、以前発見されたエンティティをエンリッチできます。注意: エンリッチメント自体は新しい interaction_id を生成しないため、その後のフォローアップをエンリッチメントの対象にすることはできません。
重要: ブロックされずに即座にコマンドが戻るように、常に --no-wait を含めてください。
--json 出力をパースして taskgroup_id と url を抽出してください。出力は {taskgroup_id, url, num_runs} です。interaction_id フィールドはありません。探さないでください。ユーザーに直ちに以下を伝えてください:
- エンリッチメントが開始されたこと
- 進行状況を追跡できるモニタリング URL
ポーリングステップをバックグラウンドで実行しながら作業を続けることができることをユーザーに伝えてください。
ステップ 2: 結果をポーリングする
具体的な出力パスを選択してください(例: /tmp/enrichment-acme.json)。注意: 拡張子に関係なく、ファイルは JSON 形式です。CSV ではなく、{input, output} オブジェクトの配列です。自分やユーザーに混同させないよう .json で命名してください。
parallel-cli enrich poll "$TASKGROUP_ID" --timeout 540 --output "/tmp/enrichment-<descriptive-name>.json"
重要:
- ツール実行の制限内に留まるよう
--timeout 540(9 分)を使用してください - ステップ 1 の
--targetは--no-waitモードでは使用されません。ここでは--outputのみが結果の保存場所を決定し、ファイルは常に JSON です
ポーリングがタイムアウトした場合
大規模データセットのエンリッチメントに 9 分以上かかることがあります。ポーリングが完了せずに終了した場合:
- ユーザーにエンリッチメントがサーバー側で実行中であることを伝えてください
- 同じ
parallel-cli enrich pollコマンドを再実行して続行してください
レスポンス形式
ステップ 1 の後: モニタリング URL を共有してください(進行状況を追跡するため)。
ステップ 2 の後:
- エンリッチされた行数をレポートしてください
- 出力ファイルの最初の数行をプレビューしてください(
{input, output}オブジェクトの JSON 配列です) - 出力ファイルへの完全パスをユーザーに伝えてください
完了後はモニタリング URL を再度共有しないでください。結果は出力ファイルにあります。
セットアップ
parallel-cli(インストール済みで認証済み)が必要です。parallel-cli --version が失敗するか、後のコマンドが認証エラーで失敗する場合は、ユーザーに https://docs.parallel.ai/integrations/cli を確認するよう指示し、停止してください。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- parallel-web
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/parallel-web/parallel-agent-skills / ライセンス: MIT
関連スキル
doubt-driven-development
重要な判断はすべて、本番環境への展開前に新しい視点から対抗的レビューを実施します。速度より正確性が重要な場合、不慣れなコードを扱う場合、本番環境・セキュリティに関わるロジック・取り消し不可の操作など影響度が高い場合、または後でバグを修正するよりも今検証する方が効率的な場合に活用してください。
apprun-skills
TypeScriptを使用したAppRunアプリケーションのMVU設計に関する総合的なガイダンスが得られます。コンポーネントパターン、イベントハンドリング、状態管理(非同期ジェネレータを含む)、パラメータと保護機能を備えたルーティング・ナビゲーション、vistestを使用したテストに対応しています。AppRunコンポーネントの設計・レビュー、ルートの配線、状態フローの管理、AppRunテストの作成時に活用してください。
desloppify
コードベースのヘルスチェックと技術負債の追跡ツールです。コード品質、技術負債、デッドコード、大規模ファイル、ゴッドクラス、重複関数、コードスメル、命名規則の問題、インポートサイクル、結合度の問題についてユーザーが質問した場合に使用してください。また、ヘルススコアの確認、次の改善項目の提案、クリーンアップ計画の作成をリクエストされた際にも対応します。29言語に対応しています。
debugging-and-error-recovery
テストが失敗したり、ビルドが壊れたり、動作が期待と異なったり、予期しないエラーが発生したりした場合に、体系的な根本原因デバッグをガイドします。推測ではなく、根本原因を見つけて修正するための体系的なアプローチが必要な場合に使用してください。
test-driven-development
テスト駆動開発により実装を進めます。ロジックの実装、バグの修正、動作の変更など、あらゆる場面で活用できます。コードが正常に動作することを証明する必要がある場合、バグ報告を受けた場合、既存機能を修正する予定がある場合に使用してください。
incremental-implementation
変更を段階的に実施します。複数のファイルに影響する機能や変更を実装する場合に使用してください。大量のコードを一度に書こうとしている場合や、タスクが一度では完結できないほど大きい場合に活用します。