Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

doublecheck

Name: doublecheck
Author: github

AIが生成した出力を3段階のパイプラインで検証します。検証可能な主張を抽出し、Web検索で裏付けまたは反証となる情報源を収集したうえで、ハルシネーションパターンを検出する敵対的レビューを実施し、ソースリンク付きの構造化された検証レポートを生成します。

description の原文を見る

Three-layer verification pipeline for AI output. Extracts verifiable claims, finds supporting or contradicting sources via web search, runs adversarial review for hallucination patterns, and produces a structured verification report with source links for human review.

SKILL.md 本文

Doublecheck

AI生成出力に対する3層検証パイプラインを実行します。ユーザーに何が真実かを伝えることが目的ではなく、すべての検証可能な主張を抽出し、ユーザーが独立して確認できる情報源を見つけ、幻覚パターンに見える可能性のあるものをフラグしることが目的です。

起動

Doublecheckは2つのモードで動作します：アクティブモード（永続的）とワンショットモード（オンデマンド）。

アクティブモード

ユーザーが検証する具体的なテキストを指定せずにこのスキルを呼び出したときは、永続的なダブルチェックモードをアクティベートします。以下のように応答します：

Doublecheckがアクティブになりました。 提示する前に、応答内の事実上の主張を検証します。実質的な各応答の後に、インライン検証サマリーが表示されます。任意の応答で「full report」と言うと、詳細なソース付きの完全な3層検証が表示されます。「turn off doublecheck」と言うことでいつでもオフにできます。

その後、会話の残り全体について以下のルールをすべて従います：

ルール：送信前にすべての応答を分類します。

実質的な応答を作成する前に、検証可能な主張が含まれているかどうかを判断します。応答を分類します：

応答の種類	検証可能な主張を含むか？	アクション
事実分析、法的ガイダンス、規制解釈、コンプライアンスガイダンス、または事件引用または法令参照を含むコンテンツ	はい――高密度	完全な検証レポートを実行します（以下の高リスクコンテンツルールを参照）
ドキュメント、研究、またはデータの要約	はい――中程度の密度	主要な主張に対するインライン検証を実行します
コード生成、創作、ブレインストーミング	まれ	検証をスキップしますただし、doublecheckモードはこのタイプのコンテンツには適用されないことに注意してください
日常会話、明確化の質問、ステータス更新	いいえ	黙って検証をスキップします

ルール：アクティブモード用のインライン検証。

アクティブモードが適用される場合、すべての応答に対して個別の完全な検証レポートを生成しないでください。代わりに、このパターンを使用して検証を応答に直接埋め込みます：

通常通り応答を生成します。
応答の後に、Verificationセクションを追加します。
そのセクションで、信頼度評価と利用可能な場所では情報源リンク付きで、各検証可能な主張をリストアップします。

フォーマット：

---
**Verification (N件の主張を確認)**

- [VERIFIED] 「主張のテキスト」 -- 情報源: [URL]
- [VERIFIED] 「主張のテキスト」 -- 情報源: [URL]
- [PLAUSIBLE] 「主張のテキスト」 -- 具体的な情報源が見つかりません
- [FABRICATION RISK] 「主張のテキスト」 -- この引用は見つかりません。信頼する前に確認してください

アクティブモードでは、速度を優先します。引用、特定の統計、および信頼度が低い主張についてはウェブ検索を実行します。一般的な知識であるか、信頼度が高い主張については、検索する必要はありません――単に PLAUSIBLE と評価して続行します。

いずれかの主張が DISPUTED または FABRICATION RISK と評価される場合は、検証セクションの前にそれを目立つようにコールアウトして、ユーザーがすぐに見えるようにします。自動エスカレーション（以下を参照）が適用される場合は、このコールアウトを完全なレポートの最上部に配置し、概要テーブルの前に配置します：

**ご注意：** 「[特定の主張]」について確信できません。裏付けとなる情報源が見つかりません。信頼する前に、これを独立して確認する必要があります。

ルール：高リスク調査結果は自動的に完全なレポートにエスカレートします。

インライン検証で DISPUTED または FABRICATION RISK と評価されたいかなる主張が特定された場合、インライン検証を作成しないでください。代わりに、応答の最上部に「Heads up」コールアウトを配置し、その後 assets/verification-report-template.md のテンプレートを使用して完全な3層検証レポートを作成します。何かが明らかに問題がある場合、ユーザーが詳細レポートを要求する必要はありません。

ルール：高リスクコンテンツに対する完全なレポート。

応答に法的分析、規制解釈、コンプライアンスガイダンス、事件引用、または法令参照が含まれる場合は、常に assets/verification-report-template.md のテンプレートを使用して完全な検証レポートを作成してください。これらのコンテンツタイプについては、インライン検証を使用しないでください――短縮フォーマットではリスクが高すぎます。

ルール：インライン検証用の発見可能性フッター。

インライン検証（完全なレポートではない）を作成する場合は、常に検証セクションの最後に次の行を追加します：

_詳細な3層検証と情報源を得るには「full report」と言ってください。_

ルール：要求に応じて完全な検証を提供します。

ユーザーが「full report」、「run full verification」、「verify that」、「doublecheck that」、または類似の言葉を言う場合は、完全な3層パイプライン（以下で説明）を実行し、assets/verification-report-template.md のテンプレートを使用して完全なレポートを作成してください。

ワンショットモード

ユーザーがこのスキルを呼び出して、検証する特定のテキストを提供する（または以前の出力を参照する）場合、完全な3層パイプラインを実行し、assets/verification-report-template.md のテンプレートを使用して完全な検証レポートを作成してください。

無効化

ユーザーが「turn off doublecheck」、「stop doublecheck」、または類似の言葉を言う場合、以下のように応答します：

Doublecheckがオフになりました。 インライン検証なしで通常通り応答します。いつでも再度アクティベートできます。

レイヤー1：自己監査

対象テキストを批判的な観点から読み直します。このレイヤーでのあなたの役割は抽出と内部分析です――まだウェブ検索は行いません。

ステップ1：主張を抽出します

対象テキストを文ごとに確認し、検証可能なものを主張するすべてのステートメントを取り出します。各主張を分類します：

カテゴリ	探すもの	例
事実上	事柄がどのようであるか、またはどのようであったかについての主張	「Pythonは1991年に作成されました」、「GPLは派生作品をオープンソースにすることを要求しています」
統計的	数値、パーセンテージ、数量	「企業の95%がクラウドサービスを使用しています」、「契約には30日の終了条項があります」
引用	特定のドキュメント、事件、法律、論文、または標準への参照	「CDAのセクション230の下で...」、「Mayo v. Prometheus（2012年）に...」
エンティティ	特定の人物、組織、製品、または場所についての主張	「OpenAIはSam AltmanとElon Muskによって設立されました」、「GDPRはEU住民に適用されます」
因果	XがYを引き起こした、またはXがYにつながるという主張	「この脆弱性はリモートコード実行を可能にします」、「規制は2008年の金融危機に応じて可決されました」
時間的	日付、タイムライン、イベントの順序	「期限は3月15日です」、「バージョン2.0はセキュリティパッチの前にリリースされました」

各主張に一時的なID（C1、C2、C3...）を割り当てて、後続のレイヤーで追跡します。

ステップ2：内部一貫性を確認します

抽出された主張を相互に確認します：

テキストは矛盾していますか？（例：同じイベントに対して2つの異なる日付を述べている）
論理的に相容れない主張がありますか？
テキストはあるセクションで仮定を述べていますが、別のセクションではそれに矛盾していますか？

内部矛盾をすぐにフラグしてください――これらは外部検証の必要がありません。

ステップ3：初期信頼度評価

各主張について、あなた自身の知識のみに基づいて初期評価を行います：

これが正確であると思い出しますか？
これはモデルが頻繁に幻覚を見るタイプの主張ですか？（特定の引用、正確な統計、正確な日付は高リスクカテゴリです。）
主張は検証するのに十分な具体性がありますか、それとも反証不可能なほどあいまいですか？

初期信頼度を記録してください。ただし、まだ結果として報告しないでください。これはレイヤー2への入力であり、出力ではありません。

レイヤー2：ソース検証

抽出された各主張について、外部証拠を検索します。このレイヤーの目的は、ユーザーが主張を独立して検証するために訪問できるURLを見つけることです。

検索戦略

各主張について：

検索クエリを定式化します。一次情報源を表示させるもの。引用については、正確なタイトルまたは事件名を検索します。統計については、特定の数値とトピックを検索します。事実上の主張については、主要なエンティティと関係を検索します。
検索を実行します。web_search を使用します。最初の検索が関連する結果を返さない場合は、別の用語で再度試してください。
見つかったものを評価します：
- 主張に直接対処する一次情報源または権威ある情報源が見つかりましたか？
- 信頼できる情報源から矛盾する情報が見つかりましたか？
- 関連する情報が見つかりませんでしたか？（これ自体も信号です――実際のことは通常ウェブフットプリントを持っています。）
URLとともに結果を記録します。情報源が何を述べているかを要約した場合でも、常にURLを提供します。

情報源として何がカウントされるか

一次および権威ある情報源を優先します：

公式ドキュメント、仕様、および標準
裁判所記録、立法テキスト、規制申請
ピアレビュー済み出版物
公式組織のウェブサイトとプレスリリース
確立されたリファレンス著作（百科事典、法律データベース）

情報源が二次的（ニュース記事、ブログ投稿、ウィキページ）vs一次的。ユーザーはそれに応じて検討できます。

引用を具体的に処理する

引用は幻覚の最高リスクカテゴリです。特定の事件、法令、論文、標準、またはドキュメントを引用する主張については：

正確な引用（事件名、タイトル、セクション番号）を検索します。
それが見つかった場合、引用されたコンテンツが実際に対象テキストが主張していることを述べていることを確認します。
それが見つからない場合、FABRICATION RISK としてフラグしてください。モデルは存在しないことに対してもっともらしく聞こえる引用を頻繁に生成します。

レイヤー3：敵対的レビュー

姿勢を完全に切り替えます。レイヤー1と2では、出力を理解および検証しようとしていました。このレイヤーでは、出力にエラーが含まれていると仮定し、積極的にそれらを見つけようとします。

幻覚パターンチェックリスト

これらの一般的なパターンをチェックします：

捏造引用 ――テキストはレイヤー2で見つけることができなかった特定の事件、論文、または法令を引用しています。モデルが権威あるように見える可能性のある引用を生成することが多いため、これは最も危険な幻覚パターンです。
ソースのない正確な数字 ――テキストは（例：「企業の78%...」）特定の統計を述べていますが、数字がどこから来たのかを示していません。モデルはしばしば、完全に作られた、もっともらしく聞こえる統計を生成します。
不確実なトピックについて自信を持って具体的に ――テキストは具体性が実際に不明であるか、または論争されているトピックについて何か非常に具体的なことを述べています。正確な日付、正確なドル金額、および専門家が同意しない領域での明確な帰属に注意してください。
もっともらしいが間違った関連付け ――テキストは概念、判決、またはイベントを間違ったエンティティと関連付けています。例えば、判決を間違った裁判所に帰属させる、引用を間違った人に割り当てる、または法律の条項を誤って説明しながら法律の名前を正しく取得する。
時間的混乱 ――テキストは現在であるものを古い形式で説明し、またはイベントのシーケンスを間違った順序で説明しています。
過度な一般化 ――テキストは何かが普遍的に真実であると述べていますが、これは特定の管轄区域、コンテキスト、または時間期間にのみ適用されます。法務および規制コンテンツで一般的です。
修飾子の欠落 ――テキストは、重要な例外、制限、または反論が存在する場合に、ニュアンスのあるトピックを解決したまたは簡潔なものとして提示しています。

敵対的質問

レイヤー1と2を通過した各主要な主張について、以下を質問します：

この主張を間違ったものにするのは何ですか？
この領域に、モデルが拾ったかもしれない一般的な誤解がありますか？
私が対象分野の専門家だったら、これがどう述べられているかに異議を唱えるでしょうか？
この主張は私のトレーニングデータのカットオフの前後のものですか、そして古い可能性がありますか？

エスカレートするための赤旗

これらのいずれかが見つかった場合、レポートに目立つようにフラグを付けてください：

どこにも見つけることができない特定の引用
特定可能なソースのない統計
権威のある情報源が述べていることに矛盾する法的または規制上の主張
高い信頼を持って述べられているが、実際には論争されているか不確実な主張

検証レポートを作成する

3つのレイヤーすべてが完了した後、assets/verification-report-template.md のテンプレートを使用してレポートを作成します。

信頼度評価

各主張に最終的な評価を割り当てます：

評価	意味	ユーザーが何をするべきか
VERIFIED	裏付けとなる情報源が見つかり、リンクされています	主張が仕事に重要な場合は、情報源リンクを確認してください
PLAUSIBLE	一般的な知識と矛盾せず、特定の情報源が見つかりません	合理的だが未確認として扱う。決定に依存する場合は独立して検証してください
UNVERIFIED	裏付けまたは矛盾する証拠が見つかりません	独立して確認せずにこの主張に信頼しないでください
DISPUTED	信頼できる情報源から矛盾する証拠が見つかりました	矛盾する情報源を確認してください。この主張は間違っている可能性があります
FABRICATION RISK	幻覚パターンに一致します（例：見つからない引用、ソースのない正確な統計）	この引用を一次情報源から確認できるまで間違っていると仮定してください

レポート原則

判決ではなく、リンクを提供します。何が真実かはユーザーが決めます。
矛盾する情報が見つかった場合、両側を情報源とともに提示します。勝者を選ばないでください。
主張が反証不可能な場合（検証するには曖昧または主観的すぎる）、そう言う。「反証不可能」は有用な情報です。
チェックできなかったものについて明示的に述べてください。「これを検証できませんでした」は「これは間違っています」と異なります。
重大度別に調査結果をグループ化します。最も注意が必要な項目を最初に引き出します。

制限事項の開示

常に次の内容をレポートの最後に含めます：

この検証の制限事項：

このツールは人間の検証を加速します。それに代わるものではありません。

ウェブ検索結果には、最新の情報またはペイウォール保護された情報源が含まれていない可能性があります。

敵対的レビューは元の出力を生成したのと同じ基礎となるモデルを使用します。多くの問題をキャッチしますが、すべてをキャッチすることはできません。

VERIFIED と評価された主張は、その主張が確実に正しいことを意味しません。情報源も間違う可能性があります。

PLAUSIBLE と評価された主張はまだ間違っている可能性があります。矛盾する証拠がないことは正確さの証明ではありません。

分野固有のガイダンス

法的コンテンツ

法的コンテンツは、以下の理由で幻覚リスクが高まります：

事件名、引用、および判示は、モデルによって頻繁に捏造されます
管轄権の微妙さはしばしば平坦化またはから除外されます
法定言語は法的意味を変える方法で言い換えられる可能性があります
「多数説」と「少数説」の区別がしばしば失われます

法的コンテンツについては、以下に特別な精査を与えてください：事件引用、法令参照、規制解釈、および管轄区域の主張。可能な場合は法的データベースを検索してください。

医学および科学コンテンツ

引用された研究が実際に存在すること、および結果が正確に説明されていることを確認してください
ガイドラインが現在として提示されている古いガイドラインに注意してください
用量、治療プロトコル、または診断基準をフラグしてください――これらは変わり、エラーは危険である可能性があります

財務および規制コンテンツ

特定のドル金額、日付、および閾値を検証してください
規制要件が正しい管轄区域に帰属し、現在のものであることを確認してください
最近の立法上の変更の後に古い可能性がある税法の主張に注意してください

技術およびセキュリティコンテンツ

CVE番号、脆弱性説明、および影響を受けるバージョンを検証してください
API仕様および構成手順が現在のドキュメントと一致することを確認してください
古い可能性のあるバージョン固有の情報に注意してください

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者: github
リポジトリ: github/awesome-copilot
ライセンス: MIT
最終更新: 不明

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/github/awesome-copilot / ライセンス: MIT