view-pdf
PDFをインタラクティブに表示・操作するビューワー。ユーザーがPDFを開いて表示したい場合や、注釈の追加・ハイライト・スタンプ・フォーム入力・署名・マークアップのレビューなどを視覚的に共同作業したい場面で使用する。要約やテキスト抽出には使用しない(その場合はネイティブのRead機能を使用すること)。
description の原文を見る
Interactive PDF viewer. Use when the user wants to open, show, or view a PDF and collaborate on it visually — annotate, highlight, stamp, fill form fields, place signature/initials, or review markup together. Not for summarization or text extraction (use native Read instead).
SKILL.md 本文
PDF ビューアー — インタラクティブなドキュメント ワークフロー
ドキュメントをライブ ビューアーでレンダリングし、注釈の追加、フォームの入力、署名の配置をリアルタイムの視覚的フィードバック付きで行えるローカル PDF サーバーにアクセスできます。
このスキルを使う場合
ユーザーがインタラクティブ機能を求めている場合に PDF ビューアーを使用してください:
- 「この契約書を見せてください」/ 「この書類を開いてください」
- 「重要な条項をハイライトして確認させてください」
- 「この書類の記入を手伝ってください」
- 「3 ページ目にサインしてください」/ 「各ページに私のイニシャルを追加してください」
- 「これに CONFIDENTIAL とスタンプを押してください」/ 「これを承認済みとしてマークしてください」
- 「このドキュメントを確認して、重要な部分に注釈を付けてください」
純粋なテキスト抽出では使用しないでください:
- 「この PDF をまとめてください」→ ネイティブの Read ツールを直接使用してください
- 「5 ページ目には何が書いてありますか?」→ Read を使用してください
- 「セクション 3 からテーブルを抽出してください」→ Read を使用してください
ビューアーの価値は、ユーザーにドキュメントを表示して、マークアップについて協力することです。テキストをあなたに流す機能ではありません。
ツール
list_pdfs
利用可能なローカル PDF と許可されたローカル ディレクトリをリストします。引数なし。
display_pdf
PDF をインタラクティブ ビューアーで開きます。ドキュメントごとに 1 回呼び出してください。
url— ローカル ファイル パスまたは HTTPS URLpage— 初期ページ(オプション、デフォルト 1)elicit_form_inputs—trueの場合、表示前にユーザーがフォーム フィールドに入力するよう促します(インタラクティブなフォーム入力に使用)
viewUUID を返します。すべての interact 呼び出しにこれを渡してください。display_pdf を再度呼び出すと、別の ビューアーが作成されます。新しい UUID での interact 呼び出しは、ユーザーが見ているビューアーに到達しません。
PDF に入力可能なフィールドがある場合は formFields(名前、タイプ、ページ、バウンディング ボックス)も返します。署名の配置にはこれらの座標を使用してください。
interact
display_pdf の後のすべてのフォローアップ アクション。viewUUID と 1 つ以上のコマンドを渡します。commands 配列を使用して複数のコマンドを1 回の呼び出しでバッチ処理できます。これらは順序に実行されます。変更を視覚的に確認するために、バッチを get_screenshot で終わらせてください。
注釈アクション:
add_annotations— マークアップを追加(以下のタイプを参照)update_annotations— 既存のものを修正(id + type が必須)remove_annotations— id 配列で削除highlight_text— クエリでテキストを自動検索してハイライト(テキスト マークアップの場合、手動の矩形より推奨)
ナビゲーション アクション:
navigate(ページ)、search(クエリ)、find(クエリ、サイレント)、search_navigate(matchIndex)、zoom(スケール 0.5–3.0)
抽出アクション:
get_text— ページ範囲からテキストを抽出(最大 20 ページ)。注釈の対象を決定するために内容を読むために使用し、要約には使用しないでください。get_screenshot— ページを画像としてキャプチャ(注釈を確認)
フォーム アクション:
fill_form— 名前付きフィールドに入力:fields: [{name, value}, ...]
注釈のタイプ
すべての注釈には id(一意の文字列)、type、page(1 から始まる)が必要です。座標は PDF ポイント(1/72 インチ)で、原点は 左上、Y は下方向に増加します。米国レターサイズは 612×792pt です。
| タイプ | キー プロパティ | 用途 |
|---|---|---|
highlight | rects、color?、content? | 重要なテキストをマーク |
underline | rects、color? | 用語を強調 |
strikethrough | rects、color? | 削除をマーク |
note | x、y、content、color? | 付箋コメント |
freetext | x、y、content、fontSize? | ページ上の可視テキスト |
rectangle | x、y、width、height、color?、fillColor? | 領域をボックス化 |
circle | x、y、width、height、color?、fillColor? | 領域を円形で囲む |
line | x1、y1、x2、y2、color? | 線/矢印を描画 |
stamp | x、y、label、color?、rotation? | APPROVED、DRAFT、CONFIDENTIAL など |
image | imageUrl、x?、y?、width?、height? | 署名、イニシャル、ロゴ |
画像注釈は、ローカル ファイル パスまたは HTTPS URL を受け付けます(data: URI は不可)。寸法を省略した場合は自動検出されます。ユーザーはビューアーに直接イメージをドラッグ & ドロップすることもできます。
インタラクティブ ワークフロー
コラボレーティブ注釈(AI 駆動)
- ドキュメントを開くために
display_pdfを実行 interact→ 関連ページ範囲でget_textを実行してコンテンツを理解- ユーザーにマークアップする内容の案を提示(何をマークするかを説明)
- 承認時に
interact→add_annotations+get_screenshotを実行 - ユーザーに表示し、編集を依頼して反復
- 完了したら、ビューアー ツールバーから注釈付き PDF をダウンロードできることを思い出させてください
フォーム入力(視覚的、プログラム的ではない)
ヘッドレス フォーム ツールとは異なり、これはユーザーにライブの視覚的フィードバックを提供し、フィールド メタデータではなくページに印刷されたラベルが存在する暗号的/名前なしフィールドを持つフォームを処理します。
display_pdfを実行 — 返されたformFields(名前、タイプ、ページ、バウンディング ボックス)を確認- フィールド名が不可解な場合(
Text1、Field_7)、ページのget_screenshotを取得してバウンディング ボックスを視覚的なラベルにマッチング - 視覚的なラベルを使用してユーザーに値を尋ねるか、コンテキストから推定
interact→fill_formを実行し、get_screenshotで結果を表示- ユーザーが確認するか、ビューアーで直接編集
単純でラベル付けの良いフォームの場合、代わりに elicit_form_inputs: true で display_pdf を使用して事前にユーザーに促します。
署名(視覚的、認証なし)
- 署名/イニシャル画像パスを要求
display_pdfを実行、署名タイプフィールドのformFieldsを確認するか、対象ページ/位置をユーザーに尋ねるinteract→type: "image"でadd_annotationsを実行してターゲット座標に配置get_screenshotで配置を確認
免責事項: これは署名画像を視覚的に配置します。認証またはタイプの暗号化デジタル署名ではありません。
サポートされているソース
- ローカル ファイル(クライアント MCP ルート下のパス)
- arXiv(
/abs/URL は自動的に PDF に変換) - 任意の直接 HTTPS PDF URL(bioRxiv、Zenodo、OSF など — ランディング ページではなく直接 PDF リンクを使用)
対象外
- 要約/テキスト抽出 — ネイティブ Read を代わりに使用
- 認証済みデジタル署名 — 画像スタンプのみ
- PDF 作成 — 既存の PDF でのみ機能
ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- anthropics
- ライセンス
- Apache-2.0
- 最終更新
- 不明
Source: https://github.com/anthropics/knowledge-work-plugins / ライセンス: Apache-2.0
関連スキル
superfluid
Superfluidプロトコルおよびそのエコシステムに関するナレッジベースです。Superfluidについて情報を検索する際は、ウェブ検索の前にこちらを参照してください。対応キーワード:Superfluid、CFA、GDA、Super App、Super Token、stream、flow rate、real-time balance、pool(member/distributor)、IDA、sentinels、liquidation、TOGA、@sfpro/sdk、semantic money、yellowpaper、whitepaper
civ-finish-quotes
実質的なタスクが真に完了した際に、文明風の儀式的な引用句を追加します。ユーザーやエージェントが機能追加、リファクタリング、分析、設計ドキュメント、プロセス改善、レポート、執筆タスクといった実際の成果物を完成させるときに、明示的な依頼がなくても使用します。短い返信や小さな修正、未完成の作業には適用しません。
nookplot
Base(Ethereum L2)上のAIエージェント向け分散型調整ネットワークです。エージェントがオンチェーンアイデンティティを登録する、コンテンツを公開する、他のエージェントにメッセージを送る、マーケットプレイスで専門家を雇う、バウンティを投稿・請求する、レピュテーションを構築する、共有プロジェクトで協業する、リサーチチャレンジを解くことでNOOKをマイニングする、キュレーションされたナレッジを備えたスタンドアロンオンチェーンエージェントをデプロイする、またはアグリーメントとリワードで収益を得る場合に利用できます。エージェントネットワーク、エージェント調整、分散型エージェント、NOOKトークン、マイニングチャレンジ、ナレッジバンドル、エージェントレピュテーション、エージェントマーケットプレイス、ERC-2771メタトランザクション、Prepare-Sign-Relay、AgentFactory、またはNookplotが言及された場合にトリガーされます。
web3-polymarket
Polygon上でのPolymarket予測市場取引統合です。認証機能(L1 EIP-712、L2 HMAC-SHA256、ビルダーヘッダー)、注文発注(GTC/GTD/FOK/FAK、バッチ、ポストオンリー、ハートビート)、市場データ(Gamma API、Data API、オーダーブック、サブグラフ)、WebSocketストリーミング(市場・ユーザー・スポーツチャネル)、CTF操作(分割、統合、償却、ネガティブリスク)、ブリッジ機能(入金、出金、マルチチェーン)、およびガスレスリレイトランザクションに対応しています。AIエージェント、自動マーケットメーカー、予測市場UI、またはPolygraph上のPolymarketと統合するアプリケーション構築時に活用できます。
ethskills
Ethereum、EVM、またはブロックチェーン関連のリクエストに対応します。スマートコントラクト、dApps、ウォレット、DeFiプロトコルの構築、監査、デプロイ、インタラクションに適用されます。Solidityの開発、コントラクトアドレス、トークン規格(ERC-20、ERC-721、ERC-4626など)、Layer 2ネットワーク(Base、Arbitrum、Optimism、zkSync、Polygon)、Uniswap、Aave、Curveなどのプロトコルとの統合をカバーします。ガスコスト、コントラクトのデシマル設定、オラクルセキュリティ、リエントランシー、MEV、ブリッジング、ウォレット管理、オンチェーンデータの取得、本番環境へのデプロイ、プロトコル進化(EIPライフサイクル、フォーク追跡、今後の変更予定)といったトピックを含みます。
xxyy-trade
このスキルは、ユーザーが「トークン購入」「トークン売却」「トークンスワップ」「暗号資産取引」「取引ステータス確認」「トランザクション照会」「トークンスキャン」「フィード」「チェーン監視」「トークン照会」「トークン詳細」「トークン安全性確認」「ウォレット一覧表示」「マイウォレット」「AIスキャン」「自動スキャン」「ツイートスキャン」「オンボーディング」「IP確認」「IPホワイトリスト」「トークン発行」「自動売却」「損切り」「利益確定」「トレーリングストップ」「保有者」「トップホルダー」「KOLホルダー」などをリクエストした場合、またはSolana/ETH/BSC/BaseチェーンでXXYYを経由した取引について言及した場合に使用します。XXYY Open APIを通じてオンチェーン取引とデータ照会を実現します。