web-to-markdown
ユーザーが「use the skill web-to-markdown ...」と明示的に指定した場合のみ使用します。ローカルの web2md CLI(Puppeteer + Readability)を呼び出し、JavaScriptでレンダリングされるページを含むWebページのURLをクリーンなMarkdown形式に変換します。
description の原文を見る
Use ONLY when the user explicitly says: 'use the skill web-to-markdown ...' (or 'use a skill web-to-markdown ...'). Converts webpage URLs to clean Markdown by calling the local web2md CLI (Puppeteer + Readability), suitable for JS-rendered pages.
SKILL.md 本文
web-to-markdown
ローカルにインストールされたブラウザ (web2md 経由) を操作することで、ウェブページをクリーンな Markdown に変換します。
ハード トリガー ゲート (必須)
このスキルは、ユーザーが以下のような形で明確にスキルを名前指定して要求した場合のみ使用してください:
use the skill web-to-markdown ...use a skill web-to-markdown ...
ユーザーが名前を明記してこのスキルをリクエストしなかった場合は、中断して、リクエストに use the skill web-to-markdown を含めて再発行するよう求めてください。
このスキルの機能
- JavaScript でレンダリングされたページに対応 (Puppeteer → ユーザーの Chrome)。
- Chromium 系ブラウザ (Chrome/Chromium/Brave/Edge) で
puppeteer-core経由で最も効果的に動作。 - メインコンテンツを抽出 (Readability)。
- Markdown に変換 (Turndown) し、リンクをクリーンアップし、オプションで YAML frontmatter を追加。
非目標
- Playwright やその他のブラウザオートメーションスタックを使用しないでください。メカニズムは
web2mdです。
収集すべき入力 (不足している場合のみ確認)
url(または複数の URL のリスト)- 出力方式:
- stdout に出力 (
--print)、または - ファイルに保存 (
--out ./file.md)、または - ディレクトリに保存 (
--out ./some-dir/でページタイトルで自動命名)
- stdout に出力 (
- トリッキーなページ用のオプションレンダリングコントロール:
--chrome-path <path>(Chrome の自動検出に失敗した場合)--interactive(Chrome を表示して一時停止し、ユーザーが人間による確認/ログインを完了してから Enter キーを押せるようにする)--wait-until load|domcontentloaded|networkidle0|networkidle2--wait-for '<css selector>'--wait-ms <milliseconds>--headful(デバッグ)--no-sandbox(コンテナ/CI では時々必須)--user-data-dir <dir>(ログイン/セッション; 専用プロファイルディレクトリを使用)
ワークフロー
- ユーザーが明確にスキルを呼び出したことを確認 (
use the skill web-to-markdown)。 - URL が
http://またはhttps://で始まることを検証。 web2mdがインストールされていることを確認:- 実行:
command -v web2md - インストールされていない場合、ユーザーにインストールを指示 (プロジェクトは
~/workspace/softaworks/projects/web2mdにあると想定):cd ~/workspace/softaworks/projects/web2md && npm install && npm run build && npm link- または:
cd ~/workspace/softaworks/projects/web2md && npm install && npm run build && npm install -g .
- 実行:
- 変換:
- 単一 URL → ファイル:
web2md '<url>' --out ./page.md
- 単一 URL → ディレクトリ内の自動命名ファイル:
mkdir -p ./out && web2md '<url>' --out ./out/
- 人間による検証/ログインの壁 (インタラクティブ):
mkdir -p ./out && web2md '<url>' --interactive --user-data-dir ./tmp/web2md-profile --out ./out/- その後: ブラウザウィンドウで確認を完了し、ターミナルで Enter キーを押して続行。
- stdout に出力:
web2md '<url>' --print
- 複数 URL (バッチ):
- 出力ディレクトリを作成 (例:
./out/) してから、--out ./out/を使用して各 URL に対して 1 つのweb2mdコマンドを実行
- 出力ディレクトリを作成 (例:
- 単一 URL → ファイル:
- 出力を検証:
- ファイルに書き込む場合は、ファイルが存在し、空でないことを確認 (例:
ls -la <path>およびwc -c <path>)。
- ファイルに書き込む場合は、ファイルが存在し、空でないことを確認 (例:
- 返す:
- 保存されたファイルパス、またはMarkdown (stdout モード)。
デフォルト (推奨)
- ほとんどのページ:
--wait-until networkidle2 - 負荷の大きいアプリ:
--wait-until domcontentloaded --wait-ms 2000で開始し、必要に応じて--wait-for 'main'(または別の安定したセレクタ) を追加。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- softaworks
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/softaworks/agent-toolkit / ライセンス: MIT
関連スキル
doubt-driven-development
重要な判断はすべて、本番環境への展開前に新しい視点から対抗的レビューを実施します。速度より正確性が重要な場合、不慣れなコードを扱う場合、本番環境・セキュリティに関わるロジック・取り消し不可の操作など影響度が高い場合、または後でバグを修正するよりも今検証する方が効率的な場合に活用してください。
apprun-skills
TypeScriptを使用したAppRunアプリケーションのMVU設計に関する総合的なガイダンスが得られます。コンポーネントパターン、イベントハンドリング、状態管理(非同期ジェネレータを含む)、パラメータと保護機能を備えたルーティング・ナビゲーション、vistestを使用したテストに対応しています。AppRunコンポーネントの設計・レビュー、ルートの配線、状態フローの管理、AppRunテストの作成時に活用してください。
desloppify
コードベースのヘルスチェックと技術負債の追跡ツールです。コード品質、技術負債、デッドコード、大規模ファイル、ゴッドクラス、重複関数、コードスメル、命名規則の問題、インポートサイクル、結合度の問題についてユーザーが質問した場合に使用してください。また、ヘルススコアの確認、次の改善項目の提案、クリーンアップ計画の作成をリクエストされた際にも対応します。29言語に対応しています。
debugging-and-error-recovery
テストが失敗したり、ビルドが壊れたり、動作が期待と異なったり、予期しないエラーが発生したりした場合に、体系的な根本原因デバッグをガイドします。推測ではなく、根本原因を見つけて修正するための体系的なアプローチが必要な場合に使用してください。
test-driven-development
テスト駆動開発により実装を進めます。ロジックの実装、バグの修正、動作の変更など、あらゆる場面で活用できます。コードが正常に動作することを証明する必要がある場合、バグ報告を受けた場合、既存機能を修正する予定がある場合に使用してください。
incremental-implementation
変更を段階的に実施します。複数のファイルに影響する機能や変更を実装する場合に使用してください。大量のコードを一度に書こうとしている場合や、タスクが一度では完結できないほど大きい場合に活用します。