Agent Skills by ALSEL
Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

crawl4ai-skill

LLM出力に最適化されたWebクローリング・スクレイピングツールで、DuckDuckGo検索・サイト巡回・動的ページの取得に対応。APIキー不要で無料利用でき、JavaScriptで生成される動的コンテンツも含めた柔軟なWeb情報収集が可能。

description の原文を見る

Web crawling and scraping tool with LLM-optimized output. 网页爬虫爬取工具 | Web crawler, web scraper, spider. DuckDuckGo search, site crawling, dynamic page scraping. 智能搜索爬取 | Free, no API key required.

SKILL.md 本文

Crawl4AI Skill - Webクローラー&スクレーパー

Web クローリング 网页爬虫 | Web スクレイピング 网页爬取 | LLM 最適化出力

インテリジェントな Web クローラーおよびスクレイピングツール。検索、全サイトクローリング、動的ページスクレイピングに対応。LLM最適化Markdown出力を備えた無料の Web クローラーおよびスクレイパーです。

コア機能 | Core Features

  • 🔍 Web 検索 网页搜索 - DuckDuckGo 検索、API キー不要
  • 🕷️ Web クローリング 网页爬虫 - サイトクローラー、スパイダー、サイトマップ認識
  • 📝 Web スクレイピング 网页抓取 - スマートスクレイパー、データ抽出
  • 📄 LLM最適化出力 - Markdown 形式、トークン使用量 80% 削減
  • 動的ページスクレイピング - JavaScript レンダリングページのクローリング

クイックスタート | Quick Start

インストール | Installation

pip install crawl4ai-skill

Web 検索 | 网页搜索

# Search the web with DuckDuckGo
crawl4ai-skill search "python web scraping"

Web スクレイピング | 单页爬取

# Scrape a single web page
crawl4ai-skill crawl https://example.com

Web クローリング | 全站爬虫

# Crawl entire website / spider
crawl4ai-skill crawl-site https://docs.python.org --max-pages 50

ユースケース | Use Cases

シナリオ 1:ドキュメントサイト用 Web クローラー | 文档站爬虫

# Crawl documentation site with spider
crawl4ai-skill crawl-site https://docs.fastapi.com --max-pages 100

クローラー出力 | Crawler Output:

  • ❌ 削除:ナビゲーションバー、サイドバー、広告
  • ✅ 保持:見出し、本文、コードブロック
  • 📊 トークン:50,000 → 10,000(-80%)

シナリオ 2:検索 + スクレイピング | 搜索+爬取

# Search and scrape top results
crawl4ai-skill search-and-crawl "Vue 3 best practices" --crawl-top 3

シナリオ 3:動的ページスクレイピング | 动态页面抓取

JavaScript でレンダリングされたページのスクレイピング(Xueqiu、Zhihu など):

# Scrape JavaScript-heavy pages
crawl4ai-skill crawl https://xueqiu.com/S/BIDU --wait-until networkidle --delay 2

コマンドリファレンス | Commands

コマンド Command説明 Description
search <query>Web 検索 网页搜索
crawl <url>Web スクレイピング 单页爬取
crawl-site <url>Web クローリング 全站爬虫
search-and-crawl <query>検索とスクレイピング 搜索并爬取

よく使用されるオプション | Common Options

# Web 検索 搜索
--num-results 10          # Number of results

# Web スクレイピング 爬取
--format fit_markdown     # Output format
--output result.md        # Output file
--wait-until networkidle  # Wait strategy for dynamic pages
--delay 2                 # Additional wait time (seconds)
--wait-for ".selector"    # Wait for specific element

# Web クローリング 爬虫
--max-pages 100          # Max pages to crawl
--max-depth 3            # Max crawl depth

出力形式 | Output Formats

fit_markdown(推奨 Recommended)

インテリジェント抽出、80% のトークン節約。Smart extraction, save 80% tokens.

crawl4ai-skill crawl https://example.com --format fit_markdown

raw_markdown

完全な構造を保持。Preserve full structure.

crawl4ai-skill crawl https://example.com --format raw_markdown

このクローラーを選ぶ理由 | Why This Crawler?

無料クローラー Free Crawler - API キー不要、すぐに利用可能
スマートスクレイパー Smart Scraper - ノイズを自動除去し、コアコンテンツを抽出
全サイトクローラー Site Crawler - サイトマップ対応、再帰的クローリング
動的スクレイピング Dynamic Scraping - JavaScript レンダリングページ対応
検索統合 Search Integration - DuckDuckGo 検索内蔵


リンク | Links

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
lancelin111
リポジトリ
lancelin111/crawl4ai-skill
ライセンス
MIT
最終更新
不明

Source: https://github.com/lancelin111/crawl4ai-skill / ライセンス: MIT

関連スキル

OpenAILLM・AI開発⭐ リポ 6,054

agent-browser

AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。

by JimmyLv
汎用LLM・AI開発⭐ リポ 1,982

anyskill

AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 1,982

engram

AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。

by LeoYeAI
汎用LLM・AI開発⭐ リポ 21,584

skyvern

AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。

by Skyvern-AI
汎用LLM・AI開発⭐ リポ 1,149

pinchbench

PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。

by pinchbench
汎用LLM・AI開発⭐ リポ 4,693

openui

OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。

by thesysdev
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: lancelin111 · lancelin111/crawl4ai-skill · ライセンス: MIT