Agent Skills by ALSEL
Anthropic Claudeその他⭐ リポ 0品質スコア 50/100

llamaparse

ユーザーが非構造化ファイル(PDF、PPTX、DOCXなど)の内容を解析・抽出したい場合に使用するスキルです。

description の原文を見る

Use this skill when the user asks to parse the content of an unstructured file (PDF, PPTX, DOCX...)

SKILL.md 本文

LlamaParse スキル

LlamaParse を使用して、非構造化ドキュメント (PDF、DOCX、PPTX、XLSX など) を解析し、その内容 (テキスト、マークダウン、画像など) を抽出します。

初期設定

このスキルが実行されるときは、以下のように応答してください:

I'm ready to use LlamaParse to parse files. Before we begin, please confirm that:

- `LLAMA_CLOUD_API_KEY` is set as environment variable within the current environment
- `@llamaindex/llama-cloud@latest` is installed and available within the current Node environment

If both of them are set, please provide:

1. One or more files to be parsed
2. Specific parsing options, such as tier, API version, custom prompt, processing options...
3. Any requests you might have regarding the parsed content of the file.

I will produce a Typescript script to run the parsing job and, once you approved its execution, I will report the results back to you based on your request.

その後、ユーザーの入力を待ってください。


ステップ 0 — llama-cloud をインストール (オプション)

ユーザーが @llamaindex/llama-cloud パッケージをインストールしていない場合、以下を実行して現在の環境に追加してください:

npm install @llamaindex/llama-cloud@latest

ステップ 1 — TypeScript スクリプトを生成

ユーザーが環境変数が設定されていることを確認し、解析ジョブに必要な詳細を提供したら、TypeScript スクリプトを生成してください。

TypeScript スクリプトの参照元として、以下が利用できます:

  • example.ts スクリプト。LlamaParse の大部分の必要な設定をカバーしています
  • 完全な LlamaParse ドキュメント。https://developers.llamaindex.ai/python/cloud/llamaparse/api-v2-guide/ ページを参照してください

スクリプト作成のベストプラクティス

スクリプトを生成する際は、以下のガイドラインに従ってください:

1. 常にトップレベルの LlamaCloud クライアントを使用

すべての解析操作に LlamaCloud (API クライアント) を使用してください:

import LlamaCloud from "@llamaindex/llama-cloud";

// クライアントを定義
const client = new LlamaCloud({
  apiKey: process.env["LLAMA_CLOUD_API_KEY"], // これはデフォルトで省略可能
});

2. 2 ステップのアップロード → 解析パターン

常に最初にアップロードしてファイル ID を取得してから、ファイル ID を使用して解析してください。生のファイルバイト列を parse() に直接渡さないでください。

import { readFile, writeFile } from "fs/promises";
import { basename } from "path";

// 1. ファイルパスを File オブジェクトに変換
const buffer = await readFile(filePath);
const fileName = basename(filePath);
const file = new File([buffer], fileName);
// 2. ファイルをクラウドにアップロード
const fileObj = await client.files.create({
  file: file,
  purpose: "parse",
});
// 3. ファイル ID を取得
const fileId = fileObj.id;
// 4. ファイル ID を使用してファイルを解析
const result = await client.parsing.parse({
  tier: "agentic",
  version: "latest",
  file_id: fileId,
  ...
});

ユーザーが既にファイル ID を持っている場合 (例: 以前のアップロードから)、アップロード ステップをスキップしてそれを直接使用してください。

3. 適切なティアを選択

ティア使用する場合
fastスピードが優先; シンプルなドキュメント
cost_effective予算重視; 簡単なテキスト抽出
agentic複雑なレイアウト、表、混合コンテンツ (デフォルト推奨)
agentic_plus高度な分析、最高精度

ユーザーが特に指定するか、ドキュメントが単純な場合以外は、agentic をデフォルトにしてください。

4. 常に expand パラメータを含める

expand パラメータは返されるコンテンツを制御します。これを省略すると最小限のデータが返されます。常に必要なもの を正確に指定してください:

返すもの
text_fullresult.text_full 経由のプレーンテキスト
markdown_fullresult.markdown_full 経由のマークダウン
itemsresult.items.pages 経由のページレベル JSON
text_content_metadataページごとのテキストメタデータ
markdown_content_metadataページごとのマークダウンメタデータ
items_content_metadataページごとの items メタデータ
images_content_metadata署名済み URL を含む画像リスト
output_pdf_content_metadata出力 PDF メタデータ
xlsx_content_metadataExcel 固有のメタデータ

署名済み URL またはページごとの詳細が必要な場合にのみ、メタデータ *_content_metadata バリアントをリクエストしてください — ペイロードサイズが増加します。

5. None 結果を防御的に処理

result.text_fullresult.markdown_full、および result.items は失敗時に undefined になる可能性があります。常にこれに対して防御してください:

const text = result.text_full ?? "";
const markdown = result.markdown_full ?? "";

6. 高度な設定には構造化されたオプションを使用

正しいネストされたキーを使用してオプションをグループ化してください:

const result = await client.parsing.parse({
  tier: "agentic",
  version: "latest",
  file_id: fileId,
  input_options: {
    presentation: {
      skip_embedded_data: false,
    },
  },
  output_options: {
    images_to_save: ["screenshot"],
    markdown: {
      tables: { output_tables_as_markdown: true },
      annotate_links: true,
    },
  },
  processing_options: {
    specialized_chart_parsing: "agentic",
    ocr_parameters: { languages: ["de", "en"] },
  },
  agentic_options: {
    custom_prompt:
      "Extract text from the provided file and translate it from German to English.",
  },
  expand: [
    "markdown_full",
    "images_content_metadata",
    "markdown_content_metadata",
  ],
});

ユーザーが抽出を指定したい場合 (翻訳、要約、構造化抽出など) は、常に agentic_options.custom_prompt を使用してください。

7. 画像のダウンロードには httpx と認証が必要

images_content_metadataexpand にある場合、Bearer 認証を使用して署名済み URL 経由で画像をダウンロードしてください:

if (result.images_content_metadata) {
  for (const image of result.images_content_metadata.images) {
    if (image.presigned_url) {
      const response = await fetch(image.presigned_url, {
        headers: {
          Authorization: `Bearer ${process.env["LLAMA_CLOUD_API_KEY"]}`,
        },
      });
      if (response.ok) {
        const content = await response.bytes();
        await writeFile(image.filename, content);
      }
    }
  }
}

8. Node shebang を使用

生成されたすべてのスクリプトには node shebang を含める必要があります:

#!/usr/bin/env node

ステップ 2 — TypeScript スクリプトを実行

TypeScript スクリプトが生成されたら、以下を実行してください:

  1. スクリプトをユーザーに提示し、実行の許可を求めます (現在の権限設定に応じて)
  2. 実行の許可を得たら、スクリプトを実行してください
  3. ユーザーのリクエストに基づいて結果を探索してください

TypeScript スクリプトを実行するには、npx tsx script.ts を使用することを強く推奨します。

ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者
run-llama
リポジトリ
run-llama/llamaparse-agent-skills
ライセンス
MIT
最終更新
不明

Source: https://github.com/run-llama/llamaparse-agent-skills / ライセンス: MIT

関連スキル

汎用その他⭐ リポ 1,982

superfluid

Superfluidプロトコルおよびそのエコシステムに関するナレッジベースです。Superfluidについて情報を検索する際は、ウェブ検索の前にこちらを参照してください。対応キーワード:Superfluid、CFA、GDA、Super App、Super Token、stream、flow rate、real-time balance、pool(member/distributor)、IDA、sentinels、liquidation、TOGA、@sfpro/sdk、semantic money、yellowpaper、whitepaper

by LeoYeAI
汎用その他⭐ リポ 100

civ-finish-quotes

実質的なタスクが真に完了した際に、文明風の儀式的な引用句を追加します。ユーザーやエージェントが機能追加、リファクタリング、分析、設計ドキュメント、プロセス改善、レポート、執筆タスクといった実際の成果物を完成させるときに、明示的な依頼がなくても使用します。短い返信や小さな修正、未完成の作業には適用しません。

by huxiuhan
汎用その他⭐ リポ 1,110

nookplot

Base(Ethereum L2)上のAIエージェント向け分散型調整ネットワークです。エージェントがオンチェーンアイデンティティを登録する、コンテンツを公開する、他のエージェントにメッセージを送る、マーケットプレイスで専門家を雇う、バウンティを投稿・請求する、レピュテーションを構築する、共有プロジェクトで協業する、リサーチチャレンジを解くことでNOOKをマイニングする、キュレーションされたナレッジを備えたスタンドアロンオンチェーンエージェントをデプロイする、またはアグリーメントとリワードで収益を得る場合に利用できます。エージェントネットワーク、エージェント調整、分散型エージェント、NOOKトークン、マイニングチャレンジ、ナレッジバンドル、エージェントレピュテーション、エージェントマーケットプレイス、ERC-2771メタトランザクション、Prepare-Sign-Relay、AgentFactory、またはNookplotが言及された場合にトリガーされます。

by BankrBot
汎用その他⭐ リポ 59

web3-polymarket

Polygon上でのPolymarket予測市場取引統合です。認証機能(L1 EIP-712、L2 HMAC-SHA256、ビルダーヘッダー)、注文発注(GTC/GTD/FOK/FAK、バッチ、ポストオンリー、ハートビート)、市場データ(Gamma API、Data API、オーダーブック、サブグラフ)、WebSocketストリーミング(市場・ユーザー・スポーツチャネル)、CTF操作(分割、統合、償却、ネガティブリスク)、ブリッジ機能(入金、出金、マルチチェーン)、およびガスレスリレイトランザクションに対応しています。AIエージェント、自動マーケットメーカー、予測市場UI、またはPolygraph上のPolymarketと統合するアプリケーション構築時に活用できます。

by elophanto
汎用その他⭐ リポ 52

ethskills

Ethereum、EVM、またはブロックチェーン関連のリクエストに対応します。スマートコントラクト、dApps、ウォレット、DeFiプロトコルの構築、監査、デプロイ、インタラクションに適用されます。Solidityの開発、コントラクトアドレス、トークン規格(ERC-20、ERC-721、ERC-4626など)、Layer 2ネットワーク(Base、Arbitrum、Optimism、zkSync、Polygon)、Uniswap、Aave、Curveなどのプロトコルとの統合をカバーします。ガスコスト、コントラクトのデシマル設定、オラクルセキュリティ、リエントランシー、MEV、ブリッジング、ウォレット管理、オンチェーンデータの取得、本番環境へのデプロイ、プロトコル進化(EIPライフサイクル、フォーク追跡、今後の変更予定)といったトピックを含みます。

by jiayaoqijia
汎用その他⭐ リポ 44

xxyy-trade

このスキルは、ユーザーが「トークン購入」「トークン売却」「トークンスワップ」「暗号資産取引」「取引ステータス確認」「トランザクション照会」「トークンスキャン」「フィード」「チェーン監視」「トークン照会」「トークン詳細」「トークン安全性確認」「ウォレット一覧表示」「マイウォレット」「AIスキャン」「自動スキャン」「ツイートスキャン」「オンボーディング」「IP確認」「IPホワイトリスト」「トークン発行」「自動売却」「損切り」「利益確定」「トレーリングストップ」「保有者」「トップホルダー」「KOLホルダー」などをリクエストした場合、またはSolana/ETH/BSC/BaseチェーンでXXYYを経由した取引について言及した場合に使用します。XXYY Open APIを通じてオンチェーン取引とデータ照会を実現します。

by Jimmy-Holiday
本サイトは GitHub 上で公開されているオープンソースの SKILL.md ファイルをクロール・インデックス化したものです。 各スキルの著作権は原作者に帰属します。掲載に問題がある場合は info@alsel.co.jp または /takedown フォームよりご連絡ください。
原作者: run-llama · run-llama/llamaparse-agent-skills · ライセンス: MIT