huggingface-paper-publisher
Hugging Face Hub に研究論文を公開・管理します。論文ページの作成、モデルやデータセットへの論文リンク付け、著者権の申請、Markdownベースのプロフェッショナルな研究記事の生成をサポートします。
description の原文を見る
Publish and manage research papers on Hugging Face Hub. Supports creating paper pages, linking papers to models/datasets, claiming authorship, and generating professional markdown-based research articles.
SKILL.md 本文
概要
このスキルは、AI エンジニアと研究者が Hugging Face Hub で研究論文を公開、管理、リンクするための包括的なツールを提供します。論文の作成から公開までのワークフローを合理化し、arXiv との統合、モデル/データセットのリンク、著者管理を含みます。
HF エコシステムとの統合
- 論文ページ: Hugging Face Hub 上の論文をインデックスして発見
- arXiv 統合: arXiv ID から自動的に論文をインデックス
- モデル/データセットのリンク: メタデータを通じて論文を関連成果物に接続
- 著者認証: 論文の著者権を主張・認証
- 研究論文テンプレート: プロフェッショナルで最新の科学論文を生成
バージョン
1.0.0
依存関係
付属スクリプトは PEP 723 インラインパッケージを使用します。手動環境セットアップより uv run を推奨します。
- huggingface_hub>=0.26.0
- pyyaml>=6.0.3
- requests>=2.32.5
- markdown>=3.5.0
- python-dotenv>=1.2.1
コア機能
1. 論文ページ管理
- 論文のインデックス: arXiv から Hugging Face に論文を追加
- 著者権を主張: 公開された論文の著者権を認証・主張
- 表示管理: プロフィールに表示する論文を制御
- 論文の発見: HF エコシステムで論文を検索・探索
2. 論文と成果物のリンク
- モデルカード: モデルメタデータに論文引用を追加
- データセットカード: README 経由で論文をデータセットにリンク
- 自動タグ付け: Hub が自動的に arxiv:<PAPER_ID> タグを生成
- 引用管理: 適切な帰属とリファレンスを維持
3. 研究論文の作成
- Markdown テンプレート: プロフェッショナルな論文フォーマットを生成
- モダンデザイン: 読みやすく整理された研究論文レイアウト
- 動的目次: 自動的に目次を生成
- セクション構造: 標準的な科学論文の組織
- LaTeX 数式: 方程式と技術記号に対応
4. メタデータ管理
- YAML フロントマター: 適切なモデル/データセットカードメタデータ
- 引用追跡: リポジトリ全体で論文参考文献を維持
- バージョン管理: 論文の更新と改訂を追跡
- 複数論文対応: 単一成果物に複数論文をリンク
使用方法
このスキルは scripts/ 内に論文公開操作用の Python スクリプトを含みます。
前提条件
uv runでスクリプトを実行します(依存関係はスクリプトヘッダーから解決されます)HF_TOKEN環境変数に書き込みアクセストークンを設定
すべてのパスは、この SKILL.md ファイルを含むディレクトリからの相対パスです。 スクリプトを実行する前に、まずそのディレクトリに
cdするか、完全なパスを使用してください。
方法 1: arXiv から論文をインデックス
arXiv から論文を Hugging Face Paper Pages に追加します。
基本的な使用方法:
uv run scripts/paper_manager.py index \
--arxiv-id "2301.12345"
論文が存在するか確認:
uv run scripts/paper_manager.py check \
--arxiv-id "2301.12345"
直接 URL アクセス:
https://huggingface.co/papers/{arxiv-id} に直接アクセスして論文をインデックスすることもできます。
方法 2: 論文をモデル/データセットにリンク
適切な YAML メタデータを使用して、論文参考文献をモデルまたはデータセット README に追加します。
モデルカードに追加:
uv run scripts/paper_manager.py link \
--repo-id "username/model-name" \
--repo-type "model" \
--arxiv-id "2301.12345"
データセットカードに追加:
uv run scripts/paper_manager.py link \
--repo-id "username/dataset-name" \
--repo-type "dataset" \
--arxiv-id "2301.12345"
複数の論文を追加:
uv run scripts/paper_manager.py link \
--repo-id "username/model-name" \
--repo-type "model" \
--arxiv-ids "2301.12345,2302.67890,2303.11111"
カスタム引用付き:
uv run scripts/paper_manager.py link \
--repo-id "username/model-name" \
--repo-type "model" \
--arxiv-id "2301.12345" \
--citation "$(cat citation.txt)"
リンク機能の仕組み
モデルまたはデータセット README に arXiv 論文リンクを追加する場合:
- Hub は リンクから arXiv ID を抽出
arxiv:<PAPER_ID>タグが自動的にリポジトリに追加- ユーザーはタグをクリックして論文ページを表示
- 論文ページはこの論文を引用するすべてのモデル/データセットを表示
- 論文はフィルタと検索で発見可能
方法 3: 著者権を主張
Hugging Face で公開された論文の著者権を検証します。
主張プロセスを開始:
uv run scripts/paper_manager.py claim \
--arxiv-id "2301.12345" \
--email "your.email@institution.edu"
手動プロセス:
- 論文ページに移動:
https://huggingface.co/papers/{arxiv-id} - 著者一覧から自分の名前を見つける
- 自分の名前をクリックして「著者権を主張」を選択
- 管理チームの検証を待つ
著者権のステータスを確認:
uv run scripts/paper_manager.py check-authorship \
--arxiv-id "2301.12345"
方法 4: 論文の表示管理
検証済みの論文がパブリックプロフィールに表示されるかを制御します。
あなたの論文を一覧:
uv run scripts/paper_manager.py list-my-papers
表示を切り替え:
uv run scripts/paper_manager.py toggle-visibility \
--arxiv-id "2301.12345" \
--show true
設定で管理: アカウント設定 → 論文セクションに移動し、各論文の「プロフィールに表示」を切り替えます。
方法 5: 研究論文を作成
モダンテンプレートを使用してプロフェッショナルな Markdown ベースの研究論文を生成します。
テンプレートから作成:
uv run scripts/paper_manager.py create \
--template "standard" \
--title "Your Paper Title" \
--output "paper.md"
利用可能なテンプレート:
standard- 伝統的な科学論文構成modern- Distill にインスパイアされたクリーンで Web フレンドリーなフォーマットarxiv- arXiv スタイルのフォーマットml-report- 機械学習実験レポート
完全な論文を生成:
uv run scripts/paper_manager.py create \
--template "modern" \
--title "Fine-Tuning Large Language Models with LoRA" \
--authors "Jane Doe, John Smith" \
--abstract "$(cat abstract.txt)" \
--output "paper.md"
HTML に変換:
uv run scripts/paper_manager.py convert \
--input "paper.md" \
--output "paper.html" \
--style "modern"
論文テンプレート構造
標準的な研究論文セクション:
---
title: Your Paper Title
authors: Jane Doe, John Smith
affiliations: University X, Lab Y
date: 2025-01-15
arxiv: 2301.12345
tags: [machine-learning, nlp, fine-tuning]
---
# Abstract
Brief summary of the paper...
# 1. Introduction
Background and motivation...
# 2. Related Work
Previous research and context...
# 3. Methodology
Approach and implementation...
# 4. Experiments
Setup, datasets, and procedures...
# 5. Results
Findings and analysis...
# 6. Discussion
Interpretation and implications...
# 7. Conclusion
Summary and future work...
# References
モダンテンプレートの機能:
- 動的な目次
- Web 表示用のレスポンシブデザイン
- コード構文のハイライト
- インタラクティブな図表
- 数式レンダリング (LaTeX)
- 引用管理
- 著者所属のリンク
コマンドリファレンス
論文をインデックス:
uv run scripts/paper_manager.py index --arxiv-id "2301.12345"
リポジトリにリンク:
uv run scripts/paper_manager.py link \
--repo-id "username/repo-name" \
--repo-type "model|dataset|space" \
--arxiv-id "2301.12345" \
[--citation "Full citation text"] \
[--create-pr]
著者権を主張:
uv run scripts/paper_manager.py claim \
--arxiv-id "2301.12345" \
--email "your.email@edu"
表示を管理:
uv run scripts/paper_manager.py toggle-visibility \
--arxiv-id "2301.12345" \
--show true|false
研究論文を作成:
uv run scripts/paper_manager.py create \
--template "standard|modern|arxiv|ml-report" \
--title "Paper Title" \
[--authors "Author1, Author2"] \
[--abstract "Abstract text"] \
[--output "filename.md"]
Markdown を HTML に変換:
uv run scripts/paper_manager.py convert \
--input "paper.md" \
--output "paper.html" \
[--style "modern|classic"]
論文のステータスを確認:
uv run scripts/paper_manager.py check --arxiv-id "2301.12345"
あなたの論文を一覧:
uv run scripts/paper_manager.py list-my-papers
論文を検索:
uv run scripts/paper_manager.py search --query "transformer attention"
YAML メタデータフォーマット
論文をモデルまたはデータセットにリンクする場合、適切な YAML フロントマターが必要です:
モデルカードの例:
---
language:
- en
license: apache-2.0
tags:
- text-generation
- transformers
- llm
library_name: transformers
---
# Model Name
This model is based on the approach described in [Our Paper](https://arxiv.org/abs/2301.12345).
## Citation
```bibtex
@article{doe2023paper,
title={Your Paper Title},
author={Doe, Jane and Smith, John},
journal={arXiv preprint arXiv:2301.12345},
year={2023}
}
**データセットカードの例:**
```yaml
---
language:
- en
license: cc-by-4.0
task_categories:
- text-generation
- question-answering
size_categories:
- 10K<n<100K
---
# Dataset Name
Dataset introduced in [Our Paper](https://arxiv.org/abs/2301.12345).
For more details, see the [paper page](https://huggingface.co/papers/2301.12345).
Hub は自動的にこれらのリンクから arXiv ID を抽出し、arxiv:2301.12345 タグを作成します。
統合の例
ワークフロー 1: 新規研究の公開
# 1. 研究論文を作成
uv run scripts/paper_manager.py create \
--template "modern" \
--title "Novel Fine-Tuning Approach" \
--output "paper.md"
# 2. paper.md をコンテンツで編集
# 3. arXiv に提出 (外部プロセス)
# arxiv.org にアップロード、arXiv ID を取得
# 4. Hugging Face でインデックス
uv run scripts/paper_manager.py index --arxiv-id "2301.12345"
# 5. モデルにリンク
uv run scripts/paper_manager.py link \
--repo-id "your-username/your-model" \
--repo-type "model" \
--arxiv-id "2301.12345"
# 6. 著者権を主張
uv run scripts/paper_manager.py claim \
--arxiv-id "2301.12345" \
--email "your.email@edu"
ワークフロー 2: 既存論文をリンク
# 1. 論文が存在するか確認
uv run scripts/paper_manager.py check --arxiv-id "2301.12345"
# 2. 必要に応じてインデックス
uv run scripts/paper_manager.py index --arxiv-id "2301.12345"
# 3. 複数のリポジトリにリンク
uv run scripts/paper_manager.py link \
--repo-id "username/model-v1" \
--repo-type "model" \
--arxiv-id "2301.12345"
uv run scripts/paper_manager.py link \
--repo-id "username/training-data" \
--repo-type "dataset" \
--arxiv-id "2301.12345"
uv run scripts/paper_manager.py link \
--repo-id "username/demo-space" \
--repo-type "space" \
--arxiv-id "2301.12345"
ワークフロー 3: 論文参考文献でモデルを更新
# 1. 現在の README を取得
hf download username/model-name README.md
# 2. 論文リンクを追加
uv run scripts/paper_manager.py link \
--repo-id "username/model-name" \
--repo-type "model" \
--arxiv-id "2301.12345" \
--citation "Full citation for the paper"
# スクリプトは以下を実行します:
# - 必要に応じて YAML メタデータを追加
# - README に arXiv リンクを挿入
# - フォーマットされた引用を追加
# - 既存のコンテンツを保持
ベストプラクティス
-
論文のインデックス
- arXiv に公開されたら、すぐに論文をインデックス
- モデル/データセットカードに完全な引用情報を含める
- 関連リポジトリ全体で一貫した論文参考文献を使用
-
メタデータ管理
- すべてのモデル/データセットカードに YAML フロントマターを追加
- 適切なライセンス情報を含める
- 関連するタスクカテゴリとドメインでタグ付け
-
著者権
- 著者として記載されている論文の著者権を主張
- 検証用に機関のメールアドレスを使用
- 論文の表示設定を更新された状態に保つ
-
リポジトリのリンク
- 関連するすべてのモデル、データセット、Space に論文をリンク
- README の説明に論文のコンテキストを含める
- 参照が容易なように BibTeX 引用を追加
-
研究論文
- プロジェクト内でテンプレートを一貫して使用
- 論文にコードとデータのリンクを含める
- 共有用に Web フレンドリーな HTML バージョンを生成
高度な使用方法
複数の論文をバッチリンク:
# 1 つのリポジトリに複数の論文をリンク
for arxiv_id in "2301.12345" "2302.67890" "2303.11111"; do
uv run scripts/paper_manager.py link \
--repo-id "username/model-name" \
--repo-type "model" \
--arxiv-id "$arxiv_id"
done
論文情報を抽出:
# arXiv からメタデータを取得
uv run scripts/paper_manager.py info \
--arxiv-id "2301.12345" \
--format "json"
引用を生成:
# BibTeX 引用を作成
uv run scripts/paper_manager.py citation \
--arxiv-id "2301.12345" \
--format "bibtex"
リンクを検証:
# リポジトリ内のすべての論文リンクを確認
uv run scripts/paper_manager.py validate \
--repo-id "username/model-name" \
--repo-type "model"
エラーハンドリング
- 論文が見つからない: arXiv ID が存在しないか、まだインデックスされていない
- アクセス権限がない: HF_TOKEN がリポジトリへの書き込みアクセスを持っていない
- 無効な YAML: README フロントマターの形式が不正
- 著者権申請失敗: メールが論文の著者レコードと一致していない
- 既に主張済み: 別のユーザーが著者権を主張済み
- レート制限: 短時間に API リクエストが多すぎる
トラブルシューティング
問題: "論文が Hugging Face で見つかりません"
- 解決策:
hf.co/papers/{arxiv-id}にアクセスしてインデックスをトリガー
問題: "著者権の主張が検証されていません"
- 解決策: 管理レビューを待つか、HF サポートに連絡して証拠を提出
問題: "arXiv タグが表示されていません"
- 解決策: README に適切な arXiv URL 形式が含まれていることを確認
問題: "リポジトリにリンクできません"
- 解決策: HF_TOKEN に書き込み権限があることを確認
問題: "テンプレートレンダリングエラー"
- 解決策: Markdown の構文と YAML フロントマター形式を確認
リソースとリファレンス
- Hugging Face 論文ページ: hf.co/papers
- モデルカード ガイド: hf.co/docs/hub/model-cards
- データセットカード ガイド: hf.co/docs/hub/datasets-cards
- 研究論文テンプレート: tfrere/research-article-template
- arXiv フォーマット ガイド: arxiv.org/help/submit
tfrere の研究テンプレートとの統合
このスキルは tfrere の研究論文テンプレート を補完し、以下を提供します:
- 自動化された論文インデックス化ワークフロー
- リポジトリリンク機能
- メタデータ管理ツール
- 引用生成ユーティリティ
tfrere のテンプレートで執筆し、このスキルを使用して論文を Hugging Face Hub で公開・リンクできます。
よくあるパターン
パターン 1: 新規論文の公開
# 執筆 → 公開 → インデックス → リンク
uv run scripts/paper_manager.py create --template modern --output paper.md
# (arXiv に提出)
uv run scripts/paper_manager.py index --arxiv-id "2301.12345"
uv run scripts/paper_manager.py link --repo-id "user/model" --arxiv-id "2301.12345"
パターン 2: 既存論文の発見
# 検索 → 確認 → リンク
uv run scripts/paper_manager.py search --query "transformers"
uv run scripts/paper_manager.py check --arxiv-id "2301.12345"
uv run scripts/paper_manager.py link --repo-id "user/model" --arxiv-id "2301.12345"
パターン 3: 著者ポートフォリオ管理
# 主張 → 検証 → 整理
uv run scripts/paper_manager.py claim --arxiv-id "2301.12345"
uv run scripts/paper_manager.py list-my-papers
uv run scripts/paper_manager.py toggle-visibility --arxiv-id "2301.12345" --show true
API 統合
Python スクリプトの例:
from scripts.paper_manager import PaperManager
pm = PaperManager(hf_token="your_token")
# 論文をインデックス
pm.index_paper("2301.12345")
# モデルにリンク
pm.link_paper(
repo_id="username/model",
repo_type="model",
arxiv_id="2301.12345",
citation="Full citation text"
)
# ステータスを確認
status = pm.check_paper("2301.12345")
print(status)
今後の改善
今後のバージョン予定の機能:
- 非 arXiv 論文のサポート (学会論文、学術誌)
- DOI からの自動引用フォーマット化
- 論文比較とバージョン管理ツール
- 協調論文執筆機能
- LaTeX ワークフローとの統合
- 自動図表抽出
- 論文メトリクスと影響度追跡
ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- huggingface
- リポジトリ
- huggingface/skills
- ライセンス
- Apache-2.0
- 最終更新
- 不明
Source: https://github.com/huggingface/skills / ライセンス: Apache-2.0
関連スキル
superfluid
Superfluidプロトコルおよびそのエコシステムに関するナレッジベースです。Superfluidについて情報を検索する際は、ウェブ検索の前にこちらを参照してください。対応キーワード:Superfluid、CFA、GDA、Super App、Super Token、stream、flow rate、real-time balance、pool(member/distributor)、IDA、sentinels、liquidation、TOGA、@sfpro/sdk、semantic money、yellowpaper、whitepaper
civ-finish-quotes
実質的なタスクが真に完了した際に、文明風の儀式的な引用句を追加します。ユーザーやエージェントが機能追加、リファクタリング、分析、設計ドキュメント、プロセス改善、レポート、執筆タスクといった実際の成果物を完成させるときに、明示的な依頼がなくても使用します。短い返信や小さな修正、未完成の作業には適用しません。
nookplot
Base(Ethereum L2)上のAIエージェント向け分散型調整ネットワークです。エージェントがオンチェーンアイデンティティを登録する、コンテンツを公開する、他のエージェントにメッセージを送る、マーケットプレイスで専門家を雇う、バウンティを投稿・請求する、レピュテーションを構築する、共有プロジェクトで協業する、リサーチチャレンジを解くことでNOOKをマイニングする、キュレーションされたナレッジを備えたスタンドアロンオンチェーンエージェントをデプロイする、またはアグリーメントとリワードで収益を得る場合に利用できます。エージェントネットワーク、エージェント調整、分散型エージェント、NOOKトークン、マイニングチャレンジ、ナレッジバンドル、エージェントレピュテーション、エージェントマーケットプレイス、ERC-2771メタトランザクション、Prepare-Sign-Relay、AgentFactory、またはNookplotが言及された場合にトリガーされます。
web3-polymarket
Polygon上でのPolymarket予測市場取引統合です。認証機能(L1 EIP-712、L2 HMAC-SHA256、ビルダーヘッダー)、注文発注(GTC/GTD/FOK/FAK、バッチ、ポストオンリー、ハートビート)、市場データ(Gamma API、Data API、オーダーブック、サブグラフ)、WebSocketストリーミング(市場・ユーザー・スポーツチャネル)、CTF操作(分割、統合、償却、ネガティブリスク)、ブリッジ機能(入金、出金、マルチチェーン)、およびガスレスリレイトランザクションに対応しています。AIエージェント、自動マーケットメーカー、予測市場UI、またはPolygraph上のPolymarketと統合するアプリケーション構築時に活用できます。
ethskills
Ethereum、EVM、またはブロックチェーン関連のリクエストに対応します。スマートコントラクト、dApps、ウォレット、DeFiプロトコルの構築、監査、デプロイ、インタラクションに適用されます。Solidityの開発、コントラクトアドレス、トークン規格(ERC-20、ERC-721、ERC-4626など)、Layer 2ネットワーク(Base、Arbitrum、Optimism、zkSync、Polygon)、Uniswap、Aave、Curveなどのプロトコルとの統合をカバーします。ガスコスト、コントラクトのデシマル設定、オラクルセキュリティ、リエントランシー、MEV、ブリッジング、ウォレット管理、オンチェーンデータの取得、本番環境へのデプロイ、プロトコル進化(EIPライフサイクル、フォーク追跡、今後の変更予定)といったトピックを含みます。
xxyy-trade
このスキルは、ユーザーが「トークン購入」「トークン売却」「トークンスワップ」「暗号資産取引」「取引ステータス確認」「トランザクション照会」「トークンスキャン」「フィード」「チェーン監視」「トークン照会」「トークン詳細」「トークン安全性確認」「ウォレット一覧表示」「マイウォレット」「AIスキャン」「自動スキャン」「ツイートスキャン」「オンボーディング」「IP確認」「IPホワイトリスト」「トークン発行」「自動売却」「損切り」「利益確定」「トレーリングストップ」「保有者」「トップホルダー」「KOLホルダー」などをリクエストした場合、またはSolana/ETH/BSC/BaseチェーンでXXYYを経由した取引について言及した場合に使用します。XXYY Open APIを通じてオンチェーン取引とデータ照会を実現します。