Anthropic Claudeその他⭐ リポ 0品質スコア 50/100

huggingface-paper-publisher

Name: huggingface-paper-publisher
Author: huggingface

Hugging Face Hub に研究論文を公開・管理します。論文ページの作成、モデルやデータセットへの論文リンク付け、著者権の申請、Markdownベースのプロフェッショナルな研究記事の生成をサポートします。

description の原文を見る

Publish and manage research papers on Hugging Face Hub. Supports creating paper pages, linking papers to models/datasets, claiming authorship, and generating professional markdown-based research articles.

SKILL.md 本文

概要

このスキルは、AI エンジニアと研究者が Hugging Face Hub で研究論文を公開、管理、リンクするための包括的なツールを提供します。論文の作成から公開までのワークフローを合理化し、arXiv との統合、モデル/データセットのリンク、著者管理を含みます。

HF エコシステムとの統合

論文ページ: Hugging Face Hub 上の論文をインデックスして発見
arXiv 統合: arXiv ID から自動的に論文をインデックス
モデル/データセットのリンク: メタデータを通じて論文を関連成果物に接続
著者認証: 論文の著者権を主張・認証
研究論文テンプレート: プロフェッショナルで最新の科学論文を生成

バージョン

1.0.0

依存関係

付属スクリプトは PEP 723 インラインパッケージを使用します。手動環境セットアップより uv run を推奨します。

huggingface_hub>=0.26.0
pyyaml>=6.0.3
requests>=2.32.5
markdown>=3.5.0
python-dotenv>=1.2.1

コア機能

1. 論文ページ管理

論文のインデックス: arXiv から Hugging Face に論文を追加
著者権を主張: 公開された論文の著者権を認証・主張
表示管理: プロフィールに表示する論文を制御
論文の発見: HF エコシステムで論文を検索・探索

2. 論文と成果物のリンク

モデルカード: モデルメタデータに論文引用を追加
データセットカード: README 経由で論文をデータセットにリンク
自動タグ付け: Hub が自動的に arxiv:<PAPER_ID> タグを生成
引用管理: 適切な帰属とリファレンスを維持

3. 研究論文の作成

Markdown テンプレート: プロフェッショナルな論文フォーマットを生成
モダンデザイン: 読みやすく整理された研究論文レイアウト
動的目次: 自動的に目次を生成
セクション構造: 標準的な科学論文の組織
LaTeX 数式: 方程式と技術記号に対応

4. メタデータ管理

YAML フロントマター: 適切なモデル/データセットカードメタデータ
引用追跡: リポジトリ全体で論文参考文献を維持
バージョン管理: 論文の更新と改訂を追跡
複数論文対応: 単一成果物に複数論文をリンク

使用方法

このスキルは scripts/ 内に論文公開操作用の Python スクリプトを含みます。

前提条件

uv run でスクリプトを実行します（依存関係はスクリプトヘッダーから解決されます）
HF_TOKEN 環境変数に書き込みアクセストークンを設定

すべてのパスは、この SKILL.md ファイルを含むディレクトリからの相対パスです。 スクリプトを実行する前に、まずそのディレクトリに cd するか、完全なパスを使用してください。

方法 1: arXiv から論文をインデックス

arXiv から論文を Hugging Face Paper Pages に追加します。

基本的な使用方法:

uv run scripts/paper_manager.py index \
  --arxiv-id "2301.12345"

論文が存在するか確認:

uv run scripts/paper_manager.py check \
  --arxiv-id "2301.12345"

直接 URL アクセス: https://huggingface.co/papers/{arxiv-id} に直接アクセスして論文をインデックスすることもできます。

方法 2: 論文をモデル/データセットにリンク

適切な YAML メタデータを使用して、論文参考文献をモデルまたはデータセット README に追加します。

モデルカードに追加:

uv run scripts/paper_manager.py link \
  --repo-id "username/model-name" \
  --repo-type "model" \
  --arxiv-id "2301.12345"

データセットカードに追加:

uv run scripts/paper_manager.py link \
  --repo-id "username/dataset-name" \
  --repo-type "dataset" \
  --arxiv-id "2301.12345"

複数の論文を追加:

uv run scripts/paper_manager.py link \
  --repo-id "username/model-name" \
  --repo-type "model" \
  --arxiv-ids "2301.12345,2302.67890,2303.11111"

カスタム引用付き:

uv run scripts/paper_manager.py link \
  --repo-id "username/model-name" \
  --repo-type "model" \
  --arxiv-id "2301.12345" \
  --citation "$(cat citation.txt)"

リンク機能の仕組み

モデルまたはデータセット README に arXiv 論文リンクを追加する場合:

Hub はリンクから arXiv ID を抽出
arxiv:<PAPER_ID> タグが自動的にリポジトリに追加
ユーザーはタグをクリックして論文ページを表示
論文ページはこの論文を引用するすべてのモデル/データセットを表示
論文はフィルタと検索で発見可能

方法 3: 著者権を主張

Hugging Face で公開された論文の著者権を検証します。

主張プロセスを開始:

uv run scripts/paper_manager.py claim \
  --arxiv-id "2301.12345" \
  --email "your.email@institution.edu"

手動プロセス:

論文ページに移動: https://huggingface.co/papers/{arxiv-id}
著者一覧から自分の名前を見つける
自分の名前をクリックして「著者権を主張」を選択
管理チームの検証を待つ

著者権のステータスを確認:

uv run scripts/paper_manager.py check-authorship \
  --arxiv-id "2301.12345"

方法 4: 論文の表示管理

検証済みの論文がパブリックプロフィールに表示されるかを制御します。

あなたの論文を一覧:

uv run scripts/paper_manager.py list-my-papers

表示を切り替え:

uv run scripts/paper_manager.py toggle-visibility \
  --arxiv-id "2301.12345" \
  --show true

設定で管理: アカウント設定 → 論文セクションに移動し、各論文の「プロフィールに表示」を切り替えます。

方法 5: 研究論文を作成

モダンテンプレートを使用してプロフェッショナルな Markdown ベースの研究論文を生成します。

テンプレートから作成:

uv run scripts/paper_manager.py create \
  --template "standard" \
  --title "Your Paper Title" \
  --output "paper.md"

利用可能なテンプレート:

standard - 伝統的な科学論文構成
modern - Distill にインスパイアされたクリーンで Web フレンドリーなフォーマット
arxiv - arXiv スタイルのフォーマット
ml-report - 機械学習実験レポート

完全な論文を生成:

uv run scripts/paper_manager.py create \
  --template "modern" \
  --title "Fine-Tuning Large Language Models with LoRA" \
  --authors "Jane Doe, John Smith" \
  --abstract "$(cat abstract.txt)" \
  --output "paper.md"

HTML に変換:

uv run scripts/paper_manager.py convert \
  --input "paper.md" \
  --output "paper.html" \
  --style "modern"

論文テンプレート構造

標準的な研究論文セクション:

---
title: Your Paper Title
authors: Jane Doe, John Smith
affiliations: University X, Lab Y
date: 2025-01-15
arxiv: 2301.12345
tags: [machine-learning, nlp, fine-tuning]
---

# Abstract
Brief summary of the paper...

# 1. Introduction
Background and motivation...

# 2. Related Work
Previous research and context...

# 3. Methodology
Approach and implementation...

# 4. Experiments
Setup, datasets, and procedures...

# 5. Results
Findings and analysis...

# 6. Discussion
Interpretation and implications...

# 7. Conclusion
Summary and future work...

# References

モダンテンプレートの機能:

動的な目次
Web 表示用のレスポンシブデザイン
コード構文のハイライト
インタラクティブな図表
数式レンダリング (LaTeX)
引用管理
著者所属のリンク

コマンドリファレンス

論文をインデックス:

uv run scripts/paper_manager.py index --arxiv-id "2301.12345"

リポジトリにリンク:

uv run scripts/paper_manager.py link \
  --repo-id "username/repo-name" \
  --repo-type "model|dataset|space" \
  --arxiv-id "2301.12345" \
  [--citation "Full citation text"] \
  [--create-pr]

著者権を主張:

uv run scripts/paper_manager.py claim \
  --arxiv-id "2301.12345" \
  --email "your.email@edu"

表示を管理:

uv run scripts/paper_manager.py toggle-visibility \
  --arxiv-id "2301.12345" \
  --show true|false

研究論文を作成:

uv run scripts/paper_manager.py create \
  --template "standard|modern|arxiv|ml-report" \
  --title "Paper Title" \
  [--authors "Author1, Author2"] \
  [--abstract "Abstract text"] \
  [--output "filename.md"]

Markdown を HTML に変換:

uv run scripts/paper_manager.py convert \
  --input "paper.md" \
  --output "paper.html" \
  [--style "modern|classic"]

論文のステータスを確認:

uv run scripts/paper_manager.py check --arxiv-id "2301.12345"

あなたの論文を一覧:

uv run scripts/paper_manager.py list-my-papers

論文を検索:

uv run scripts/paper_manager.py search --query "transformer attention"

YAML メタデータフォーマット

論文をモデルまたはデータセットにリンクする場合、適切な YAML フロントマターが必要です:

モデルカードの例:

---
language:
  - en
license: apache-2.0
tags:
  - text-generation
  - transformers
  - llm
library_name: transformers
---

# Model Name

This model is based on the approach described in [Our Paper](https://arxiv.org/abs/2301.12345).

## Citation

```bibtex
@article{doe2023paper,
  title={Your Paper Title},
  author={Doe, Jane and Smith, John},
  journal={arXiv preprint arXiv:2301.12345},
  year={2023}
}


**データセットカードの例:**
```yaml
---
language:
  - en
license: cc-by-4.0
task_categories:
  - text-generation
  - question-answering
size_categories:
  - 10K<n<100K
---

# Dataset Name

Dataset introduced in [Our Paper](https://arxiv.org/abs/2301.12345).

For more details, see the [paper page](https://huggingface.co/papers/2301.12345).

Hub は自動的にこれらのリンクから arXiv ID を抽出し、arxiv:2301.12345 タグを作成します。

統合の例

ワークフロー 1: 新規研究の公開

# 1. 研究論文を作成
uv run scripts/paper_manager.py create \
  --template "modern" \
  --title "Novel Fine-Tuning Approach" \
  --output "paper.md"

# 2. paper.md をコンテンツで編集

# 3. arXiv に提出 (外部プロセス)
# arxiv.org にアップロード、arXiv ID を取得

# 4. Hugging Face でインデックス
uv run scripts/paper_manager.py index --arxiv-id "2301.12345"

# 5. モデルにリンク
uv run scripts/paper_manager.py link \
  --repo-id "your-username/your-model" \
  --repo-type "model" \
  --arxiv-id "2301.12345"

# 6. 著者権を主張
uv run scripts/paper_manager.py claim \
  --arxiv-id "2301.12345" \
  --email "your.email@edu"

ワークフロー 2: 既存論文をリンク

# 1. 論文が存在するか確認
uv run scripts/paper_manager.py check --arxiv-id "2301.12345"

# 2. 必要に応じてインデックス
uv run scripts/paper_manager.py index --arxiv-id "2301.12345"

# 3. 複数のリポジトリにリンク
uv run scripts/paper_manager.py link \
  --repo-id "username/model-v1" \
  --repo-type "model" \
  --arxiv-id "2301.12345"

uv run scripts/paper_manager.py link \
  --repo-id "username/training-data" \
  --repo-type "dataset" \
  --arxiv-id "2301.12345"

uv run scripts/paper_manager.py link \
  --repo-id "username/demo-space" \
  --repo-type "space" \
  --arxiv-id "2301.12345"

ワークフロー 3: 論文参考文献でモデルを更新

# 1. 現在の README を取得
hf download username/model-name README.md

# 2. 論文リンクを追加
uv run scripts/paper_manager.py link \
  --repo-id "username/model-name" \
  --repo-type "model" \
  --arxiv-id "2301.12345" \
  --citation "Full citation for the paper"

# スクリプトは以下を実行します:
# - 必要に応じて YAML メタデータを追加
# - README に arXiv リンクを挿入
# - フォーマットされた引用を追加
# - 既存のコンテンツを保持

ベストプラクティス

論文のインデックス
- arXiv に公開されたら、すぐに論文をインデックス
- モデル/データセットカードに完全な引用情報を含める
- 関連リポジトリ全体で一貫した論文参考文献を使用
メタデータ管理
- すべてのモデル/データセットカードに YAML フロントマターを追加
- 適切なライセンス情報を含める
- 関連するタスクカテゴリとドメインでタグ付け
著者権
- 著者として記載されている論文の著者権を主張
- 検証用に機関のメールアドレスを使用
- 論文の表示設定を更新された状態に保つ
リポジトリのリンク
- 関連するすべてのモデル、データセット、Space に論文をリンク
- README の説明に論文のコンテキストを含める
- 参照が容易なように BibTeX 引用を追加
研究論文
- プロジェクト内でテンプレートを一貫して使用
- 論文にコードとデータのリンクを含める
- 共有用に Web フレンドリーな HTML バージョンを生成

高度な使用方法

複数の論文をバッチリンク:

# 1 つのリポジトリに複数の論文をリンク
for arxiv_id in "2301.12345" "2302.67890" "2303.11111"; do
  uv run scripts/paper_manager.py link \
    --repo-id "username/model-name" \
    --repo-type "model" \
    --arxiv-id "$arxiv_id"
done

論文情報を抽出:

# arXiv からメタデータを取得
uv run scripts/paper_manager.py info \
  --arxiv-id "2301.12345" \
  --format "json"

引用を生成:

# BibTeX 引用を作成
uv run scripts/paper_manager.py citation \
  --arxiv-id "2301.12345" \
  --format "bibtex"

リンクを検証:

# リポジトリ内のすべての論文リンクを確認
uv run scripts/paper_manager.py validate \
  --repo-id "username/model-name" \
  --repo-type "model"

エラーハンドリング

論文が見つからない: arXiv ID が存在しないか、まだインデックスされていない
アクセス権限がない: HF_TOKEN がリポジトリへの書き込みアクセスを持っていない
無効な YAML: README フロントマターの形式が不正
著者権申請失敗: メールが論文の著者レコードと一致していない
既に主張済み: 別のユーザーが著者権を主張済み
レート制限: 短時間に API リクエストが多すぎる

トラブルシューティング

問題: "論文が Hugging Face で見つかりません"

解決策: hf.co/papers/{arxiv-id} にアクセスしてインデックスをトリガー

問題: "著者権の主張が検証されていません"

解決策: 管理レビューを待つか、HF サポートに連絡して証拠を提出

問題: "arXiv タグが表示されていません"

解決策: README に適切な arXiv URL 形式が含まれていることを確認

問題: "リポジトリにリンクできません"

解決策: HF_TOKEN に書き込み権限があることを確認

問題: "テンプレートレンダリングエラー"

解決策: Markdown の構文と YAML フロントマター形式を確認

リソースとリファレンス

Hugging Face 論文ページ: hf.co/papers
モデルカードガイド: hf.co/docs/hub/model-cards
データセットカードガイド: hf.co/docs/hub/datasets-cards
研究論文テンプレート: tfrere/research-article-template
arXiv フォーマットガイド: arxiv.org/help/submit

tfrere の研究テンプレートとの統合

このスキルは tfrere の研究論文テンプレートを補完し、以下を提供します:

自動化された論文インデックス化ワークフロー
リポジトリリンク機能
メタデータ管理ツール
引用生成ユーティリティ

tfrere のテンプレートで執筆し、このスキルを使用して論文を Hugging Face Hub で公開・リンクできます。

よくあるパターン

パターン 1: 新規論文の公開

# 執筆 → 公開 → インデックス → リンク
uv run scripts/paper_manager.py create --template modern --output paper.md
# (arXiv に提出)
uv run scripts/paper_manager.py index --arxiv-id "2301.12345"
uv run scripts/paper_manager.py link --repo-id "user/model" --arxiv-id "2301.12345"

パターン 2: 既存論文の発見

# 検索 → 確認 → リンク
uv run scripts/paper_manager.py search --query "transformers"
uv run scripts/paper_manager.py check --arxiv-id "2301.12345"
uv run scripts/paper_manager.py link --repo-id "user/model" --arxiv-id "2301.12345"

パターン 3: 著者ポートフォリオ管理

# 主張 → 検証 → 整理
uv run scripts/paper_manager.py claim --arxiv-id "2301.12345"
uv run scripts/paper_manager.py list-my-papers
uv run scripts/paper_manager.py toggle-visibility --arxiv-id "2301.12345" --show true

API 統合

Python スクリプトの例:

from scripts.paper_manager import PaperManager

pm = PaperManager(hf_token="your_token")

# 論文をインデックス
pm.index_paper("2301.12345")

# モデルにリンク
pm.link_paper(
    repo_id="username/model",
    repo_type="model",
    arxiv_id="2301.12345",
    citation="Full citation text"
)

# ステータスを確認
status = pm.check_paper("2301.12345")
print(status)

今後の改善

今後のバージョン予定の機能:

非 arXiv 論文のサポート (学会論文、学術誌)
DOI からの自動引用フォーマット化
論文比較とバージョン管理ツール
協調論文執筆機能
LaTeX ワークフローとの統合
自動図表抽出
論文メトリクスと影響度追跡

ライセンス: Apache-2.0(寛容ライセンスのため全文を引用しています) · 原本リポジトリ

詳細情報

作者: huggingface
リポジトリ: huggingface/skills
ライセンス: Apache-2.0
最終更新: 不明

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/huggingface/skills / ライセンス: Apache-2.0