photo-composition-critic
大学院レベルの視覚美学教育およびAVA・NIMA・LAION-Aesthetics・VisualQuality-R1などの計算美学研究に基づいた、プロフェッショナルな写真構図批評スキルです。画像品質の評価、構図分析、美的スコアリング、写真批評に活用でき、「photo critique」「composition analysis」「image aesthetics」「NIMA」「AVA dataset」「visual quality」といったキーワードで起動します。なお、写真編集・レタッチ、画像生成、基本的な画像処理には対応していません。
description の原文を見る
Expert photography composition critic grounded in graduate-level visual aesthetics education, computational aesthetics research (AVA, NIMA, LAION-Aesthetics, VisualQuality-R1), and professional image analysis with custom tooling. Use for image quality assessment, composition analysis, aesthetic scoring, photo critique. Activate on "photo critique", "composition analysis", "image aesthetics", "NIMA", "AVA dataset", "visual quality". NOT for photo editing/retouching (use native-app-designer), generating images (use Stability AI directly), or basic image processing (use clip-aware-embeddings).
SKILL.md 本文
写真構図批評家
大学院レベルの視覚美学、計算美学研究、および専門的な画像分析に深く根ざした写真批評の専門家。
このスキルをいつ使うか
以下に使用:
- 画像構図品質の評価
- MLモデルを使用した美学スコアリング (NIMA, LAION)
- 実行可能なフィードバック付き写真批評
- 色調和と視覚的バランスの分析
- 複数のトリミングオプションの比較
- 写真理論の理解
以下には使用しないこと:
- 画像生成 → Stability AI を直接使用
- 写真編集・レタッチ → native-app-designer を使用
- シンプルな画像類似性 → clip-aware-embeddings を使用
- コラージュ作成 → collage-layout-expert を使用
MCP 統合
| MCP | 目的 |
|---|---|
| Firecrawl | 最新の計算美学論文の調査 |
| Hugging Face (設定されている場合) | NIMA、LAION美学モデルへのアクセス |
クイックリファレンス
構図のフレームワーク
| フレームワーク | 重要なポイント |
|---|---|
| 視覚的ウェイト | サイズ、色温度、隔離、本来的な興味、位置 |
| ゲシュタルト | 近接性、類似性、継続性、閉包性、図と背景 |
| ダイナミック・シンメトリー | 根の矩形 (√2, √3, φ)、バロック/シニスター対角線 |
| アラベスク | S字曲線、螺旋、対角線推進力 - フレーム内の視線の流れ |
色調和タイプ
| タイプ | スコア | 注記 |
|---|---|---|
| 補色 | 0.9 | 視覚的興味が高い |
| 単色 | 0.85 | 安全で統一感がある |
| 三色配色 | 0.85 | バランスが取れて活気がある |
| 類似色 | 0.8 | 自然で調和的 |
| 無彩色 | 0.7 | 白黒または彩度低下 |
| 複雑 | 0.6 | 混沌としているか意図的な場合がある |
MLモデルスコア解釈
| スコア範囲 | 意味 |
|---|---|
| 7.0以上 | 例外的 (上位約1%) |
| 6.5以上 | 優秀 (上位約5%) |
| 5.0-5.5 | 平凡 (ほとんどの画像) |
| 5.0未満 | 平均以下 |
分析プロトコル
1. 第一印象 (2秒)
└── 視線はどこに行くか?感情的インパクト?何か「おかしい」ことはないか?
2. 技術的スキャン
└── 露出、ピント、ノイズ、色、アーティファクト
3. 構図分析
└── 被写体の明確性、構造、バランス、流れ、深さ、縁
4. 美学評価
└── 光の質、色調和、決定的な瞬間、ストーリー
5. 文脈的評価
└── ジャンルの成功度、写真家の意図、対象者の適合性
6. 実行可能な推奨
└── 具体的な改善、後処理、代替トリミング
アンチパターン
「三分割法を使えばいいだけ」
| 見た目 | なぜ間違っているか |
|---|---|
| 無差別に被写体を三分割交点に配置 | 過度な単純化で、視覚的ウェイト、ゲシュタルト、ダイナミック・シンメトリーを無視 |
| 代わりに: 視覚的ウェイトの中心を分析し、複数のフレームワークを検討 |
「NIMAスコアが高い = より良い写真」
| 見た目 | なぜ間違っているか |
|---|---|
| MLスコアを唯一の品質指標として使用 | モデルは平均値で学習されており、芸術的意図を見落とし、賛否両論の作品がある |
| 代わりに: MLを理論的分析と並行して1つの入力として使用 |
「色調和は色をマッチングすること」
| 見た目 | なぜ間違っているか |
|---|---|
| 単色やマッチする配色を推奨 | Itten の対比、Albers の相互作用効果を無視 |
| 代わりに: 調和タイプと文脈的適切性の両方を評価 |
ジャンル文脈を無視する
| 見た目 | なぜ間違っているか |
|---|---|
| ポートレート基準をドキュメンタリーに適用 | ジャンルごとに品質シグナルが異なる |
| 代わりに: ジャンルに適切な基準に照らし合わせて評価 |
リファレンスファイル
詳細な実装に対してこれらをロード:
| ファイル | 内容 |
|---|---|
references/composition-theory.md | Arnheim 視覚的ウェイト、ゲシュタルト、ダイナミック・シンメトリー、アラベスク |
references/color-theory.md | Albers 相互作用、Itten の7つの対比、調和検出アルゴリズム |
references/ml-models.md | AVAデータセット、NIMA、LAION-Aesthetics、VisualQuality-R1 |
references/analysis-scripts.md | PhotoCritic クラス、MCPサーバー実装 |
主要な参考文献
理論: Arnheim (1974)、Hambidge (1926)、Itten (1961)、Albers (1963)、Freeman (2007)
研究: AVA dataset (Murray 2012)、NIMA (Talebi 2018)、LAION-5B (Schuhmann 2022)、Q-Instruct (Wu 2024)
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- erichowens
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/erichowens/some_claude_skills / ライセンス: MIT
関連スキル
agent-browser
AI エージェント向けのブラウザ自動化 CLI です。ウェブサイトとの対話が必要な場合に使用します。ページ遷移、フォーム入力、ボタンクリック、スクリーンショット取得、データ抽出、ウェブアプリのテスト、ブラウザ操作の自動化など、あらゆるブラウザタスクに対応できます。「ウェブサイトを開く」「フォームに記入する」「ボタンをクリックする」「スクリーンショットを取得する」「ページからデータを抽出する」「このウェブアプリをテストする」「サイトにログインする」「ブラウザ操作を自動化する」といった要求や、プログラマティックなウェブ操作が必要なタスクで起動します。
anyskill
AnySkill — あなたのプライベート・スキルクラウド。GitHubを基盤としたリポジトリからエージェントスキルを管理、同期、動的にロードできます。自然言語でクラウドスキルを検索し、オンデマンドでプロンプトを自動ロード、カスタムスキルのアップロードと共有、スキルバンドルの一括インストールが可能です。OpenClaw、Antigravity、Claude Code、Cursorに対応しています。
engram
AIエージェント向けの永続的なメモリシステムです。バグ修正、意思決定、発見、設定変更の後はmem_saveを使用してください。ユーザーが「覚えている」「記憶している」と言及した場合、または以前のセッションと重複する作業を開始する際はmem_searchを使用します。セッション終了前にmem_session_summaryを使用して、コンテキストを保持してください。
skyvern
AI駆動のブラウザ自動化により、任意のウェブサイトを自動化できます。フォーム入力、データ抽出、ファイルダウンロード、ログイン、複数ステップのワークフロー実行など、ユーザーがウェブサイトと連携する必要があるときに使用します。Skyvernは、LLMとコンピュータビジョンを活用して、未知のサイトも自動操作可能です。Python SDK、TypeScript SDK、REST API、MCPサーバー、またはCLIを通じて統合できます。
pinchbench
PinchBenchベンチマークを実行して、OpenClawエージェントの実世界タスクにおけるパフォーマンスを評価できます。モデルの機能テスト、モデル間の比較、ベンチマーク結果のリーダーボード提出、またはOpenClawのセットアップがカレンダー、メール、リサーチ、コーディング、複数ステップのワークフローにどの程度対応しているかを確認する際に使用します。
openui
OpenUIとOpenUI Langを使用してジェネレーティブUIアプリを構築できます。これらはLLM生成インターフェースのためのトークン効率的なオープン標準です。OpenUI、@openuidev、ジェネレーティブUI、LLMからのストリーミングUI、AI向けコンポーネントライブラリ、またはjson-render/A2UIの置き換えについて述べる際に使用します。スキャフォルディング、defineComponent、システムプロンプト、Renderer、およびOpenUI Lang出力のデバッグに対応しています。