grepai-embeddings-ollama
GrepAIのエンベディングプロバイダーとしてOllamaを設定します。ローカル環境でプライベートなエンベディング生成を行いたい場合に使用するスキルです。
description の原文を見る
Configure Ollama as embedding provider for GrepAI. Use this skill for local, private embedding generation.
SKILL.md 本文
GrepAI Embeddings with Ollama
このスキルでは、GrepAIの埋め込みプロバイダーとしてOllamaを使用し、100%プライベートでローカルなコード検索を実現する方法について説明します。
このスキルを使用するタイミング
- プライベートでローカルな埋め込みの設定
- 適切なOllamaモデルの選択
- Ollamaのパフォーマンス最適化
- Ollama接続の問題のトラブルシューティング
Ollamaが選ばれる理由
| 利点 | 説明 |
|---|---|
| 🔒 プライバシー | コードはマシンの外に出ない |
| 💰 無料 | APIコストや使用制限なし |
| ⚡ 高速 | ネットワークレイテンシーなし |
| 🔌 オフライン | インターネット接続不要 |
| 🔧 制御 | モデルを自由に選択可能 |
前提条件
- Ollamaがインストールされ実行中
- 埋め込みモデルがダウンロード済み
# Ollamaをインストール
brew install ollama # macOS
# または
curl -fsSL https://ollama.com/install.sh | sh # Linux
# Ollamaを起動
ollama serve
# モデルをダウンロード
ollama pull nomic-embed-text
設定
基本設定
# .grepai/config.yaml
embedder:
provider: ollama
model: nomic-embed-text
endpoint: http://localhost:11434
カスタムエンドポイント付き
embedder:
provider: ollama
model: nomic-embed-text
endpoint: http://192.168.1.100:11434 # リモートOllamaサーバー
明示的なディメンション指定
embedder:
provider: ollama
model: nomic-embed-text
endpoint: http://localhost:11434
dimensions: 768 # 通常は自動検出
利用可能なモデル
推奨: nomic-embed-text
ollama pull nomic-embed-text
| プロパティ | 値 |
|---|---|
| ディメンション | 768 |
| サイズ | ~274 MB |
| 速度 | 高速 |
| 品質 | コード向けで優秀 |
| 言語 | 英語に最適化 |
設定:
embedder:
provider: ollama
model: nomic-embed-text
多言語対応: nomic-embed-text-v2-moe
ollama pull nomic-embed-text-v2-moe
| プロパティ | 値 |
|---|---|
| ディメンション | 768 |
| サイズ | ~500 MB |
| 速度 | 中程度 |
| 品質 | 優秀 |
| 言語 | 多言語対応 |
英語以外のコメントやドキュメントを含むコードベースに最適です。
設定:
embedder:
provider: ollama
model: nomic-embed-text-v2-moe
高品質: bge-m3
ollama pull bge-m3
| プロパティ | 値 |
|---|---|
| ディメンション | 1024 |
| サイズ | ~1.2 GB |
| 速度 | 低速 |
| 品質 | 非常に高い |
| 言語 | 多言語対応 |
精度が重要な大規模で複雑なコードベースに最適です。
設定:
embedder:
provider: ollama
model: bge-m3
dimensions: 1024
最高品質: mxbai-embed-large
ollama pull mxbai-embed-large
| プロパティ | 値 |
|---|---|
| ディメンション | 1024 |
| サイズ | ~670 MB |
| 速度 | 中程度 |
| 品質 | 最高 |
| 言語 | 英語 |
設定:
embedder:
provider: ollama
model: mxbai-embed-large
dimensions: 1024
モデル比較
| モデル | ディメンション | サイズ | 速度 | 品質 | ユースケース |
|---|---|---|---|---|---|
nomic-embed-text | 768 | 274MB | ⚡⚡⚡ | ⭐⭐⭐ | 一般利用 |
nomic-embed-text-v2-moe | 768 | 500MB | ⚡⚡ | ⭐⭐⭐⭐ | 多言語対応 |
bge-m3 | 1024 | 1.2GB | ⚡ | ⭐⭐⭐⭐⭐ | 大規模コードベース |
mxbai-embed-large | 1024 | 670MB | ⚡⚡ | ⭐⭐⭐⭐⭐ | 最大精度 |
パフォーマンス最適化
メモリ管理
モデルはRAMに読み込まれます。十分なメモリを確保してください:
| モデル | 必要なRAM |
|---|---|
nomic-embed-text | ~500 MB |
nomic-embed-text-v2-moe | ~800 MB |
bge-m3 | ~1.5 GB |
mxbai-embed-large | ~1 GB |
GPU アクセラレーション
Ollamaは自動的に以下を使用します:
- macOS: Metal (Apple Silicon)
- Linux/Windows: CUDA (NVIDIA GPU)
GPU使用状況を確認:
ollama ps
モデルの読み込み維持
デフォルトでは、Ollamaは5分の非アクティブ期間後にモデルをアンロードします。モデルを読み込んだままにするには:
# モデルを無期限に読み込んだままにする
curl http://localhost:11434/api/generate -d '{
"model": "nomic-embed-text",
"keep_alive": -1
}'
接続の確認
Ollamaが実行中か確認
curl http://localhost:11434/api/tags
利用可能なモデルをリスト表示
ollama list
埋め込みをテスト
curl http://localhost:11434/api/embeddings -d '{
"model": "nomic-embed-text",
"prompt": "function authenticate(user, password)"
}'
Ollamaをサービスとして実行
macOS (launchd)
Ollamaアプリはログイン時に自動的に実行されます。
Linux (systemd)
# サービスを有効化
sudo systemctl enable ollama
# サービスを開始
sudo systemctl start ollama
# ステータスを確認
sudo systemctl status ollama
手動でバックグラウンド実行
nohup ollama serve > /dev/null 2>&1 &
リモートOllamaサーバー
高性能なサーバー上でOllamaを実行し、リモートから接続します:
サーバー上
# リモート接続を許可
OLLAMA_HOST=0.0.0.0 ollama serve
クライアント上
# .grepai/config.yaml
embedder:
provider: ollama
model: nomic-embed-text
endpoint: http://server-ip:11434
よくある問題
❌ 問題: 接続がリセットされた ✅ 解決策:
# Ollamaを起動
ollama serve
❌ 問題: モデルが見つからない ✅ 解決策:
# モデルをプル
ollama pull nomic-embed-text
❌ 問題: 埋め込み生成が遅い ✅ 解決策:
- より小さいモデルを使用 (
nomic-embed-text) - GPUが使用されているか確認 (
ollama ps) - メモリ集約的なアプリケーションを閉じる
- より高性能なハードウェアを持つリモートサーバーを検討
❌ 問題: メモリ不足 ✅ 解決策:
- より小さいモデルを使用
- 他のアプリケーションを閉じる
- RAMをアップグレード
- リモートOllamaサーバーを使用
❌ 問題: モデル更新後に埋め込みが異なる ✅ 解決策: モデル更新後に再インデックス:
rm .grepai/index.gob
grepai watch
ベストプラクティス
nomic-embed-textから始める: 速度と品質のバランスが最良- Ollamaを実行し続ける: バックグラウンドサービスをお勧めします
- ディメンションを一致させる: 異なるディメンションを持つモデルを混在させない
- モデル変更時に再インデックス: インデックスを削除してwatchを再実行
- メモリをモニタリング: 埋め込みモデルはかなりのRAMを使用します
出力形式
Ollama設定が成功した場合:
✅ Ollama Embedding Provider Configured
Provider: Ollama
Model: nomic-embed-text
Endpoint: http://localhost:11434
Dimensions: 768 (auto-detected)
Status: Connected
Model Info:
- Size: 274 MB
- Loaded: Yes
- GPU: Apple Metal
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- yoanbernabeu
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/yoanbernabeu/grepai-skills / ライセンス: MIT
関連スキル
superfluid
Superfluidプロトコルおよびそのエコシステムに関するナレッジベースです。Superfluidについて情報を検索する際は、ウェブ検索の前にこちらを参照してください。対応キーワード:Superfluid、CFA、GDA、Super App、Super Token、stream、flow rate、real-time balance、pool(member/distributor)、IDA、sentinels、liquidation、TOGA、@sfpro/sdk、semantic money、yellowpaper、whitepaper
civ-finish-quotes
実質的なタスクが真に完了した際に、文明風の儀式的な引用句を追加します。ユーザーやエージェントが機能追加、リファクタリング、分析、設計ドキュメント、プロセス改善、レポート、執筆タスクといった実際の成果物を完成させるときに、明示的な依頼がなくても使用します。短い返信や小さな修正、未完成の作業には適用しません。
nookplot
Base(Ethereum L2)上のAIエージェント向け分散型調整ネットワークです。エージェントがオンチェーンアイデンティティを登録する、コンテンツを公開する、他のエージェントにメッセージを送る、マーケットプレイスで専門家を雇う、バウンティを投稿・請求する、レピュテーションを構築する、共有プロジェクトで協業する、リサーチチャレンジを解くことでNOOKをマイニングする、キュレーションされたナレッジを備えたスタンドアロンオンチェーンエージェントをデプロイする、またはアグリーメントとリワードで収益を得る場合に利用できます。エージェントネットワーク、エージェント調整、分散型エージェント、NOOKトークン、マイニングチャレンジ、ナレッジバンドル、エージェントレピュテーション、エージェントマーケットプレイス、ERC-2771メタトランザクション、Prepare-Sign-Relay、AgentFactory、またはNookplotが言及された場合にトリガーされます。
web3-polymarket
Polygon上でのPolymarket予測市場取引統合です。認証機能(L1 EIP-712、L2 HMAC-SHA256、ビルダーヘッダー)、注文発注(GTC/GTD/FOK/FAK、バッチ、ポストオンリー、ハートビート)、市場データ(Gamma API、Data API、オーダーブック、サブグラフ)、WebSocketストリーミング(市場・ユーザー・スポーツチャネル)、CTF操作(分割、統合、償却、ネガティブリスク)、ブリッジ機能(入金、出金、マルチチェーン)、およびガスレスリレイトランザクションに対応しています。AIエージェント、自動マーケットメーカー、予測市場UI、またはPolygraph上のPolymarketと統合するアプリケーション構築時に活用できます。
ethskills
Ethereum、EVM、またはブロックチェーン関連のリクエストに対応します。スマートコントラクト、dApps、ウォレット、DeFiプロトコルの構築、監査、デプロイ、インタラクションに適用されます。Solidityの開発、コントラクトアドレス、トークン規格(ERC-20、ERC-721、ERC-4626など)、Layer 2ネットワーク(Base、Arbitrum、Optimism、zkSync、Polygon)、Uniswap、Aave、Curveなどのプロトコルとの統合をカバーします。ガスコスト、コントラクトのデシマル設定、オラクルセキュリティ、リエントランシー、MEV、ブリッジング、ウォレット管理、オンチェーンデータの取得、本番環境へのデプロイ、プロトコル進化(EIPライフサイクル、フォーク追跡、今後の変更予定)といったトピックを含みます。
xxyy-trade
このスキルは、ユーザーが「トークン購入」「トークン売却」「トークンスワップ」「暗号資産取引」「取引ステータス確認」「トランザクション照会」「トークンスキャン」「フィード」「チェーン監視」「トークン照会」「トークン詳細」「トークン安全性確認」「ウォレット一覧表示」「マイウォレット」「AIスキャン」「自動スキャン」「ツイートスキャン」「オンボーディング」「IP確認」「IPホワイトリスト」「トークン発行」「自動売却」「損切り」「利益確定」「トレーリングストップ」「保有者」「トップホルダー」「KOLホルダー」などをリクエストした場合、またはSolana/ETH/BSC/BaseチェーンでXXYYを経由した取引について言及した場合に使用します。XXYY Open APIを通じてオンチェーン取引とデータ照会を実現します。