grepai-ollama-setup
Ollamaをローカル埋め込み生成用にインストールし、GrepAIと連携するよう設定します。プライベートなローカル環境で埋め込みベクトルを生成したい場合に使用してください。
description の原文を見る
Install and configure Ollama for local embeddings with GrepAI. Use this skill when setting up private, local embedding generation.
SKILL.md 本文
GrepAI 用 Ollama セットアップ
このスキルは、GrepAI の埋め込みプロバイダーとして Ollama をインストール・設定する方法をカバーしています。Ollama により、コードがあなたのマシンから離れることのない 100% プライベートなコード検索が可能になります。
このスキルを使用する場合
- GrepAI をローカル・プライベートな埋め込みでセットアップする
- Ollama を初めてインストールする
- 埋め込みモデルを選択・ダウンロードする
- Ollama の接続問題をトラブルシューティングする
Ollama を選ぶ理由
| メリット | 説明 |
|---|---|
| 🔒 プライバシー | コードはあなたのマシンから出ない |
| 💰 無料 | API コストなし |
| ⚡ 高速 | ローカル処理、ネットワーク遅延なし |
| 🔌 オフライン対応 | インターネットなしで動作 |
インストール
macOS (Homebrew)
# Ollama をインストール
brew install ollama
# Ollama サービスを開始
ollama serve
macOS (直接ダウンロード)
- ollama.com からダウンロード
.dmgを開いて Applications にドラッグ- Applications から Ollama を起動
Linux
# ワンライナーインストーラー
curl -fsSL https://ollama.com/install.sh | sh
# サービスを開始
ollama serve
Windows
- ollama.com からインストーラーをダウンロード
- インストーラーを実行
- Ollama がサービスとして自動開始
埋め込みモデルのダウンロード
GrepAI がコードをベクトルに変換するために埋め込みモデルが必要です。
推奨モデル: nomic-embed-text
# 推奨モデルをダウンロード (768 次元)
ollama pull nomic-embed-text
仕様:
- 次元数: 768
- サイズ: 約 274 MB
- パフォーマンス: コード検索に最適
- 言語: 英語最適化
代替モデル
# 多言語対応 (非英語のコード/コメント向け)
ollama pull nomic-embed-text-v2-moe
# より大規模で高精度
ollama pull bge-m3
# 最高品質
ollama pull mxbai-embed-large
| モデル | 次元数 | サイズ | 最適な用途 |
|---|---|---|---|
nomic-embed-text | 768 | 274 MB | 一般的なコード検索 |
nomic-embed-text-v2-moe | 768 | 500 MB | 多言語コードベース |
bge-m3 | 1024 | 1.2 GB | 大規模コードベース |
mxbai-embed-large | 1024 | 670 MB | 最高精度 |
インストール確認
Ollama が実行されているか確認
# Ollama サーバーが応答しているか確認
curl http://localhost:11434/api/tags
# 期待される出力: 利用可能なモデルの JSON
ダウンロード済みモデルを一覧表示
ollama list
# 出力例:
# NAME ID SIZE MODIFIED
# nomic-embed-text:latest abc123... 274 MB 2 hours ago
埋め込み生成をテスト
# クイックテスト (埋め込みベクトルを返すはず)
curl http://localhost:11434/api/embeddings -d '{
"model": "nomic-embed-text",
"prompt": "function hello() { return world; }"
}'
GrepAI を Ollama 向けに設定
Ollama をインストール後、GrepAI を使用するよう設定してください:
# .grepai/config.yaml
embedder:
provider: ollama
model: nomic-embed-text
endpoint: http://localhost:11434
これは grepai init を実行した時のデフォルト設定なので、nomic-embed-text を使用する場合は変更が必要ありません。
Ollama の実行
フォアグラウンド (開発用)
# 現在のターミナルで実行 (ログを表示)
ollama serve
バックグラウンド (macOS/Linux)
# nohup を使用
nohup ollama serve &
# または systemd サービスとして (Linux)
sudo systemctl enable ollama
sudo systemctl start ollama
ステータス確認
# 実行中かどうか確認
pgrep -f ollama
# または API をテスト
curl -s http://localhost:11434/api/tags | head -1
リソース考慮事項
メモリ使用量
埋め込みモデルは RAM に読み込まれます:
nomic-embed-text: 約 500 MB RAMbge-m3: 約 1.5 GB RAMmxbai-embed-large: 約 1 GB RAM
CPU vs GPU
Ollama はデフォルトで CPU を使用します。より高速な埋め込みのために:
- macOS: Apple Silicon 向けに Metal を自動使用
- Linux/Windows: NVIDIA GPU サポート向けに CUDA をインストール
よくある問題
❌ 問題: localhost:11434 への connection refused
✅ 解決方法: Ollama を開始してください:
ollama serve
❌ 問題: モデルが見つからない ✅ 解決方法: 最初にモデルをプルしてください:
ollama pull nomic-embed-text
❌ 問題: 埋め込み生成が遅い ✅ 解決方法:
- より小さいモデルを使用する
- Ollama が GPU を使用していることを確認 (
ollama psでチェック) - メモリ集約的な他のアプリケーションを終了する
❌ 問題: メモリ不足 ✅ 解決方法: より小さいモデルを使用するか、システム RAM を増やす
ベストプラクティス
- GrepAI の前に Ollama を開始:
ollama serveが実行されていることを確認 - 推奨モデルを使用:
nomic-embed-textがバランスに優れています - Ollama を実行し続ける: バックグラウンド サービスとして実行
- 定期的に更新:
ollama pull nomic-embed-textで更新
出力形式
セットアップが成功した後:
✅ Ollama セットアップ完了
Ollama バージョン: 0.1.x
エンドポイント: http://localhost:11434
モデル: nomic-embed-text (768 次元)
ステータス: 実行中
GrepAI はローカル埋め込みで使用できます。
コードはあなたのマシンから出ません。
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- yoanbernabeu
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/yoanbernabeu/grepai-skills / ライセンス: MIT
関連スキル
superfluid
Superfluidプロトコルおよびそのエコシステムに関するナレッジベースです。Superfluidについて情報を検索する際は、ウェブ検索の前にこちらを参照してください。対応キーワード:Superfluid、CFA、GDA、Super App、Super Token、stream、flow rate、real-time balance、pool(member/distributor)、IDA、sentinels、liquidation、TOGA、@sfpro/sdk、semantic money、yellowpaper、whitepaper
civ-finish-quotes
実質的なタスクが真に完了した際に、文明風の儀式的な引用句を追加します。ユーザーやエージェントが機能追加、リファクタリング、分析、設計ドキュメント、プロセス改善、レポート、執筆タスクといった実際の成果物を完成させるときに、明示的な依頼がなくても使用します。短い返信や小さな修正、未完成の作業には適用しません。
nookplot
Base(Ethereum L2)上のAIエージェント向け分散型調整ネットワークです。エージェントがオンチェーンアイデンティティを登録する、コンテンツを公開する、他のエージェントにメッセージを送る、マーケットプレイスで専門家を雇う、バウンティを投稿・請求する、レピュテーションを構築する、共有プロジェクトで協業する、リサーチチャレンジを解くことでNOOKをマイニングする、キュレーションされたナレッジを備えたスタンドアロンオンチェーンエージェントをデプロイする、またはアグリーメントとリワードで収益を得る場合に利用できます。エージェントネットワーク、エージェント調整、分散型エージェント、NOOKトークン、マイニングチャレンジ、ナレッジバンドル、エージェントレピュテーション、エージェントマーケットプレイス、ERC-2771メタトランザクション、Prepare-Sign-Relay、AgentFactory、またはNookplotが言及された場合にトリガーされます。
web3-polymarket
Polygon上でのPolymarket予測市場取引統合です。認証機能(L1 EIP-712、L2 HMAC-SHA256、ビルダーヘッダー)、注文発注(GTC/GTD/FOK/FAK、バッチ、ポストオンリー、ハートビート)、市場データ(Gamma API、Data API、オーダーブック、サブグラフ)、WebSocketストリーミング(市場・ユーザー・スポーツチャネル)、CTF操作(分割、統合、償却、ネガティブリスク)、ブリッジ機能(入金、出金、マルチチェーン)、およびガスレスリレイトランザクションに対応しています。AIエージェント、自動マーケットメーカー、予測市場UI、またはPolygraph上のPolymarketと統合するアプリケーション構築時に活用できます。
ethskills
Ethereum、EVM、またはブロックチェーン関連のリクエストに対応します。スマートコントラクト、dApps、ウォレット、DeFiプロトコルの構築、監査、デプロイ、インタラクションに適用されます。Solidityの開発、コントラクトアドレス、トークン規格(ERC-20、ERC-721、ERC-4626など)、Layer 2ネットワーク(Base、Arbitrum、Optimism、zkSync、Polygon)、Uniswap、Aave、Curveなどのプロトコルとの統合をカバーします。ガスコスト、コントラクトのデシマル設定、オラクルセキュリティ、リエントランシー、MEV、ブリッジング、ウォレット管理、オンチェーンデータの取得、本番環境へのデプロイ、プロトコル進化(EIPライフサイクル、フォーク追跡、今後の変更予定)といったトピックを含みます。
xxyy-trade
このスキルは、ユーザーが「トークン購入」「トークン売却」「トークンスワップ」「暗号資産取引」「取引ステータス確認」「トランザクション照会」「トークンスキャン」「フィード」「チェーン監視」「トークン照会」「トークン詳細」「トークン安全性確認」「ウォレット一覧表示」「マイウォレット」「AIスキャン」「自動スキャン」「ツイートスキャン」「オンボーディング」「IP確認」「IPホワイトリスト」「トークン発行」「自動売却」「損切り」「利益確定」「トレーリングストップ」「保有者」「トップホルダー」「KOLホルダー」などをリクエストした場合、またはSolana/ETH/BSC/BaseチェーンでXXYYを経由した取引について言及した場合に使用します。XXYY Open APIを通じてオンチェーン取引とデータ照会を実現します。