voice-isolator
ElevenLabs Voice Isolator APIを使用して、音声からバックグラウンドノイズを除去し、ボーカルや音声を分離します。ノイズの多い録音のクリーンアップ、対話から音楽や環境音の除去、フィールド録音からの音声分離、文字起こし用の音声準備、ボーカル抽出など、「ノイズ除去・クリーンアップ・声の分離」に関するあらゆる作業に活用できます。
description の原文を見る
Remove background noise and isolate vocals/speech from audio using ElevenLabs Voice Isolator (audio isolation) API. Use when cleaning up noisy recordings, removing music or background ambience from dialogue, isolating speech from field recordings, preparing audio for transcription, extracting vocals, or any "denoise / clean up / isolate voice" task.
SKILL.md 本文
ElevenLabs Voice Isolator
オーディオから背景ノイズを除去し、ボーカル/スピーチを分離します。ノイズの多い録音をクリーンアップしたり、オーディオを文字起こし用に準備したり、混合トラックから対話を抽出したりするのに便利です。
セットアップ:
Installation Guideを参照してください。JavaScript の場合、@elevenlabs/*パッケージのみを使用してください。
クイックスタート
Python
from elevenlabs import ElevenLabs
client = ElevenLabs()
with open("noisy.mp3", "rb") as audio_file:
audio_stream = client.audio_isolation.convert(audio=audio_file)
with open("clean.mp3", "wb") as f:
for chunk in audio_stream:
f.write(chunk)
JavaScript
import { ElevenLabsClient } from "@elevenlabs/elevenlabs-js";
import { createReadStream, createWriteStream } from "fs";
const client = new ElevenLabsClient();
const audioStream = await client.audioIsolation.convert({
audio: createReadStream("noisy.mp3"),
});
audioStream.pipe(createWriteStream("clean.mp3"));
cURL
curl -X POST "https://api.elevenlabs.io/v1/audio-isolation" \
-H "xi-api-key: $ELEVENLABS_API_KEY" \
-F "audio=@noisy.mp3" \
--output clean.mp3
パラメータ
| パラメータ | 型 | デフォルト | 説明 |
|---|---|---|---|
audio | ファイル (必須) | — | 分離するボーカル/スピーチを含むオーディオファイル |
file_format | 文字列 | other | エンコードされたオーディオの場合は other、またはレイテンシーを低減する 16 ビット PCM モノラル @ 16kHz リトルエンディアンの場合は pcm_s16le_16 |
URL からの分離
import requests
from io import BytesIO
from elevenlabs import ElevenLabs
client = ElevenLabs()
audio_url = "https://example.com/noisy.mp3"
response = requests.get(audio_url)
audio_data = BytesIO(response.content)
audio_stream = client.audio_isolation.convert(audio=audio_data)
with open("clean.mp3", "wb") as f:
for chunk in audio_stream:
f.write(chunk)
低レイテンシー PCM 入力
既に生の 16 ビット PCM モノラル @ 16kHz がある場合、file_format="pcm_s16le_16" を渡すことでデコーディングをスキップし、レイテンシーを削減できます:
audio_stream = client.audio_isolation.convert(
audio=pcm_bytes,
file_format="pcm_s16le_16",
)
サポートされているフォーマット
入力として任意の一般的なエンコードされたオーディオ/ビデオコンテナが動作します (MP3、WAV、M4A、FLAC、OGG、WebM、MP4 など)。レスポンスはデフォルトではストリーミング MP3 です。
一般的なワークフロー
- インタビュー/ポッドキャスト録音をクリーンアップ — 編集前にルームトーン、HVAC、交通音を除去します。
- Speech-to-Text 用にノイズの多いオーディオを準備 — 音声を先に分離してから
speech_to_text.convert()で文字起こし精度を向上させます。 - 混合トラックから対話を抽出 — 音楽/SFX を含むトラックからボーカルを引き出します。
- Voice Changer の前処理 — 音声変換を適用する前にソース音声を分離します。
エラーハンドリング
try:
audio_stream = client.audio_isolation.convert(audio=audio_file)
except Exception as e:
print(f"Voice isolation failed: {e}")
一般的なエラー:
- 401: 無効な API キー
- 422: 無効なパラメータ (例: 提供されたオーディオに対して間違った
file_format) - 429: レート制限を超過
参考資料
Installation Guide
ライセンス: MIT(寛容ライセンスのため全文を引用しています) · 原本リポジトリ
詳細情報
- 作者
- elevenlabs
- リポジトリ
- elevenlabs/skills
- ライセンス
- MIT
- 最終更新
- 不明
Source: https://github.com/elevenlabs/skills / ライセンス: MIT
関連スキル
doubt-driven-development
重要な判断はすべて、本番環境への展開前に新しい視点から対抗的レビューを実施します。速度より正確性が重要な場合、不慣れなコードを扱う場合、本番環境・セキュリティに関わるロジック・取り消し不可の操作など影響度が高い場合、または後でバグを修正するよりも今検証する方が効率的な場合に活用してください。
apprun-skills
TypeScriptを使用したAppRunアプリケーションのMVU設計に関する総合的なガイダンスが得られます。コンポーネントパターン、イベントハンドリング、状態管理(非同期ジェネレータを含む)、パラメータと保護機能を備えたルーティング・ナビゲーション、vistestを使用したテストに対応しています。AppRunコンポーネントの設計・レビュー、ルートの配線、状態フローの管理、AppRunテストの作成時に活用してください。
desloppify
コードベースのヘルスチェックと技術負債の追跡ツールです。コード品質、技術負債、デッドコード、大規模ファイル、ゴッドクラス、重複関数、コードスメル、命名規則の問題、インポートサイクル、結合度の問題についてユーザーが質問した場合に使用してください。また、ヘルススコアの確認、次の改善項目の提案、クリーンアップ計画の作成をリクエストされた際にも対応します。29言語に対応しています。
debugging-and-error-recovery
テストが失敗したり、ビルドが壊れたり、動作が期待と異なったり、予期しないエラーが発生したりした場合に、体系的な根本原因デバッグをガイドします。推測ではなく、根本原因を見つけて修正するための体系的なアプローチが必要な場合に使用してください。
test-driven-development
テスト駆動開発により実装を進めます。ロジックの実装、バグの修正、動作の変更など、あらゆる場面で活用できます。コードが正常に動作することを証明する必要がある場合、バグ報告を受けた場合、既存機能を修正する予定がある場合に使用してください。
incremental-implementation
変更を段階的に実施します。複数のファイルに影響する機能や変更を実装する場合に使用してください。大量のコードを一度に書こうとしている場合や、タスクが一度では完結できないほど大きい場合に活用します。