Anthropic ClaudeLLM・AI開発⭐ リポ 0品質スコア 50/100

aws-sdk-java-v2-bedrock

Name: aws-sdk-java-v2-bedrock
Author: giuseppe-trisciuoglio

AWS SDK for Java 2.x を使用した Amazon Bedrock の実装パターンを提供します。Claude・Llama・Titan などのファンデーションモデルの呼び出し、テキスト・画像の生成、RAG 向け埋め込みの作成、リアルタイムストリーミングレスポンス、Spring Boot との統合設定に対応します。Bedrock 連携、Java SDK による AI モデル活用、AWS 生成 AI、RAG 向け埋め込み、Spring Boot AI セットアップについて調べる際にご利用ください。

description の原文を見る

Provides Amazon Bedrock patterns using AWS SDK for Java 2.x. Invokes foundation models (Claude, Llama, Titan), generates text and images, creates embeddings for RAG, streams real-time responses, and configures Spring Boot integration. Use when asking about Bedrock integration, Java SDK for AI models, AWS generative AI, Claude/Llama invocation, embeddings for RAG, or Spring Boot AI setup.

SKILL.md 本文

AWS SDK for Java 2.x - Amazon Bedrock

概要

AWS SDK for Java 2.x を使用して foundation models を呼び出します。クライアントを設定し、モデル固有の JSON ペイロードを構築し、エラーリカバリーを伴うストリーミング応答を処理し、RAG 用の埋め込みを作成し、生成 AI を Spring Boot アプリケーションに統合し、復元力のための指数バックオフを実装します。

使用するタイミング

Claude、Llama、Titan、または Stable Diffusion でテキスト/画像生成を呼び出す
BedrockClient と BedrockRuntimeClient インスタンスを設定する
モデル固有のペイロード (Claude、Titan、Llama フォーマット) をビルドおよび解析する
非同期ハンドラーとエラーリカバリーを使用してリアルタイム AI 応答をストリーミングする
検索拡張生成 (RAG) 用の埋め込みを作成する
生成 AI を Spring Boot マイクロサービスに統合する
指数バックオフ再試行ロジックでスロットリングを処理する

クイックスタート

依存関係

<!-- Bedrock (モデル管理) -->
<dependency>
    <groupId>software.amazon.awssdk</groupId>
    <artifactId>bedrock</artifactId>
</dependency>

<!-- Bedrock Runtime (モデル呼び出し) -->
<dependency>
    <groupId>software.amazon.awssdk</groupId>
    <artifactId>bedrockruntime</artifactId>
</dependency>

<!-- JSON 処理用 -->
<dependency>
    <groupId>org.json</groupId>
    <artifactId>json</artifactId>
    <version>20231013</version>
</dependency>

クライアントセットアップ

import software.amazon.awssdk.regions.Region;
import software.amazon.awssdk.services.bedrock.BedrockClient;
import software.amazon.awssdk.services.bedrockruntime.BedrockRuntimeClient;

// モデル管理クライアント
BedrockClient bedrockClient = BedrockClient.builder()
    .region(Region.US_EAST_1)
    .build();

// モデル呼び出しクライアント
BedrockRuntimeClient bedrockRuntimeClient = BedrockRuntimeClient.builder()
    .region(Region.US_EAST_1)
    .build();

手順

本番対応の Bedrock 統合については、以下のステップに従ってください：

AWS 認証情報を設定する - Bedrock 権限を持つ IAM ロールを設定する (アクセスキーは避ける)
モデルアクセスを有効にする - AWS コンソールで特定の foundation models へのアクセスをリクエストする
クライアントを初期化する - 再利用可能な BedrockClient および BedrockRuntimeClient インスタンスを作成する
モデルの可用性を検証する - 本番利用前に簡単な呼び出しでテストする
ペイロードをビルドする - 適切なフォーマットでモデル固有の JSON ペイロードを作成する
応答を処理する - 応答構造を解析し、コンテンツを抽出する
ストリーミングを実装する - リアルタイム生成のためにレスポンスストリームハンドラーを使用する
エラーハンドリングを追加する - 指数バックオフを伴う再試行ロジックを実装する

検証チェックポイント: モデルアクセスと応答解析を検証するため、本番利用前に必ず簡単なプロンプト (例："Hello") でテストしてください。

例

Claude でのテキスト生成

public String generateWithClaude(BedrockRuntimeClient client, String prompt) {
    JSONObject payload = new JSONObject()
        .put("anthropic_version", "bedrock-2023-05-31")
        .put("max_tokens", 1000)
        .put("messages", new JSONObject[]{
            new JSONObject().put("role", "user").put("content", prompt)
        });

    InvokeModelResponse response = client.invokeModel(InvokeModelRequest.builder()
        .modelId("anthropic.claude-sonnet-4-5-20250929-v1:0")
        .body(SdkBytes.fromUtf8String(payload.toString()))
        .build());

    JSONObject responseBody = new JSONObject(response.body().asUtf8String());
    return responseBody.getJSONArray("content")
        .getJSONObject(0)
        .getString("text");
}

モデルディスカバリー

import software.amazon.awssdk.services.bedrock.model.*;

public List<FoundationModelSummary> listFoundationModels(BedrockClient bedrockClient) {
    return bedrockClient.listFoundationModels().modelSummaries();
}

マルチモデル呼び出し

public String invokeModel(BedrockRuntimeClient client, String modelId, String prompt) {
    JSONObject payload = createPayload(modelId, prompt);

    InvokeModelResponse response = client.invokeModel(request -> request
        .modelId(modelId)
        .body(SdkBytes.fromUtf8String(payload.toString())));

    return extractTextFromResponse(modelId, response.body().asUtf8String());
}

private JSONObject createPayload(String modelId, String prompt) {
    if (modelId.startsWith("anthropic.claude")) {
        return new JSONObject()
            .put("anthropic_version", "bedrock-2023-05-31")
            .put("max_tokens", 1000)
            .put("messages", new JSONObject[]{
                new JSONObject().put("role", "user").put("content", prompt)
            });
    } else if (modelId.startsWith("amazon.titan")) {
        return new JSONObject()
            .put("inputText", prompt)
            .put("textGenerationConfig", new JSONObject()
                .put("maxTokenCount", 512)
                .put("temperature", 0.7));
    } else if (modelId.startsWith("meta.llama")) {
        return new JSONObject()
            .put("prompt", "[INST] " + prompt + " [/INST]")
            .put("max_gen_len", 512)
            .put("temperature", 0.7);
    }
    throw new IllegalArgumentException("Unsupported model: " + modelId);
}

エラーハンドリングを伴うストリーミング応答

public String streamResponseWithRetry(BedrockRuntimeClient client, String modelId, String prompt, int maxRetries) {
    int attempt = 0;
    while (attempt < maxRetries) {
        try {
            JSONObject payload = createPayload(modelId, prompt);
            StringBuilder fullResponse = new StringBuilder();

            InvokeModelWithResponseStreamRequest request = InvokeModelWithResponseStreamRequest.builder()
                .modelId(modelId)
                .body(SdkBytes.fromUtf8String(payload.toString()))
                .build();

            client.invokeModelWithResponseStream(request,
                InvokeModelWithResponseStreamResponseHandler.builder()
                    .onEventStream(stream -> stream.forEach(event -> {
                        if (event instanceof PayloadPart) {
                            String chunk = ((PayloadPart) event).bytes().asUtf8String();
                            fullResponse.append(chunk);
                        }
                    }))
                    .onError(e -> System.err.println("Stream error: " + e.getMessage()))
                    .build());

            return fullResponse.toString();
        } catch (Exception e) {
            attempt++;
            if (attempt >= maxRetries) {
                throw new RuntimeException("Stream failed after " + maxRetries + " attempts", e);
            }
            try {
                Thread.sleep((long) Math.pow(2, attempt) * 1000); // 指数バックオフ
            } catch (InterruptedException ie) {
                Thread.currentThread().interrupt();
                throw new RuntimeException("Interrupted during retry", ie);
            }
        }
    }
    throw new RuntimeException("Unexpected error in streaming");
}

スロットリング用の指数バックオフ

import software.amazon.awssdk.awscore.exception.AwsServiceException;

public <T> T invokeWithRetry(Supplier<T> invocation, int maxRetries) {
    int attempt = 0;
    while (attempt < maxRetries) {
        try {
            return invocation.get();
        } catch (AwsServiceException e) {
            if (e.statusCode() == 429 || e.statusCode() >= 500) {
                attempt++;
                if (attempt >= maxRetries) throw e;
                long delayMs = Math.min(1000 * (1L << attempt) + (long) (Math.random() * 1000), 30000);
                Thread.sleep(delayMs);
            } else {
                throw e;
            }
        }
    }
    throw new IllegalStateException("Should not reach here");
}

テキスト埋め込み

public double[] createEmbeddings(BedrockRuntimeClient client, String text) {
    String modelId = "amazon.titan-embed-text-v1";

    JSONObject payload = new JSONObject().put("inputText", text);

    InvokeModelResponse response = client.invokeModel(request -> request
        .modelId(modelId)
        .body(SdkBytes.fromUtf8String(payload.toString())));

    JSONObject responseBody = new JSONObject(response.body().asUtf8String());
    JSONArray embeddingArray = responseBody.getJSONArray("embedding");

    double[] embeddings = new double[embeddingArray.length()];
    for (int i = 0; i < embeddingArray.length(); i++) {
        embeddings[i] = embeddingArray.getDouble(i);
    }
    return embeddings;
}

Spring Boot 統合

@Configuration
public class BedrockConfiguration {

    @Bean
    public BedrockClient bedrockClient() {
        return BedrockClient.builder()
            .region(Region.US_EAST_1)
            .build();
    }

    @Bean
    public BedrockRuntimeClient bedrockRuntimeClient() {
        return BedrockRuntimeClient.builder()
            .region(Region.US_EAST_1)
            .build();
    }
}

@Service
public class BedrockAIService {

    private final BedrockRuntimeClient bedrockRuntimeClient;
    private final ObjectMapper mapper;

    @Value("${bedrock.default-model-id:anthropic.claude-sonnet-4-5-20250929-v1:0}")
    private String defaultModelId;

    public BedrockAIService(BedrockRuntimeClient bedrockRuntimeClient, ObjectMapper mapper) {
        this.bedrockRuntimeClient = bedrockRuntimeClient;
        this.mapper = mapper;
    }

    public String generateText(String prompt) {
        Map<String, Object> payload = Map.of(
            "anthropic_version", "bedrock-2023-05-31",
            "max_tokens", 1000,
            "messages", List.of(Map.of("role", "user", "content", prompt))
        );

        InvokeModelResponse response = bedrockRuntimeClient.invokeModel(
            InvokeModelRequest.builder()
                .modelId(defaultModelId)
                .body(SdkBytes.fromUtf8String(mapper.writeValueAsString(payload)))
                .build());

        return extractText(response.body().asUtf8String());
    }
}

包括的な使用パターンについては、examples ディレクトリを参照してください。

ベストプラクティス

モデル選択

Claude 4.5 Sonnet: 複雑な推論、分析、クリエイティブなタスク
Claude 4.5 Haiku: リアルタイムアプリケーション向けの高速で安価
Llama 3.1: 一般的なタスク向けのオープンソース代替
Titan: AWS ネイティブ、シンプルなテキスト生成向けのコスト効率

パフォーマンス

クライアントインスタンスを再利用する (リクエストごとに新しいクライアントを作成しない)
I/O 操作には非同期クライアントを使用する
長い応答にはストリーミングを実装する
foundation model リストをキャッシュする

セキュリティ

機密のプロンプトデータをログに出力しない
認証に IAM ロールを使用する
ユーザー入力をサニタイズしてプロンプトインジェクションを防ぐ
パブリックアプリケーションでレート制限を実装する

制約と警告

コスト管理: Bedrock API 呼び出しはトークンごとに料金が発生します。使用状況監視と予算アラートを実装してください。
モデルアクセス: Foundation models は AWS コンソールで有効にする必要があります。地域の可用性を確認してください。
レート制限: スロットリングに対して指数バックオフを実装してください。モデルごとの制限を確認してください。
ペイロードサイズ: 最大ペイロードサイズはモデルによって異なります。大規模なドキュメントにはチャンキングを使用してください。
ストリーミングの複雑性: 部分コンテンツとエラーリカバリーを慎重に処理してください。
データプライバシー: プロンプトと応答は AWS によってログされる可能性があります。データポリシーを確認してください。
認証情報: 認証情報をコードに埋め込まないでください。EC2/Lambda には IAM ロールを使用してください。

一般的なモデル ID

Claude Sonnet 4.5: anthropic.claude-sonnet-4-5-20250929-v1:0
Claude Haiku 4.5: anthropic.claude-haiku-4-5-20251001-v1:0
Llama 3.1 70B: meta.llama3-1-70b-instruct-v1:0
Titan Embeddings: amazon.titan-embed-text-v1

完全なリストについては Model Reference を参照してください。

参考資料

Advanced Topics - マルチモデルパターン、高度なエラーハンドリング
Model Reference - 詳細な仕様、ペイロードフォーマット
Testing Strategies - ユニットテスト、LocalStack 統合
AWS Bedrock User Guide
AWS SDK Examples
Supported Models

詳細情報

作者: giuseppe-trisciuoglio
リポジトリ: giuseppe-trisciuoglio/developer-kit
ライセンス: MIT
最終更新: 不明

GitHubで原本を見る →フィードバックを送る

Source: https://github.com/giuseppe-trisciuoglio/developer-kit / ライセンス: MIT