打造你的专属AI API!深入浅出Spring Boot与Google Gemini的完美融合!
- Rifx.Online
- Programming , Technology/Web , Chatbots
- 11 Jan, 2025
创建一个智能网络服务,利用生成式 AI 的力量回答问题
在本教程中,我们将整合 Spring Boot 和 Spring AI/Gen AI,构建一个利用 Google’s Gemini 生成式 AI 模型的网络服务。我们的目标是创建一个简单的网络服务,能够基于生成式 AI 的能力智能地回答用户问题。借助 Gemini 的强大功能,我们可以利用尖端 AI 提供准确且具有上下文感知的响应,使我们的网络服务既实用又互动。
概述
我们将使用 Spring Boot,一个流行的基于Java的框架,来创建我们的web服务的后端。我们还将集成 Spring AI,使得与机器学习和生成式AI模型的工作变得无缝。使用Gemini作为我们的AI模型,我们将建立一个系统,以先进的自然语言响应来回答用户的问题。
前提条件
- Java 11 或更高版本:确保您安装了正确版本的 Java。
- Maven:用于依赖管理和构建项目。
- 基本的 Spring Boot 理解:熟悉 Spring Boot 和 RESTful Web 服务将会有所帮助。
- Gemini API 访问:您需要访问 Google 的 Gemini 模型的 API,以获取生成式 AI 功能。
第一步:设置 Spring Boot 项目
首先,让我们创建一个 Spring Boot 应用程序。您可以使用 Spring Initializr 来设置项目结构。
- 访问 Spring Initializr。
- 填写详细信息: 项目:Maven 项目 语言:Java Spring Boot 版本:最新 依赖项:选择“Spring Web”、“Spring AI”和“Spring Boot Actuator”。
- 生成项目并解压缩。
- 将项目导入您喜欢的 IDE(例如,IntelliJ IDEA 或 Eclipse)。
第2步:添加Spring AI和Google Gemini的依赖
打开您的pom.xml
文件,添加集成Spring AI和Gemini所需的依赖。每个依赖都有其特定的用途:
- Spring Boot Web:提供创建Web应用程序的核心功能,使我们能够构建RESTful API。
- Spring AI:将机器学习和生成式AI能力无缝集成到Spring Boot应用程序中。
- Google Gemini API Client:允许我们与Google Gemini AI模型进行交互,以生成智能响应。
- Jackson用于JSON解析:用于将JSON数据解析为Java对象及其反向操作,这对于处理API请求和响应是必要的。
<dependencies>
<!-- Spring Boot Web dependency -->
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-web</artifactId>
</dependency>
<!-- Spring AI dependency -->
<dependency>
<groupId>org.springframework.ai</groupId>
<artifactId>spring-ai</artifactId>
<version>1.0.0</version>
</dependency>
<!-- Google Gemini API Client -->
<dependency>
<groupId>com.google.api</groupId>
<artifactId>google-gemini-client</artifactId>
<version>1.0.0</version>
</dependency>
<!-- Jackson for JSON parsing -->
<dependency>
<groupId>com.fasterxml.jackson.core</groupId>
<artifactId>jackson-databind</artifactId>
</dependency>
</dependencies>
第 3 步:配置 Google Gemini API 访问
要与 Google 的 Gemini 模型进行交互,您需要从 Google 获取 API 密钥并配置 API 访问。以下是获取 API 密钥的方法:
- 注册 Google Cloud:如果您还没有 Google Cloud 账户,请在 Google Cloud Platform 注册。
- 启用 Gemini API:前往 Google Cloud Console,搜索 Gemini API,并为您的项目启用它。如果您没有项目,可能需要创建一个新项目。
- 获取 API 密钥:在 Cloud Console 中导航到 APIs & Services 部分。 - 点击 Credentials。 - 选择 Create Credentials > API Key。 - 复制生成的 API 密钥。
- 一旦您拥有 API 密钥,您可以将其添加到 application.properties 文件中:
gemini.api.key=YOUR_GEMINI_API_KEY
将 YOUR_GEMINI_API_KEY
替换为 Google 在您注册访问时提供的 API 密钥。
第4步:为Gemini交互创建客户端接口
为了使系统更加灵活,我们将为与Gemini API交互创建一个单独的客户端接口层。这样,如果将来需要,我们可以轻松地将Gemini API替换为其他AI提供商。
创建一个名为AIClient
的接口,然后提供Gemini的实现。
package com.example.demo.client;
public interface AIClient {
String getAnswer(String question);
}
现在,创建一个使用Gemini API的AIClient
实现。
package com.example.demo.client.impl;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.stereotype.Component;
import com.google.api.gemini.GeminiClient;
import com.google.api.gemini.model.GeminiRequest;
import com.google.api.gemini.model.GeminiResponse;
import com.example.demo.client.AIClient;
@Component
public class GeminiClientImpl implements AIClient {
@Value("${gemini.api.key}")
private String apiKey;
private final GeminiClient geminiClient;
public GeminiClientImpl() {
this.geminiClient = new GeminiClient(apiKey);
}
@Override
public String getAnswer(String question) {
GeminiRequest request = new GeminiRequest(question);
GeminiResponse response = geminiClient.generateResponse(request);
return response.getText();
}
}
第4步:创建一个服务层以使用AI客户端
现在我们有了一个灵活的客户端接口,我们可以创建一个服务,使用这个AIClient
来获取答案。
package com.example.demo.service;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Service;
import com.example.demo.client.AIClient;
@Service
public class AIService {
private final AIClient aiClient;
@Autowired
public AIService(AIClient aiClient) {
this.aiClient = aiClient;
}
public String getAnswer(String question) {
return aiClient.getAnswer(question);
}
}
第5步:创建用户交互的REST控制器
在此步骤中,我们将创建一个REST控制器,允许用户通过发送HTTP请求与AI服务进行交互。我们将设置一个GET端点,用户可以将他们的问题作为查询参数传递。控制器将使用AIService
来处理请求并返回AI生成的答案。
这种方法使得使用网页浏览器或Postman等工具测试服务变得简单。
package com.example.demo.controller;
import com.example.demo.service.GeminiService;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.bind.annotation.RestController;
@RestController
public class QuestionController {
@Autowired
private GeminiService aiService;
@GetMapping("/ask")
public String askQuestion(@RequestParam String question) {
return geminiService.getAnswer(question);
}
}
第6步:运行Spring Boot应用程序
现在一切都已设置好,是时候运行Spring Boot应用程序了。您可以通过运行DemoApplication
类(带有@SpringBootApplication
注解的类)来完成此操作。
一旦应用程序运行,您可以通过在浏览器中访问以下URL,使用像Postman这样的工具,或使用curl
命令来访问API:
使用 curl 的示例
curl "http://localhost:8080/ask?question=What is generative AI?"
第7步:测试和完善服务
尝试提出各种问题,以查看AI的响应效果。您可能需要添加日志记录和错误处理,以完善响应并在API失败时提供有意义的消息。
增强安全性和性能
- 速率限制:为了防止滥用您的 AI 驱动的端点,可以使用速率限制工具,如 Spring Boot Rate Limiter,限制用户在给定时间内可以发出的请求数量。
- 身份验证和授权:实施 Spring Security 来验证用户身份并授权访问 AI 服务。这有助于保护端点免受未经授权的使用,并确保只有合法用户可以与您的服务交互。
- 缓存:使用缓存机制,如 Spring Cache,存储经常请求的答案,从而减少 API 调用并提高响应时间。
- 输入验证:确保验证用户输入,以避免格式错误或潜在的有害请求。
奖励步骤:集成语音转文本和文本转语音,构建您自己的 Jarvis
为了进一步推进这个项目,您可以集成语音转文本和文本转语音的功能,创建您自己的基于语音的助手,类似于《钢铁侠》中的 Jarvis。这将允许用户使用语音命令与 AI 进行互动,并接收语音回复。
你可以使用的工具:
- Google Cloud Speech-to-Text: 将口语转换为文本。这可以用于通过语音输入捕捉用户的问题。
- Google Cloud Text-to-Speech: 将AI的文本响应转换为语音,使AI能够“回复”用户。
- Vosk API: 一种开源的语音识别替代方案,可以离线工作,适合更简单或离线的应用程序。
集成步骤:
- 添加依赖:在您的
pom.xml
中添加 Google Cloud Speech 和 Text-to-Speech 所需的依赖。|
<dependency>
<groupId>com.google.cloud</groupId>
<artifactId>google-cloud-speech</artifactId>
<version>1.28.0</version>
</dependency>
<dependency>
<groupId>com.google.cloud</groupId>
<artifactId>google-cloud-texttospeech</artifactId>
<version>1.3.0</version>
</dependency>
2. 设置服务:创建使用 Google Cloud SDK 与 Speech-to-Text 和 Text-to-Speech API 交互的服务。
3. 与 AI 控制器集成:修改您的控制器以接受音频输入,使用 Speech-to-Text 将其转换为文本,将文本发送给 Gemini 进行处理,然后使用 Text-to-Speech 将 AI 响应转换回语音。
通过这些附加功能,您的 AI 驱动的 Spring Boot 应用程序成为一个完全互动的语音助手,可以回答问题、提供信息,甚至帮助自动化任务。
结论
将 Spring Boot 与 Spring AI 和 Google Gemini 集成,可以创建一个强大的网络服务,利用生成式 AI 来回答用户问题。这种集成展示了传统网络框架如何与现代 AI 技术结合,以构建智能和响应迅速的应用程序。
该项目可以通过添加更高级的 NLP 技术、整合其他 AI 模型或创建更强大的用户界面以改善用户互动来进一步扩展。随着生成式 AI 能力的不断增强,可能性是无穷无尽的。