LangChain4j是什么？一文看懂 – wiki基地

深入理解 LangChain4j：Java 世界的大模型应用开发框架

一文看懂 LangChain4j

在人工智能浪潮汹涌的今天，大型语言模型（LLM）正以前所未有的速度改变着软件开发的范式。从自然语言理解、文本生成到代码辅助、知识问答，LLMs 的强大能力正在被融入到各种应用中。然而，直接使用 LLMs 的 API 构建复杂应用并非易事。开发者需要处理状态管理、连接外部数据、调用外部工具、构建复杂的提示词（Prompts）序列等一系列挑战。

为了应对这些挑战，像 LangChain 这样的框架应运而生。它提供了一系列抽象和工具，极大地简化了基于 LLM 构建应用程序的过程。随着 Java 在企业级应用开发领域的广泛应用，将 LangChain 的强大能力引入 Java 生态系统变得尤为重要。LangChain4j 正是为了填补这一空白而诞生的框架。

本文将带您深入探索 LangChain4j，从其产生的背景、核心概念到关键组件和实际应用，帮助您全面理解这个在 Java 世界中构建大模型应用的利器。

第一章：为什么是 LangChain4j？—— LLM 应用开发的挑战与框架的价值

LLMs 本质上是强大的文本处理器，它们通过对海量数据进行训练，学会了预测下一个词的能力。这使得它们能够执行各种自然语言任务。然而，将这种能力转化为一个功能完备的应用，需要克服几个关键的障碍：

模型的局限性：
- 知识截止日期： LLMs 的知识仅限于其训练数据的时间点，无法获取实时信息或未包含在训练集中的私有数据。
- 无状态性： LLM 的 API 调用通常是无状态的。对于需要上下文的应用（如聊天机器人），需要外部机制来管理对话历史。
- 推理能力的局限： LLMs 在执行复杂计算或逻辑推理方面可能存在局限性，需要依赖外部工具辅助。
- 幻觉 (Hallucination)： 模型有时会生成听起来合理但实际上是错误或虚构的信息。
应用开发的复杂性：
- Prompt Engineering： 如何设计有效的提示词以引导模型输出期望结果是一门艺术，且不同任务需要不同的策略。
- 数据连接： 如何让 LLM 访问和利用外部的、非训练数据（如企业的内部文档、数据库信息）。
- 工具使用： 如何让 LLM 不仅生成文本，还能调用外部 API 或服务来执行特定操作（如搜索网页、发送邮件、执行代码）。
- 流程编排： 如何将多个 LLM 调用、数据检索步骤和工具调用组合成一个连贯的工作流。
- 评估与监控： 如何有效地测试、评估和监控 LLM 应用的性能和输出质量。

框架的价值：抽象、模块化与标准模式

像 LangChain4j 这样的框架正是为了解决上述挑战而设计的。它提供了一套标准接口、可重用组件和设计模式，帮助开发者：

抽象化 LLM 接口： 提供统一的接口来与不同的 LLM 提供商（如 OpenAI, Google AI, Azure, Hugging Face 等）进行交互，降低切换模型的成本。
简化 Prompt 管理： 提供模板引擎，使提示词的构建更加结构化和动态。
促进数据连接 (RAG)： 提供工具来加载、分割、嵌入和存储外部数据，并实现基于检索的增强生成 (Retrieval Augmented Generation, RAG)，让 LLM 能够利用私有或实时信息。
赋能工具使用 (Agents)： 提供机制让 LLM 能够理解何时以及如何调用外部工具，从而扩展其能力边界。
支持流程编排 (Chains)： 允许开发者将 LLM 调用、数据处理、工具使用等步骤链接起来，构建复杂的工作流。
提供状态管理 (Memory)： 提供抽象来轻松地为聊天应用添加对话历史记忆。

为什么是 LangChain4j for Java?

Java 是全球最流行的编程语言之一，在企业级应用、大数据、Android 开发等领域占据主导地位。随着 LLM 技术在企业中落地，Java 开发者迫切需要一个强大、成熟且符合 Java 生态习惯的 LLM 应用开发框架。LangChain4j 正是应运而生，它将 LangChain 的核心理念和强大功能带入 Java 世界，使得数百万 Java 开发者能够便捷地构建基于 LLM 的创新应用。它不仅是 LangChain 的一个 Java 端口，更是结合了 Java 语言特性和生态系统的优化实现。

第二章：LangChain4j 的核心概念

理解 LangChain4j，需要先掌握其几个核心概念，它们是构建所有 LangM应用的基础：

模型 (Models): LangChain4j 对不同类型的语言模型进行了抽象。
- ChatLanguageModel: 用于聊天对话的模型，支持多轮对话（输入是消息列表，输出是消息）。这是最常用的类型，适用于构建聊天机器人、内容生成等。
- LanguageModel: 用于文本补全的模型（输入是字符串，输出是字符串）。虽然功能上被 Chat 模型包含，但在某些简单场景仍有用途。
- EmbeddingModel: 用于将文本转换为向量的模型。这是实现 RAG（检索增强生成）的基础，用于计算文本的语义相似度。
提示词 (Prompts): LLM 的输入，告诉模型应该做什么。LangChain4j 提供了 PromptTemplate 来简化提示词的构建。
- PromptTemplate: 一个包含占位符的文本模板，可以在运行时用具体值填充占位符，生成最终的提示词。这使得提示词更易于管理、复用和动态生成。
链 (Chains): 将多个组件（如模型调用、数据处理、格式化输出等）按顺序连接起来，形成一个工作流。
- LangChain4j 允许构建简单的链，将一个组件的输出作为下一个组件的输入。例如，一个链可以先根据模板生成提示词，然后调用 LLM，最后对结果进行后处理。
代理 (Agents): LLM 不仅可以生成文本，还可以根据输入决定执行一系列动作。代理是赋予 LLM 这种“决策”能力的核心概念。
- 代理根据用户的输入和自身掌握的工具，通过与 LLM 的多次交互（思想 – 动作循环），决定下一步是调用哪个工具、使用什么参数，直到达到目标或确定无法完成任务。
工具 (Tools): 外部函数或服务，可以被代理调用以执行特定操作。工具扩展了 LLM 的能力范围，使其能够与外部世界交互、获取实时信息或执行计算。
- 在 LangChain4j 中，可以简单地通过注解（如 @Tool）将 Java 方法暴露为工具。
检索 (Retrieval) / RAG： 连接 LLM 到外部数据（非训练数据）的关键技术。
- 文档加载器 (Document Loaders): 从各种来源加载文档（如文件系统、URL、数据库等）。
- 文本分割器 (Text Splitters): 将长文档分割成更小的、适合处理的块（Chunks），以便后续嵌入和检索。
- 嵌入模型 (Embedding Models): 将文本块转换为数值向量（Embeddings），捕捉其语义信息。
- 向量存储 (Vector Stores): 存储嵌入向量及其对应的文本块，并支持高效的相似度搜索（即给定一个查询向量，找到最相似的文本块向量）。常见的有 Chroma, Pinecone, Weaviate, Milvus, PGVector 等。
- 检索器 (Retriever): 根据用户查询，在向量存储中查找最相关的文本块。
- RAG (Retrieval Augmented Generation): 将检索到的相关文本块添加到用户的提示词中，提供给 LLM，从而让 LLM 基于这些增强信息生成回答。这是解决 LLM 知识截止和私有数据访问问题的标准方案。
记忆 (Memory): 为 LLM 应用提供上下文管理，尤其是在构建聊天机器人时。
- 记忆模块存储历史对话，并在每次新的用户输入时，将部分或全部历史对话添加到发送给 LLM 的提示词中，使模型能够理解对话的上下文。
- LangChain4j 提供了不同的记忆实现，如基于消息窗口的记忆 (ChatMessageWindow) 或基于 Token 数量限制的记忆 (TokenWindowSaver)。

第三章：LangChain4j 核心组件详解与实践

现在，我们来详细看看如何在 LangChain4j 中使用这些核心概念。

3.1 模型的使用

LangChain4j 通过统一的接口简化了不同 LLM 提供商的使用。您只需要配置相应的模型工厂或 Builder。

“`java
// 以 OpenAI 为例
ChatLanguageModel model = OpenAiChatModel.builder()
.apiKey(System.getenv(“OPENAI_API_KEY”))
.modelName(“gpt-4o-mini”) // 或者其他模型如 gpt-3.5-turbo, gpt-4
.temperature(0.7) // 控制随机性
.logRequestsAndResponses(true) // 方便调试
.build();

// 进行一次聊天调用
String response = model.generate(“你好，能介绍一下你自己吗？”);
System.out.println(response);

// embedding 模型
EmbeddingModel embeddingModel = OpenAiEmbeddingModel.builder()
.apiKey(System.getenv(“OPENAI_API_KEY”))
.modelName(“text-embedding-3-small”) // 或 text-embedding-3-large
.build();

// 生成文本的 embedding 向量
List embedding = embeddingModel.embed(“这是一段示例文本”).content().vector();
System.out.println(“Embedding 向量大小: ” + embedding.size());
“`

切换模型提供商（如到 Google AI）只需要更改 Builder 类型并提供相应的凭据。

java // 以 Google AI 为例 ChatLanguageModel googleModel = GoogleGeminiChatModel.builder() .apiKey(System.getenv("GOOGLE_API_KEY")) .modelName("gemini-1.5-flash-latest") .build();

3.2 Prompt Engineering 与 PromptTemplate

使用 PromptTemplate 可以避免硬编码提示词，使其更加灵活。

“`java
// 定义一个 PromptTemplate
PromptTemplate template = PromptTemplate.from(“请用中文回答以下问题：{{question}}”);

// 创建一个 Map 填充占位符
Map variables = new HashMap<>();
variables.put(“question”, “Java LangChain4j 是什么？”);

// 填充模板生成最终提示词
String promptText = template.apply(variables).text();

// 将提示词发送给模型（通常包装成 ChatMessage）
ChatMessage promptMessage = SystemMessage.from(promptText); // 或 UserMessage.from(promptText)
List messages = Collections.singletonList(promptMessage);

String answer = model.generate(messages).content().text();
System.out.println(answer);
“`

对于聊天模型，PromptTemplate 通常用于生成初始的系统消息或用户消息。

3.3 构建链 (Chains)

LangChain4j 提供了多种构建链的方式。最直观的是使用函数式风格或通过特定的 Chain 类。

“`java
// 简单的顺序链示例 (概念，LangChain4j 具体实现可能略有不同，但思想一致)

// Step 1: Template -> Prompt
PromptTemplate template = PromptTemplate.from(“将以下文本翻译成中文：{{text}}”);
// Step 2: Prompt -> LLM Response
ChatLanguageModel translationModel = …; // 获取一个翻译模型
// Step 3: LLM Response -> Final Output (可能是提取内容或格式化)

// 组合这些步骤形成链
// 实际使用中，可能通过 Function 或 Chain 接口组合
// 例如，可以使用 AiServices 提供的 @FunctionCall 或 @SystemMessage 等构建更复杂的链
“`

更常见且强大的链式操作，特别是与 Prompt 结合，可以通过 LangChain4j 的 AiServices 实现，这将在 Agents 部分看到。

3.4 代理 (Agents) 与工具 (Tools)

这是 LangChain4j 最令人兴奋的功能之一。通过定义工具并创建一个代理，可以让 LLM 自动调用这些工具来完成任务。

首先，定义工具类和方法：

“`java
public class Calculator {

@Tool("计算数学表达式，例如：2+2，5*3-1")
public String calculate(String expression) {
    // 这里可以使用一个实际的表达式解析器或脚本引擎来执行计算
    try {
        // 简单示例，实际应更健壮
        return String.valueOf(new javax.script.ScriptEngineManager().getEngineByName("Nashorn").eval(expression));
    } catch (Exception e) {
        return "计算出错: " + e.getMessage();
    }
}

}
“`

然后，创建一个代理，并将工具提供给它：

“`java
// 创建一个聊天模型
ChatLanguageModel chatModel = OpenAiChatModel.builder()
.apiKey(System.getenv(“OPENAI_API_KEY”))
.modelName(“gpt-4o-mini”) // 或 gpt-4
.build();

// 创建一个 AiServices 代理接口
interface Assistant {
String chat(String userMessage);
}

// 使用 AiServices 绑定模型和工具
Assistant assistant = AiServices.builder(Assistant.class)
.chatLanguageModel(chatModel)
.tools(new Calculator()) // 添加工具实例
.build();

// 与代理交互
String result1 = assistant.chat(“今天天气怎么样？”); // 代理会识别这不是工具能解决的问题，直接用模型回答
System.out.println(“用户: 今天天气怎么样？”);
System.out.println(“助手: ” + result1);

String result2 = assistant.chat(“请计算 123 * 456 + 789 的结果是多少？”); // 代理会识别需要计算工具，并调用它
System.out.println(“用户: 请计算 123 * 456 + 789 的结果是多少？”);
System.out.println(“助手: ” + result2);
“`

在上面的例子中，AiServices 扮演了代理的角色。它接收用户输入，将其发送给 LLM。如果 LLM（通过 function calling 能力）指示需要调用某个工具，AiServices 会调用对应的 Java 方法，并将结果返回给 LLM，让 LLM 生成最终响应。

3.5 实现 RAG (Retrieval Augmented Generation)

RAG 是 LangChain4j 中非常重要的能力，用于让 LLM 具备访问外部知识库的能力。实现 RAG 通常包括以下步骤：

加载文档:
java Document document = FileSystemDocumentLoader.load("path/to/your/document.txt"); // 或 HtmlDocumentLoader, UrlDocumentLoader, etc.
分割文档: 将大文档分割成小块，方便后续处理。
java DocumentSplitter splitter = DocumentSplitters.recursive(100, 20); // 块大小100，重叠20 List<TextSegment> segments = splitter.split(document);
生成嵌入: 使用 Embedding 模型将文本块转换为向量。
java EmbeddingModel embeddingModel = ...; // 获取 Embedding 模型实例 List<Embedding> embeddings = embeddingModel.embedAll(segments).content();
存储到向量库: 将文本块及其对应的向量存储到向量数据库中。
“`java
// 以 In-memory 向量库为例 (简单测试用，生产环境使用专业向量库)
EmbeddingStore embeddingStore = new InMemoryEmbeddingStore<>();
embeddingStore.addAll(embeddings, segments);

// 集成专业的向量库：
// EmbeddingStore embeddingStore = ChromaEmbeddingStore.builder().build();
// EmbeddingStore embeddingStore = PineconeEmbeddingStore.builder().build();
// … 等等，LangChain4j 支持多种向量库
“`
创建检索器: 基于向量库和嵌入模型创建一个检索器。
java Retriever<TextSegment> retriever = EmbeddingStoreRetriever.from(embeddingStore, embeddingModel);
执行 RAG 查询: 当用户提出问题时：
- 使用嵌入模型嵌入用户查询。
- 使用检索器在向量库中查找最相关的文本块。
- 将用户查询和检索到的文本块（作为上下文）一起构建一个提示词发送给 Chat 模型。
  “`java
  // 用户查询
  String userQuery = “LangChain4j 的核心概念是什么？”;
// 检索相关信息
List relevantSegments = retriever.retrieve(userQuery);

// 构建增强后的提示词
PromptTemplate ragPromptTemplate = PromptTemplate.from(
“基于以下信息回答用户问题：\n” +
“{{information}}\n\n” +
“用户问题：{{query}}”
);

Map ragVariables = new HashMap<>();
ragVariables.put(“information”, relevantSegments.stream()
.map(TextSegment::text)
.collect(Collectors.joining(“\n\n”))); // 将多个文本块合并
ragVariables.put(“query”, userQuery);

String ragPrompt = ragPromptTemplate.apply(ragVariables).text();

// 发送给 Chat 模型获取回答
ChatLanguageModel chatModel = …; // 获取 Chat 模型实例
String answer = chatModel.generate(ragPrompt);
System.out.println(answer);
“`

通过 AiServices，RAG 的集成可以更加简化，只需配置 Retriever：

“`java
interface RagAssistant {
@UserMessage(“基于我的文档回答以下问题: {{it}}”) // {{it}} 表示用户输入
String answerBasedOnMyDocuments(String query);
}

RagAssistant ragAssistant = AiServices.builder(RagAssistant.class)
.chatLanguageModel(chatModel)
.retriever(retriever) // 配置检索器
.build();

String ragAnswer = ragAssistant.answerBasedOnMyDocuments(“LangChain4j 是什么？”);
System.out.println(ragAnswer);
`` 在这种方式下，AiServices会自动将用户输入通过 Retriever 进行检索，并将检索到的结果插入到@UserMessage模板中的相应位置（例如默认插入到{{retrieval}}` 占位符，或者如示例中与用户消息合并）再发送给 LLM。

3.6 记忆 (Memory) 的使用

为聊天应用添加记忆非常简单，只需在构建 AiServices 时配置 ChatMemory。

“`java
// 创建一个聊天记忆实例 (这里使用简单的消息窗口记忆)
ChatMemory chatMemory = MessageWindowChatMemory.withMaxMessages(10); // 记住最近10条消息

// 或者基于 Token 限制的记忆
// ChatMemory chatMemory = TokenWindowChatMemory.builder()
// .chatLanguageModel(chatModel) // 需要模型来计算 token
// .maxTokens(500)
// .build();

// 使用 AiServices 绑定模型和记忆
interface ChatBot {
String chat(String userMessage);
}

ChatBot chatBot = AiServices.builder(ChatBot.class)
.chatLanguageModel(chatModel)
.chatMemory(chatMemory) // 添加记忆
.build();

// 进行对话，记忆会自动管理
System.out.println(“User: 你好”);
System.out.println(“Bot: ” + chatBot.chat(“你好”)); // 第一次对话

System.out.println(“User: 我的名字是 Tom”);
System.out.println(“Bot: ” + chatBot.chat(“我的名字是 Tom”)); // 第二次对话，记忆会记住前一条

System.out.println(“User: 我叫什么名字？”);
System.out.println(“Bot: ” + chatBot.chat(“我叫什么名字？”)); // 第三次对话，因为有记忆，模型知道用户名字
“`

第四章：LangChain4j 的集成与生态系统

LangChain4j 的强大之处还在于其丰富的集成能力，它与 Java 生态系统中的许多流行技术和框架兼容。

LLM 提供商： 开箱即用地支持 OpenAI, Azure OpenAI, Google AI (Gemini), Hugging Face (通过 Inference API 或本地模型), Anthropic (Claude), Stability AI 等主流 LLM 服务商。
向量存储： 支持 Chroma, Pinecone, Weaviate, Milvus, Qdrant, Redis, PGVector, Elasticsearch 以及简单的内存实现等多种向量数据库。这允许开发者根据自己的需求选择最合适的存储方案。
文档加载器： 提供加载多种格式文档的能力，如文本文件、PDF、Word、HTML、CSV 等。
文本分割器： 提供多种策略来分割文本，以优化 RAG 性能。
框架集成： 提供 Spring Boot Starter，使得在 Spring Boot 应用中集成 LangChain4j 变得非常简单，只需少量配置即可启动 LLM 服务。
反应式支持： 对许多操作提供了反应式（Reactive）API 支持，可以与 Spring WebFlux, Reactor 等技术无缝集成，构建非阻塞的高性能应用。
可观察性： 支持集成 Tracing 和 Logging，方便调试和监控 LLM 调用过程。

第五章：LangChain4j 的典型应用场景

基于 LangChain4j，Java 开发者可以轻松构建各种强大的 LLM 应用：

智能问答系统： 构建基于企业内部文档或特定领域知识的智能问答机器人（典型的 RAG 应用）。
高级聊天机器人： 创建能够理解上下文、记忆对话历史、并能调用外部工具完成复杂任务（如查询订单、预定会议）的聊天机器人（结合 Memory, Agents, Tools）。
内容创作助手： 开发辅助写作、生成营销文案、代码片段、邮件草稿等的工具。
数据提取与处理： 从非结构化文本中提取结构化信息，进行总结、翻译或情感分析。
智能客服与支持： 构建能够理解用户意图、提供解决方案、或将复杂问题转接给人工客服的智能客服系统。
自动化工作流： 创建能够根据指令调用多个外部系统 API 完成复杂流程的自动化代理。
代码辅助工具： 构建代码生成、代码解释、Bug 查找建议等开发者工具。

第六章：如何开始使用 LangChain4j

开始使用 LangChain4j 非常简单。

添加依赖： 如果使用 Maven，在 pom.xml 中添加核心依赖和您需要使用的模型提供商、向量库等依赖。

“`xml

dev.langchain4j
langchain4j
0.30.0

dev.langchain4j
langchain4j-openai
0.30.0

dev.langchain4j
langchain4j-chroma
0.30.0

dev.langchain4j
langchain4j-spring-boot-starter
0.30.0

“`
如果使用 Gradle，语法类似。
配置模型： 设置 API 密钥等必要的环境变量或配置文件。例如：
OPENAI_API_KEY=sk-...
编写代码： 根据您的需求，使用 LangChain4j 的 API 构建模型调用、PromptTemplate、Agents、RAG 等。

一个最简单的“Hello LLM”示例：

“`java
import dev.langchain4j.model.openai.OpenAiChatModel;

public class HelloLangChain4j {
public static void main(String[] args) {
ChatLanguageModel model = OpenAiChatModel.withApiKey(System.getenv(“OPENAI_API_KEY”));

    String response = model.generate("讲一个关于猫的冷笑话。");

    System.out.println(response);
}

}
“`
运行此代码（确保设置了 OPENAI_API_KEY 环境变量并有网络连接），您将看到 LLM 返回的冷笑话。

第七章：进阶话题与最佳实践

构建生产级的 LLM 应用还需要考虑一些进阶话题：

成本管理： LLM API 调用通常按 token 计费。优化提示词、使用合适的模型（例如，功能强大的如 GPT-4/Gemini 1.5 用于复杂推理，便宜快速的如 GPT-4o-mini/Gemini 1.5 Flash 用于简单任务或 RAG 后处理）以及有效管理记忆（限制历史消息数量）是重要的成本控制手段。
性能优化： 对于需要低延迟的应用，考虑模型的响应速度、向量库的查询性能、以及使用异步/反应式 API。
安全与隐私： 处理敏感数据时，确保遵循数据隐私法规，并考虑模型的输入/输出安全过滤。不要将敏感信息直接暴露给不信任的模型或通过 Prompt 注入。
可观察性： 集成 Tracing（如使用 OpenTelemetry）可以帮助您跟踪 LLM 调用、工具使用和 RAG 检索的整个流程，便于调试和性能分析。
评估： 如何衡量 LLM 应用的输出质量？对于 RAG 应用，可以评估检索的相关性和生成答案的准确性、流畅度。对于代理，可以评估其完成任务的成功率。建立有效的评估流程对于迭代优化至关重要。
自定义组件： LangChain4j 设计灵活，允许您实现自定义的 Tool, DocumentLoader, EmbeddingStore 等，以满足特定需求。

总结

LangChain4j 是一个强大、灵活且符合 Java 生态习惯的大模型应用开发框架。它将 LLM 应用开发中的核心复杂性（如状态管理、数据连接、工具使用和流程编排）进行了有效的抽象和封装。

通过提供统一的模型接口、强大的 PromptTemplate、灵活的 Chain 组合、智能的 Agent/Tool 机制、以及开箱即用的 RAG 支持和 Memory 管理，LangChain4j 极大地降低了 Java 开发者构建复杂 LLM 应用的门槛。其丰富的生态集成能力使得连接各种 LLM 服务、向量数据库和外部工具变得轻而易举。

无论您是想构建一个智能客服、一个企业内部知识问答系统、还是一个能够自动化任务的智能代理，LangChain4j 都能为您提供坚实的基础和丰富的工具。如果您是一名 Java 开发者，并希望拥抱大模型技术，LangChain4j 无疑是一个值得深入学习和使用的重要框架。

现在，就动手尝试使用 LangChain4j，开启您的 Java LLM 应用开发之旅吧！