如何使用 Elasticsearch 进行向量搜索 – wiki基地

跃迁至语义搜索：深入探索如何使用 Elasticsearch 进行向量搜索

在当今信息爆炸的时代，传统基于关键词的搜索方式已逐渐显露其局限性。用户不再满足于字面匹配，他们渴望理解查询背后的真正意图，希望搜索系统能够理解语境、概念和语义相似性。这时，向量搜索（Vector Search）应运而生，它通过将数据转化为高维向量，并在向量空间中度量相似性，实现了对语义内容的深度理解。

作为强大的全文搜索和分析引擎，Elasticsearch 并没有停留在关键词匹配的世界。从 7.x 版本开始引入对 dense_vector 字段的支持，到 8.x 版本全面集成 HNSW（Hierarchical Navigable Small World）算法，Elasticsearch 已经成为了一个强大的向量搜索平台，能够将传统搜索与向量搜索完美结合，构建出更智能、更符合用户需求的搜索体验。

本文将深入探讨如何使用 Elasticsearch 进行向量搜索，从基础概念、数据准备，到索引配置、搜索执行，再到性能优化和实际应用，为您提供一份全面的指南。

第一部分：向量搜索的核心概念与 Elasticsearch 的角色

在开始技术实现之前，理解向量搜索的核心概念至关重要。

1. 什么是向量搜索？

向量搜索是一种基于高维向量相似度的搜索方式。其基本原理是将文本、图像、音频、用户行为等各种类型的数据，通过机器学习模型（通常是深度学习模型）转化为固定长度的数值数组，即向量（Vector）或嵌入（Embedding）。这些向量捕捉了原始数据在特定语义空间中的特征和含义。

例如，对于文本数据，“苹果公司”和“微软”可能在向量空间中距离较远，而“苹果公司”和“谷歌”则可能距离较近，因为它们都属于科技巨头；“苹果公司”和“红富士苹果”则会在不同的语义维度上体现相似性（一家是公司，一种是水果）。

搜索时，我们将用户查询（或待匹配的数据）也转化为一个向量，然后在向量空间中找到与查询向量“最相似”（即距离最近或角度最接近）的数据向量。这些相似的数据点就是搜索结果。

2. 为什么选择 Elasticsearch 进行向量搜索？

虽然市面上存在一些专门的向量数据库，但将向量搜索集成到 Elasticsearch 中具有显著的优势：

统一平台： 您可以将文本、数值、日期等结构化和非结构化数据与向量数据存储在一起，在一个平台上执行关键词搜索、过滤、聚合以及向量搜索。无需维护独立的向量数据库和传统数据库，简化了架构。
混合搜索能力： 这是 Elasticsearch 的一大亮点。您可以轻松地将基于关键词的传统搜索（如BM25评分）与基于向量的语义搜索结合起来，实现更强大、更灵活的混合搜索（Hybrid Search）。例如，先按关键词过滤出相关文档，再在这些文档中进行向量相似度排序；或者将关键词得分和向量相似度得分融合计算最终排名。
成熟的生态系统： Elasticsearch 拥有强大的可伸缩性、高可用性、分布式能力、丰富的 API 和广泛的社区支持。利用这些成熟的特性，您可以轻松地将向量搜索能力融入到现有的数据处理和搜索管线中。
易于上手： 对于已经熟悉 Elasticsearch 的用户来说，学习和使用其向量搜索功能比学习一个全新的数据库系统要容易得多。

3. 关键概念：向量、嵌入、相似度度量与 ANN

向量 (Vector) / 嵌入 (Embedding): 数据在高维空间中的数值表示。由机器学习模型生成。例如，一个文本的嵌入可能是一个包含数百或数千个浮点数的数组。
维度 (Dimension): 向量中数值的个数。维度越多，通常能捕捉更丰富的特征，但计算和存储开销也越大。
相似度度量 (Similarity Metric): 用于计算两个向量之间相似程度的方法。常见的包括：
- 余弦相似度 (Cosine Similarity): 计算两个向量夹角的余弦值。值越大（接近1），表示方向越相似。常用于文本相似度，因为它不关心向量的长度（即文本长度或重复词次），只关心语义方向。
- 点积相似度 (Dot Product Similarity): 计算两个向量对应元素的乘积之和。值越大，表示越相似。如果向量是L2范数归一化的（即长度为1），点积相似度等于余弦相似度。对于未归一化的向量，点积同时考虑方向和幅度。
- L2 距离 (Euclidean Distance): 计算两个向量在欧几里得空间中的直线距离。距离越小，表示越相似。常用于图像、推荐系统等。
最近邻搜索 (Nearest Neighbor Search – NNS): 在向量集合中找到距离给定查询向量最近（最相似）的 k 个向量。
近似最近邻搜索 (Approximate Nearest Neighbor Search – ANN): 对于大规模数据集，精确的 NNS 计算量巨大。ANN 算法通过牺牲少量精度换取计算效率的大幅提升。它不能保证找到绝对最近的 k 个向量，但能找到很接近的向量。Elasticsearch 使用 HNSW 算法来实现 ANN。

第二部分：准备数据与选择嵌入模型

在 Elasticsearch 中存储和搜索向量之前，您需要先生成这些向量。这一步通常在 Elasticsearch 外部完成。

1. 数据准备

确保您的原始数据（文本、图像文件路径等）是可访问和可处理的。

2. 选择和使用嵌入模型

这是最关键的一步。选择合适的嵌入模型取决于您的数据类型和应用场景。

文本嵌入： 用于将文本（句子、段落、文档）转化为向量。常见的模型包括：
- Sentence-BERT (SBERT) 及其变体（如 all-MiniLM-L6-v2, paraphrase-multilingual-mpnet-base-v2 等）
- OpenAI 的 embedding models (text-embedding-ada-002 等)
- Google 的 Universal Sentence Encoder (USE)
- 各类 Transformer 模型（BERT, RoBERTa 等）的输出层也可以用作嵌入，但 SBERT 等模型通常更适合句子/段落相似度任务。
图像嵌入： 用于将图像转化为向量。常见的模型包括：
- CLIP (Contrastive Language–Image Pre-training) – 可以同时生成图像和文本嵌入，常用于图文跨模态搜索。
- ResNet、Vision Transformer (ViT) 等模型的特征提取层。
跨模态嵌入： 例如 CLIP，能够将不同类型的数据（如图像和文本）映射到同一个向量空间，从而实现跨模态搜索（用文本搜索图像，或用图像搜索文本）。

如何生成嵌入：

您可以使用各种机器学习框架和库来加载预训练模型并生成嵌入：

Python 的 transformers 库（Hugging Face）提供了大量预训练的文本模型。
TensorFlow, PyTorch, Keras 等深度学习框架。
OpenAI API 或 Google Cloud AI 等云服务。

通常，您会编写一个数据处理脚本或构建一个服务，读取原始数据，调用选定的嵌入模型生成向量，然后将原始数据（或其关键信息）以及生成的向量一起发送到 Elasticsearch 进行索引。

重要考虑：

维度： 选择模型时考虑其输出向量的维度。Elasticsearch 对 dense_vector 的维度有限制（默认为 2048 或 1024，取决于版本和配置，但可以调整）。高维度通常更具表现力，但会增加存储和计算成本。
模型大小与速度： 较大的模型通常生成质量更高的嵌入，但也需要更多计算资源和时间来生成。
预训练任务与微调： 选择与您的任务领域相似的模型。在可能的情况下，对模型进行微调可以显著提高嵌入质量。
归一化： 根据您计划使用的相似度度量，考虑是否对向量进行 L2 范数归一化（将向量长度缩放到 1）。L2 归一化后，点积相似度等同于余弦相似度，且计算 L2 距离时更直观。许多嵌入模型默认输出归一化向量。

第三部分：在 Elasticsearch 中索引向量

生成向量后，下一步是将它们存储在 Elasticsearch 中。这需要定义正确的索引映射并摄取数据。

1. 定义索引映射

核心在于使用 dense_vector 字段类型来存储向量。您还需要配置 HNSW 参数以启用高效的 ANN 搜索。

json PUT /my_vector_index { "settings": { "index": { "number_of_shards": 1, // 根据实际需求调整分片数 "number_of_replicas": 1 // 根据实际需求调整副本数 } }, "mappings": { "properties": { "title": { // 示例：存储原始文本 "type": "text" }, "title_vector": { // 用于存储标题的向量 "type": "dense_vector", "dims": 768, // 必须指定向量维度，例如使用某个 Sentence-BERT 模型输出768维向量 "index": true, // 必须启用索引 "index_options": { "type": "hnsw", // 指定使用 HNSW 算法 "m": 16, // HNSW 参数: 每个节点连接的邻居数量 "ef_construction": 100 // HNSW 参数: 构建索引时考虑的候选邻居数量 }, "similarity": "cosine" // 指定默认的相似度度量，可以是 cosine, l2_norm, dot_product }, "content": { // 示例：存储原始文本内容 "type": "text" }, "content_vector": { // 用于存储内容的向量 "type": "dense_vector", "dims": 768, // 维度必须与生成向量的模型匹配 "index": true, "index_options": { "type": "hnsw", "m": 16, "ef_construction": 100 }, "similarity": "cosine" } // 可以添加其他字段，如分类、作者、发布日期等 } } }

映射的关键点：

type: "dense_vector": 指定字段类型为密集向量。
dims: <number>: 强制要求 指定向量的维度。这个值必须与您使用的嵌入模型生成的向量维度完全一致。
index: true: 必须设置为 true 才能在该字段上执行向量搜索。
index_options: 配置 HNSW 索引的参数。
- type: "hnsw": 指定使用 HNSW 算法构建索引。
- m: <number>: HNSW 参数。控制每个节点在构建图时连接的“邻居”数量。值越大，HNSW 图的连接性越强。这通常能带来更好的召回率（找到更多真正的近邻），但会增加索引构建时间、索引大小以及搜索时的内存消耗和延迟。推荐值通常在 16 到 64 之间。
- ef_construction: <number>: HNSW 参数。控制构建索引时，算法在寻找新节点近邻时考虑的候选节点数量。值越大，索引构建得越“精确”。这通常能带来更好的召回率，但会显著增加索引构建时间和 CPU 消耗。推荐值通常在 m 的几倍到几十倍之间，例如 m * 4 到 m * 10。
similarity: <metric>: 指定该字段默认使用的相似度度量。可以是 "cosine"、"l2_norm" 或 "dot_product"。这只是一个默认值，搜索时可以在查询中覆盖。请根据您使用的嵌入模型和应用场景选择合适的度量。

HNSW 参数选择的考量：

m 和 ef_construction 是影响 HNSW 索引构建和搜索性能的关键参数。它们之间存在一个重要的权衡：

召回率 (Recall): 找到真正最近邻的比例。
性能 (Performance): 索引构建时间和搜索延迟。
资源消耗 (Resource Usage): 索引大小和内存消耗。

通常，增加 m 和 ef_construction 可以提高召回率，但会牺牲性能和增加资源消耗。您需要在实际数据集上进行实验，找到最适合您的应用场景的平衡点。

2. 摄取数据

将原始数据以及生成的向量一起索引到 Elasticsearch。

“`json
POST /my_vector_index/_doc/1
{
“title”: “Elasticsearch: The Definitive Guide”,
“title_vector”: [0.1, 0.2, …, 768个浮点数], // 替换为实际生成的向量
“content”: “A comprehensive guide to Elasticsearch…”,
“content_vector”: [0.3, -0.1, …, 768个浮点数] // 替换为实际生成的向量
// … 其他字段
}

POST /my_vector_index/_doc/2
{
“title”: “Lucene in Action”,
“title_vector”: [0.15, 0.25, …, 768个浮点数], // 替换为实际生成的向量
“content”: “Learn how Lucene powers search applications…”,
“content_vector”: [0.35, -0.05, …, 768个浮点数] // 替换为实际生成的向量
// … 其他字段
}

// 您可以使用 Bulk API 进行批量索引以提高效率
“`

在实际应用中，您通常会构建一个 ETL（Extract, Transform, Load）管线。Extract 阶段获取原始数据，Transform 阶段使用嵌入模型生成向量，Load 阶段将数据和向量批量索引到 Elasticsearch。

第四部分：执行向量搜索

数据索引完成后，您就可以使用 Elasticsearch 的 knn 查询进行向量搜索了。

1. 基本 `knn` 查询

json GET /my_vector_index/_search { "knn": { "field": "title_vector", // 在哪个向量字段上进行搜索 "query_vector": [0.11, 0.21, ..., 768个浮点数], // 您的查询向量 "k": 10, // 返回最相似的 k 个结果 "num_candidates": 100 // HNSW 搜索参数: 在内部考察的候选节点数量 }, "_source": ["title", "content"] // 返回原始字段，不返回巨大的向量字段 }

knn 查询的关键参数：

field: "<vector_field>": 指定要在哪个 dense_vector 字段上执行相似度搜索。这个字段必须已启用 HNSW 索引 ("index": true, "index_options": { "type": "hnsw", ... })。
query_vector: [<float_array>]: 您的查询向量。这个向量的维度必须与 field 指定的字段的维度 (dims) 一致。在实际应用中，您需要使用与索引时相同的嵌入模型，将用户查询（如文本、图片）转换为向量。
k: <number>: 您希望从 最终过滤和排序的结果中 返回的最相关的文档数量。这是用户最终看到的搜索结果数量。
num_candidates: <number>: HNSW 搜索参数。这是 HNSW 算法在内部搜索过程中考察的候选近邻数量。算法会在这 num_candidates 个候选结果中选择距离最近的 k 个返回。num_candidates 必须大于或等于 k。

k 与 num_candidates 的关系和调优：

num_candidates 直接影响召回率和搜索延迟。增加 num_candidates 会提高找到真正近邻的概率（提高召回率），因为算法考察了更多可能性。但同时，这也会增加搜索的计算量，导致搜索延迟增加。
k 是您最终想要的结果数量。如果您想要 10 个结果 (k: 10)，但 num_candidates 只设置了 10，那么算法可能只能在非常有限的范围内搜索，召回率可能很低。
调优建议： 通常从一个相对较小的 num_candidates 开始（例如 k * 10 或 k * 20），然后在您的数据集上测试搜索的召回率（例如，通过判断已知相关的文档是否出现在搜索结果中）。如果召回率不满意，逐步增加 num_candidates，同时监控搜索延迟，直到找到满意的平衡点。num_candidates 的合理值通常在几十到几百之间，取决于数据集大小和对召回率的要求。

2. 带过滤的 `knn` 查询

在实际应用中，您经常需要在执行向量搜索之前或之后应用过滤条件。例如，只在某个分类或某个日期范围内进行向量搜索。这可以通过将 knn 查询与标准的 Lucene 查询（如 term, range, bool 等）结合实现。

json GET /my_vector_index/_search { "query": { "bool": { "filter": [ // 在向量搜索之前先过滤文档 { "term": { "category": "technology" } }, { "range": { "publish_date": { "gte": "2023-01-01" } } } ] } }, "knn": { "field": "content_vector", "query_vector": [0.5, -0.2, ..., 768个浮点数], // 查询向量 "k": 5, "num_candidates": 50 }, "_source": ["title", "category"] }

在这个例子中，Elasticsearch 会首先执行 bool 查询中的 filter 子句，快速地缩小搜索范围，只选择 category 为 “technology” 且 publish_date 在 2023 年 1 月 1 日之后的文档。然后，它只在这些过滤后的文档上执行 knn 向量搜索。这种方式非常高效，尤其是在大规模数据集上，因为 ANN 搜索只在相关子集上进行。

3. 指定相似度度量

您可以在 knn 查询中明确指定要使用的相似度度量，覆盖映射中定义的默认值。

json GET /my_vector_index/_search { "knn": { "field": "title_vector", "query_vector": [0.11, 0.21, ..., 768个浮点数], "k": 10, "num_candidates": 100, "similarity": "l2_norm" // 强制使用 L2 距离进行相似度计算 }, "_source": ["title"] }

选择正确的相似度度量与您的嵌入模型的训练方式紧密相关。例如，如果您的模型生成的是 L2 归一化的向量，那么使用 cosine 或 dot_product 都可以；如果模型输出的向量长度也带有语义信息（如TF-IDF向量），可能需要考虑 dot_product；对于某些图像或几何特征，l2_norm 可能更合适。请参考您使用的嵌入模型的文档或实验结果来确定最佳度量。

4. 混合搜索 (Hybrid Search)

将关键词搜索和向量搜索结合是 Elasticsearch 的强大之处。Elasticsearch 提供了多种实现混合搜索的方式，其中最推荐的是使用 knn 和标准查询，并通过 Reciprocal Rank Fusion (RRF) 算法融合结果。

RRF 是一种无参数的方法，用于合并来自不同搜索结果集的排名。它基于每个文档在每个结果集中的排名计算一个融合分数。

json GET /my_vector_index/_search { "query": { // 标准关键词查询 (例如，使用 BM25) "match": { "title": "search guide" } }, "knn": { // 向量搜索 "field": "title_vector", "query_vector": [0.11, 0.21, ..., 768个浮点数], // "search guide" 的向量 "k": 10, // 注意这里的 k 和 num_candidates 通常会设置得比最终结果数多，以便 RRF 有足够的候选集 "num_candidates": 100 }, "rank": { // 使用 RRF 融合排名 "rrf": { "window_size": 50, // 考虑前 50 个文档进行 RRF 计算 "rank_constant": 60 // RRF 公式中的常数 k' (不是结果数 k) } }, "_source": ["title"] }

在这个例子中：

Elasticsearch 会分别执行 query（关键词搜索）和 knn（向量搜索）。
每个搜索会返回各自排名靠前的文档列表（数量由各自查询的隐含或显式设置决定，但 window_size 限制了 RRF 实际考虑的范围）。
rank.rrf 部分指示 Elasticsearch 使用 RRF 算法融合这两个结果集。
- window_size: 指定在每个结果集中考虑的前多少个文档进行 RRF 计算。将这个值设置为大于或等于您最终希望返回的结果数量。
- rank_constant: RRF 公式中的一个平滑常数。增加这个值可以减少高排名文档的优势，使得低排名但同时出现在多个结果集中的文档有更好的机会进入最终结果。

最终的搜索结果会根据 RRF 分数进行排序。这种方式结合了关键词搜索的精确匹配能力和向量搜索的语义理解能力，通常能带来更全面和相关的搜索结果。

第五部分：性能优化与考量

大规模数据集上的向量搜索对性能要求很高。以下是一些优化 Elasticsearch 向量搜索性能的关键点：

1. HNSW 参数调优 (`m`, `ef_construction`, `num_candidates`)

如前所述，这三个参数是性能与召回率之间的核心权衡点。在生产环境中，务必在代表性的数据集和查询负载下进行实验，找到最佳参数组合。

m 和 ef_construction (索引时):
- 更大的值 -> 更高的索引构建时间/CPU 消耗 -> 更高的召回率 -> 更大的索引文件大小 -> 搜索时可能更高的内存需求。
- 更小的值 -> 更快的索引构建 -> 更低的召回率 -> 更小的索引文件 -> 搜索时可能更低的内存需求。
num_candidates (搜索时):
- 更大的值 -> 更高的搜索延迟/CPU 消耗 -> 更高的召回率。
- 更小的值 -> 更低的搜索延迟 -> 更低的召回率。

目标是找到满足您应用召回率要求的最小 num_candidates 值。

2. 硬件资源

向量搜索是计算密集型和内存密集型的操作。

CPU: HNSW 构建和搜索大量依赖 CPU 计算。强大的 CPU 有助于提高性能。
内存 (RAM): HNSW 索引的一部分或全部可能需要加载到内存中以实现快速搜索。确保您的 Elasticsearch 节点有足够的内存来容纳 HNSW 索引。HNSW 索引的大小大致与向量维度、向量数量以及 m 参数成正比。您可以使用 Elasticsearch 的 Cat API 或索引统计信息来监控内存使用情况。
存储 (SSD): 虽然 HNSW 索引可能部分在内存中，但底层数据存储在磁盘上。快速的 SSD 有助于提高整体读写性能。

3. 向量维度

向量维度越高，通常能捕捉更多信息，但也意味着：

更大的存储空间需求。
更高的计算开销（计算距离需要更多浮点运算）。
索引构建和搜索可能更慢。

在选择嵌入模型时，权衡模型的表达能力和计算/存储成本。

4. 索引刷新间隔

HNSW 索引在 Lucene 段合并时进行构建。频繁的索引刷新（默认 1 秒）会创建许多小段，可能导致 HNSW 索引频繁地被重建和合并，影响写入吞吐量和合并开销。对于写入密集型场景，可以适当调大 index.refresh_interval。

5. 分片策略

标准的 Elasticsearch 分片和副本策略同样适用于包含向量字段的索引。合理设置分片数可以利用集群的并行处理能力，提高索引和搜索的吞吐量。向量字段会显著增加单个文档的大小，因此每个分片可能存储更少的文档，需要相应调整分片数量。

6. 选择合适的相似度度量

确保您在映射和查询中使用的 similarity 度量与您使用的嵌入模型以及向量是否归一化相匹配。不匹配的度量会导致搜索结果不准确。

7. 避免返回巨大的向量字段

在搜索请求中，使用 _source 参数明确指定只需要返回原始字段（如 title, content），而不要返回巨大的 dense_vector 字段。这样可以显著减少网络传输和客户端处理的开销。

第六部分：实际应用场景

向量搜索在各种应用中展现出巨大潜力：

语义搜索 (Semantic Search): 用户输入自然语言查询，系统理解查询的意图，返回与查询含义相关的内容，即使关键词不完全匹配。例如，搜索“户外运动装备”可以找到关于登山、露营、跑步等相关的产品或文章。
推荐系统 (Recommendation Systems):
- 内容推荐： 根据用户已查看或喜欢的商品的向量，找到与其向量相似的其他商品。
- 用户推荐： 将用户的行为（如购买历史、浏览偏好）转化为向量，找到与当前用户向量相似的其他用户，推荐这些用户喜欢的商品。
图像搜索 (Image Search): 将图片转化为向量，通过图片搜索相似图片，或使用文本查询搜索相关图片（如果使用跨模态模型如 CLIP）。
问答系统 (Question Answering): 将问题和文档段落都转化为向量，通过计算问题向量与文档段落向量的相似度，找到最有可能包含答案的段落。
重复内容检测 (Duplicate Content Detection): 计算文档或图片的向量相似度，识别高度相似的内容。
异常检测 (Anomaly Detection): 在向量空间中，异常点通常是远离大多数其他点的离群点。向量搜索可以帮助识别这些异常。
自然语言处理 (NLP) 应用： 文本聚类、文本分类（通过计算文本向量与类别向量的相似度）等。

第七部分：管理向量数据

更新向量： 如果原始数据发生变化（例如，文本内容更新），您需要重新生成该数据的向量，并使用相同的文档 ID 更新 Elasticsearch 中的文档。更新包含向量字段的文档本质上是重新索引整个文档。
删除向量： 删除包含向量字段的文档与删除普通文档一样。Elasticsearch 会将文档标记为删除并在后续段合并时物理移除。

第八部分：局限性与替代方案

尽管 Elasticsearch 提供了强大的向量搜索能力，但也存在一些局限性：

纯向量数据库的对比： 专门的向量数据库（如 Milvus, Pinecone, Weaviate 等）通常为向量搜索做了更多底层优化，可能在纯向量搜索的性能、可伸缩性和某些高级功能（如图搜索、更多 ANN 算法选择）上表现更优。
内存消耗： HNSW 索引可能需要大量内存，这可能成为扩展时的瓶颈。
构建时间： 大规模数据集上的 HNSW 索引构建可能非常耗时且资源密集。
算法选择： Elasticsearch 主要支持 HNSW。虽然 HNSW 是一个非常优秀的 ANN 算法，但其他算法（如 IVF – Inverted File Index）在某些场景下可能表现更好。

在决定是否使用 Elasticsearch 进行向量搜索时，需要权衡其作为统一平台的便利性、混合搜索能力与纯向量数据库在特定场景下的极致性能和功能。对于大多数需要结合关键词和语义搜索的应用来说，Elasticsearch 是一个非常强大且方便的选择。对于只有纯粹向量搜索需求且数据规模极其庞大、对延迟有极致要求、或者需要特定 ANN 算法的场景，可能需要考虑专门的向量数据库。

结论

Elasticsearch 集成向量搜索能力是其发展历程中的一个重要里程碑，极大地扩展了其应用范围。通过理解向量、嵌入、相似度度量和 HNSW 等核心概念，正确配置 dense_vector 字段映射和 HNSW 参数，结合 knn 查询与标准 Lucene 查询进行过滤和混合搜索，您可以构建出能够理解用户意图、提供更精准和丰富结果的智能搜索应用。

从语义搜索到推荐系统，从图像检索到异常检测，Elasticsearch 的向量搜索功能为处理和搜索高维数据提供了强大的工具。虽然存在一些性能和资源上的考量，但其作为统一搜索平台的优势，特别是强大的混合搜索能力，使其成为许多企业实现下一代搜索和数据智能的优选方案。随着 Elasticsearch 在向量搜索领域的不断演进，我们可以期待更多激动人心的功能和优化出现。现在，是时候将您的搜索从关键词匹配提升到语义理解的新层次了！