Milvus 向量数据库详解与实践指南

一、Milvus 核心介绍

1. 什么是 Milvus?

        Milvus 是一款开源、高性能、可扩展的向量数据库,专门为海量向量数据的存储、索引和检索而设计。它支持近似最近邻搜索(ANN),适用于图像检索、自然语言处理(NLP)、推荐系统、语义搜索、智能问答、多模态数据处理等 AI 应用场景。它能够高效处理:

  • 嵌入向量(Embeddings)

  • 特征向量(Feature Vectors)

  • 任何高维数值向量

2. 核心特性

特性说明
多索引支持IVF_FLAT、IVF_PQ、HNSW、Annoy 等
分布式架构支持水平扩展,处理十亿级向量
多语言 SDKPython、Java、Go、RESTful API
云原生设计Kubernetes 友好,支持多云部署
混合查询支持向量+标量数据的联合查询

3. 典型应用场景

  • 图像/视频检索

  • 语义文本搜索

  • 推荐系统

  • 异常检测

  • 分子结构搜索

二、详细使用案例:构建电商图像搜索系统

案例背景

为电商平台搭建一个以图搜图系统,用户上传商品图片可找到相似商品。

实施步骤

1. 环境准备
# 安装依赖
pip install pymilvus torch torchvision pillow
2. 特征提取模型
import torch
import torchvision.models as models
from torchvision import transforms# 使用ResNet50提取特征
model = models.resnet50(pretrained=True)
model.eval()# 图像预处理
preprocess = transforms.Compose([transforms.Resize(256),transforms.CenterCrop(224),transforms.ToTensor(),transforms.Normalize(mean=[0.485, 0.456, 0.406],std=[0.229, 0.224, 0.225])
])def extract_features(img_path):img = Image.open(img_path)img_t = preprocess(img)batch_t = torch.unsqueeze(img_t, 0)with torch.no_grad():features = model(batch_t)return features.numpy().flatten()
3. Milvus 集合(Collection)创建
from pymilvus import (connections,FieldSchema, CollectionSchema, DataType,Collection, utility
)# 连接Milvus
connections.connect("default", host="localhost", port="19530")# 定义Schema
fields = [FieldSchema(name="id", dtype=DataType.INT64, is_primary=True),FieldSchema(name="product_id", dtype=DataType.VARCHAR, max_length=64),FieldSchema(name="image_vector", dtype=DataType.FLOAT_VECTOR, dim=2048),  # ResNet50输出维度FieldSchema(name="category", dtype=DataType.VARCHAR, max_length=128)
]schema = CollectionSchema(fields, description="Product image search collection")
collection = Collection("product_images", schema)# 创建索引
index_params = {"index_type": "IVF_FLAT","metric_type": "L2","params": {"nlist": 128}
}
collection.create_index("image_vector", index_params)
4. 数据插入
# 假设已有商品图片数据
product_data = [{"product_id": "1001", "image_path": "path/to/image1.jpg", "category": "electronics"},# 更多商品数据...
]data = [[],  # id列表[],  # product_id列表[],  # 特征向量列表[]   # category列表
]for idx, product in enumerate(product_data):features = extract_features(product["image_path"])data[0].append(idx)data[1].append(product["product_id"])data[2].append(features)data[3].append(product["category"])# 批量插入
collection.insert(data)
5. 相似搜索
# 用户上传图片搜索
search_img_path = "user_upload.jpg"
search_vector = extract_features(search_img_path)search_params = {"metric_type": "L2","params": {"nprobe": 16}
}results = collection.search(data=[search_vector],anns_field="image_vector",param=search_params,limit=5,output_fields=["product_id", "category"]
)for hits in results:for hit in hits:print(f"产品ID: {hit.entity.get('product_id')}, 距离: {hit.distance}, 类别: {hit.entity.get('category')}")

三、关键注意事项

1. 生产环境部署建议

  • 集群部署:单机版仅适合开发测试,生产环境使用分布式集群

  • 资源规划

    • 向量维度越高,所需资源越多

    • 10亿条128维向量 ≈ 500GB内存 + 1TB SSD

  • 高可用配置

    # docker-compose.yml示例配置
    etcd:deploy:replicas: 3
    minio:deploy:replicas: 4

    2. 性能优化技巧

  • 索引选择

    场景推荐索引特点
    高精度IVF_FLAT召回率高,内存占用大
    内存敏感IVF_PQ有损压缩,节省内存
    超大规模DISKANN支持SSD存储
  • 查询参数调优

    # 平衡精度与性能的关键参数
    search_params = {"nprobe": 32,  # 增大值提高精度但降低性能"ef": 64       # HNSW专用参数
    }

    3. 常见问题处理

  • 内存不足
    # 调整Milvus配置
    docker-compose.yml中增加:
    milvus-standalone:environment:- QUERY_NODE_GC_INTERVAL=300- QUERY_NODE_GC_THRESHOLD=0.0001
  • 数据一致性
    # 插入后立即查询可能看不到数据
    collection.flush()  # 手动刷新
  • 版本升级:

    1. 备份元数据(etcd)和对象存储(MinIO)

    2. 使用官方迁移工具 

4. 安全建议

  • 启用身份验证:
    # 启动时配置
    docker-compose.yml:
    environment:- MILVUS_AUTHORIZATION_ENABLED=true- MILVUS_ROOT_PASSWORD=YourSecurePassword
  • 网络隔离:
    # 只允许内网访问
    networks:milvus_net:internal: true

四、扩展应用场景

1. 跨模态搜索

# 同时处理文本和图像
multi_modal_collection = CollectionSchema([FieldSchema(name="text_vector", dtype=DataType.FLOAT_VECTOR, dim=768),FieldSchema(name="image_vector", dtype=DataType.FLOAT_VECTOR, dim=2048)
])# 混合查询
expr = "category == 'electronics'"
collection.search(data=[query_vector],anns_field="image_vector",expr=expr,  # 结合标量过滤limit=10
)

2.实时推荐系统 

# 用户行为向量更新
def update_user_vector(user_id, new_behavior_vec):# 获取现有向量current_vec = get_user_vector(user_id)# 加权平均更新updated_vec = 0.9 * current_vec + 0.1 * new_behavior_vec# 更新Milvuscollection.delete(f"id == {user_id}")collection.insert([[user_id], [updated_vec]])

五、监控与维护

1. 关键监控指标

指标健康值检查命令
QPS< 1000/节点show metrics
内存使用< 80%docker stats
查询延迟< 50mstime search...

2. 备份策略

# 定期备份
docker exec milvus-minio mc alias set myminio http://minio:9000 minioadmin minioadmin
docker exec milvus-minio mc cp --recursive myminio/milvus /backup/

         通过以上完整案例和注意事项,您可以构建一个高效的向量检索系统。Milvus 2.x 版本相比1.x有显著架构改进,建议新项目直接使用2.x版本。了解更多可以参阅milvus官方文档。安装教程可以参阅下面文章👇:mac 使用 Docker 安装向量数据库Milvus独立版的保姆级别教程-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/79788.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

算力经济模型研究:从云计算定价到去中心化算力市场设计

引言&#xff1a;算力商品化的双重革命 在H800 GPU集群的算力供给能力突破2.3 EFLOPS的今天&#xff0c;算力定价机制正经历从"资源租赁"到"动态市场"的范式转变。传统云计算定价模型&#xff08;如AWS按需实例&#xff09;的静态价格机制已难以适应大模型…

[D1,2] 贪心刷题

文章目录 摆动序列最大子数组合买卖股票跳跃游戏跳跃2 摆动序列 不像是贪心&#xff0c;只要抓住摆动这个点&#xff0c;前一个上升&#xff0c;那下一个就要下降&#xff0c;记录上一次的状态为1的话&#xff0c;那下一次就要更新为-1&#xff0c;如果上一次为1&#xff0c;这…

Spring Boot操作MongoDB的完整示例大全

以下是基于Spring Boot操作MongoDB的完整示例大全&#xff0c;涵盖增删改查、聚合查询、索引、事务等核心功能&#xff1a; 一、基础CRUD操作 1. 环境配置 依赖配置&#xff08;pom.xml&#xff09; <dependency><groupId>org.springframework.boot</groupId…

【实战教程】零基础搭建DeepSeek大模型聊天系统 - Spring Boot+React完整开发指南

&#x1f525; 本文详细讲解如何从零搭建一个完整的DeepSeek AI对话系统&#xff0c;包括Spring Boot后端和React前端&#xff0c;适合AI开发入门者快速上手。即使你是编程萌新&#xff0c;也能轻松搭建自己的AI助手&#xff01; &#x1f4da;博主匠心之作&#xff0c;强推专栏…

Linux系统基本指令和知识指南

一、Linux系统简介 Linux是一种自由和开放源代码的类UNIX操作系统&#xff0c;由林纳斯托瓦兹在1991年首次发布。它以稳定性、安全性和灵活性著称&#xff0c;广泛应用于服务器、嵌入式系统和个人计算机。 Linux主要特点&#xff1a; 开源免费 多用户、多任务 良好的安全性…

【计算机视觉】OpenCV实战项目:Long-Exposure:基于深度学习的长时间曝光合成技术

Long-Exposure&#xff1a;基于深度学习的长时间曝光合成技术 项目概述与技术背景项目核心功能技术原理 环境配置与安装硬件要求建议详细安装步骤可选组件安装 实战应用指南1. 基础使用&#xff1a;视频转长曝光2. 高级模式&#xff1a;自定义光轨合成3. 批量处理模式 技术实现…

TikTok 矩阵账号运营实操细节:打造爆款矩阵

在 TikTok 的流量版图里&#xff0c;打造 TikTok 矩阵账号能显著提升影响力与吸粉能力。而借助 AI 工具&#xff0c;更可为 TikTok 矩阵运营效率的提升赋能&#xff0c;让运营如虎添翼。下面就为大家详细讲讲其中的实操细节&#xff0c;并结合一些伪代码示例辅助理解。 一、矩…

互联网大厂Java求职面试:分布式系统中向量数据库与AI应用的融合探索

互联网大厂Java求职面试&#xff1a;分布式系统中向量数据库与AI应用的融合探索 面试开场&#xff1a;技术总监与郑薪苦的“较量” 技术总监&#xff08;以下简称T&#xff09;&#xff1a;郑薪苦先生&#xff0c;请简单介绍一下你在分布式系统设计方面的经验。 郑薪苦&…

【每日八股】学习 RocketMQ Day2:进阶(一)

文章目录 复习昨日内容为什么要使用消息队列为什么选择 RocketMQRocketMQ 的优缺点&#xff1f;谈谈你对 RocketMQ 的理解&#xff1f;消息队列有哪些类型&#xff1f;RocketMQ 采用哪种消息队列模型&#xff1f;消息的消费模式了解吗&#xff1f;了解 RocketMQ 的基本架构吗&a…

探索智能体开发新边界:Cangjie Magic开源平台体验与解析

文章目录 每日一句正能量前言一、Cangjie Magic的核心技术&#xff08;一&#xff09;Agent DSL架构&#xff08;二&#xff09;原生支持MCP通信协议&#xff08;三&#xff09;智能规划功能 二、实际应用场景&#xff08;一&#xff09;智能客服系统&#xff08;二&#xff09…

深入解析进程间通信与Socket原理:从理论到TypeScript实战

文章目录 一、进程中如何通信1.1 管道1.1.1 核心特性1.1.2 缺点1.1.3 匿名管道与命名管道的对比 1.2 信号1.2.1 核心特性1.2.2 缺点1.2.3 信号分类对比 1.3 消息队列1.3.1 核心特性1.3.2 缺点 1.4 共享内存1.4.1 核心特性1.4.2 缺点 1.5 信号量1.5.1 核心特性1.5.2 缺点 二、So…

力扣-hot100(旋转图像)

48. 旋转图像 中等 给定一个 n n 的二维矩阵 matrix 表示一个图像。请你将图像顺时针旋转 90 度。 你必须在 原地 旋转图像&#xff0c;这意味着你需要直接修改输入的二维矩阵。请不要 使用另一个矩阵来旋转图像。 示例 1&#xff1a; 输入&#xff1a;matrix [[1,2,3],[4…

Docker编排工具---Compose的概述及使用

目录 一、Compose工具的概述 二、Compose的常用命令 1、列出容器 2、查看访问日志 3、输出绑定的公共端口 4、重新构建服务 5、启动服务 6、停止服务 7、删除已停止服务的容器 8、创建和启动容器 9、在运行的容器中执行命令 10、指定一个服务启动容器的个数 11、其…

C25-数组应用及练习

第一题 题目: 代码 #include <stdio.h> int main() {//数组及相关数据定义int arr[10];int i;//基于循环的数组数据输入for(i0;i<10;i){arr[i]i;}//基于循环的数组数据输出for(i9;i>0;i--){printf("%d ",arr[i]);}return 0; }结果 第二题 题目 代码 …

网络安全怎么入门?快速了解

网络安全是一个快速发展的领域&#xff0c;入门需要系统化的学习和实践。以下是适合零基础或转行者的分阶段学习路径&#xff0c;涵盖必备知识、学习资源、实战方法和职业方向&#xff1a; 一、基础阶段&#xff08;1-3个月&#xff09; 1. 掌握核心基础知识 计算机网络&#…

express 怎么搭建 WebSocket 服务器

一&#xff1a;使用 express-ws var express require(express); var app express(); var expressWs require(express-ws)(app);app.use(function (req, res, next) {console.log(middleware);req.testing testing;return next(); });app.get(/, function(req, res, next){…

【AI论文】SuperEdit:修正并促进基于指令的图像编辑的监督信号

摘要&#xff1a;由于手动收集准确的编辑数据存在挑战&#xff0c;现有的数据集通常使用各种自动化方法构建&#xff0c;导致编辑指令和原始编辑图像对之间不匹配导致监督信号出现噪声。 最近的研究试图通过生成更高质量的编辑图像、在识别任务上进行预训练或引入视觉语言模型&…

关于大疆红外图片提取温度方法 python 方法

思路 红外图片需要是黑白图片 提取红外图片最高和最低温度 温度图例 根据最高温度31.2摄氏度 最低温度19.9摄氏度 那中间的值在 0到255 之间 那有这个值之后。就可以获取到图片里面 每个点或者面的值 实现方式 def find_Gray(self, t_max, t_min, c_temp):"""…

金融小知识

&#x1f4c9; 一、“做空”是啥&#xff1f; 通俗说法&#xff1a;押“它会跌”&#xff0c;赚钱&#xff01; ✅ 举个例子&#xff1a; 有一天老王的包子涨价到 10 块一个&#xff0c;张三觉得这价格肯定撑不住&#xff0c;未来会跌到 5 块。于是他&#xff1a; 向朋友借了…

JavaScript 数据存储全攻略:从 Cookie 到 IndexedDB

1. Cookie&#xff1a;传统的轻量级存储 Cookie 是最早的客户端存储解决方案之一&#xff0c;最初设计用于服务器和客户端之间的状态保持。 基本用法 javascript 复制 下载 // 设置cookie document.cookie "usernameJohnDoe; expiresThu, 18 Dec 2025 12:00:00 UTC…