服务器上部署GPU版的milvus向量数据库

news/2025/3/21 1:27:48/

1、安装docker compose

  1. 我们可以从 Github 上下载它的二进制包来使用,最新发行的版本地址:
    https://github.com/docker/compose/releases
sudo curl -L "https://github.com/docker/compose/releases/download/v2.6.0/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
  1. 将可执行权限应用于二进制文件:
$ sudo chmod +x /usr/local/bin/docker-compose
  1. 创建软链:
 $ sudo ln -s /usr/local/bin/docker-compose /usr/bin/docker-compose
  1. 测试是否安装成功:
$ docker-compose version

2、安装GPU驱动

已安装好的朋友,这步可以跳过

sudo apt install --no-install-recommends nvidia-headless-545 nvidia-utils-545

milvus_30">3、下载安装milvus

milvusstandalonedockercomposegpuyml_31">1.Download milvus-standalone-docker-compose-gpu.yml

wget https://github.com/milvus-io/milvus/releases/download/v2.4.0-rc.1/milvus-standalone-docker-compose-gpu.yml -O docker-compose.yml

大家根据自己的硬件配置,使用单GPU,还是使用多GPU都可以。在docker-compose.yml文件中更改。
单GPU:

...
standalone:gpu:initMemSize: 0maxMemSize: 1024...deploy:resources:reservations:devices:- driver: nvidiacapabilities: ["gpu"]device_ids: ["0"]
...

多GPU:

...
standalone:gpu:initMemSize: 0maxMemSize: 1024...deploy:resources:reservations:devices:- driver: nvidiacapabilities: ["gpu"]device_ids: ['0', '1']
...

2.Start Milvus

在docker-compose.yml路径下,

sudo docker compose up -d

sudo docker-compose up -d

启动后会显示:

Creating milvus-etcd … done
Creating milvus-minio … done
Creating milvus-standalone … done

3.验证安装

Milvus 单机版启动后,将有三个 docker 容器在运行,包括 Milvus 单机版服务及其两个依赖项。

sudo docker ps
      Name                     Command                  State                            Ports
--------------------------------------------------------------------------------------------------------------------
milvus-etcd         etcd -advertise-client-url ...   Up             2379/tcp, 2380/tcp
milvus-minio        /usr/bin/docker-entrypoint ...   Up (healthy)   9000/tcp
milvus-standalone   /tini -- milvus run standalone   Up             0.0.0.0:19530->19530/tcp, 0.0.0.0:9091->9091/tcp

4.Stop Milvus

关闭Milvus standalone:

sudo docker compose down

在关闭Milvus后删除数据:

sudo rm -rf  volumes

参考链接:https://milvus.io/docs/install_standalone-docker-compose-gpu.md


http://www.ppmy.cn/news/1424606.html

相关文章

「GO基础」在Windows上安装Go编译器并配置Golang开发环境

文章目录 1、安装Go语言编译程序1.1、下载GoLang编译器1.2、安装GoLang编译器 2、配置Golang IDE运行环境2.1、配置GO编译器2.1.1、GOROOT 概述2.1.2、GOROOT 作用2.1.2、配置 GOROOT 2.2、配置GO依赖管理2.2.1、Module管理依赖2.2.2、GOPATH 管理依赖 2.3、运行GO程序2.3.1、创…

什么是PE 格式

2024年4月19日,周五下午 PE(Portable Executable)格式是一种 Windows 操作系统中常见的可执行文件和对象文件格式。它是微软公司为 Windows NT 操作系统引入的一种文件格式,用于存储可执行程序、动态链接库(DLL&#x…

全栈外包接单/远程工作(TS, React, Vue, Java, 移动端)

个人介绍 我毕业于中国某一本院校计算机专业,曾在北京大型软件公司从事Java开发多年,主要服务于全国各大头部985/211院校。后来为扩宽职业路径,转向了Ts全栈,现专注于远程外包接单工作,致力于打造一个能为客户带来优质…

binary tree Leetcode 二叉树算法题

144.二叉树的前序遍历 前序遍历是&#xff1a;根-左-右 所以记录序列的的时候放在最前面 递归 class Solution {List<Integer> ans new ArrayList<>();public List<Integer> preorderTraversal(TreeNode root) {if(root null) return ans;ans.add(root…

CSS实现弹性盒子保持水平和垂直居中

弹性盒子 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title> </head> &…

C语言 | Leetcode C语言题解之第32题最长有效括号

题目&#xff1a; 题解&#xff1a; int longestValidParentheses(char* s) {int n strlen(s);int left 0, right 0, maxlength 0;for (int i 0; i < n; i) {if (s[i] () {left;} else {right;}if (left right) {maxlength fmax(maxlength, 2 * right);} else if (…

MySQL慢SQL优化方案汇总

⛰️个人主页: 蒾酒 &#x1f525;系列专栏&#xff1a;《mysql经验总结》 &#x1f30a;山高路远&#xff0c;行路漫漫&#xff0c;终有归途 目录 写在前面 优化思路 避免查询不必要的列 分页优化 索引优化 JOIN优化 排序优化 UNION 优化 写在最后 写在前面 本…

【LeetCode热题100】【贪心算法】跳跃游戏

题目链接&#xff1a;55. 跳跃游戏 - 力扣&#xff08;LeetCode&#xff09; 数组的元素表示可以跳的最大长度&#xff0c;要判断能不能跳到最后 不断更新可以跳到的最远距离&#xff0c;如果当前的位置大于可跳最远距离&#xff0c;说明不行 class Solution { public:bool …