-
Notifications
You must be signed in to change notification settings - Fork 331
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Vearch 集群状态异常 #747
Comments
你这配置文件是全的吗?没看到router的配置信息 |
上面没有 router 的配置:
加上这个就全了 |
你启动的时候配置了router吗 |
配置了,master、router、ps 都可以正常启动 |
你是通过什么方式启动的master、router、ps? |
docker run -d --name vearch-gy-test_master_65.218-13817 --net=host -v $DEPLOYBINDIR/conf/server_config.toml:/vearch/config.toml -v /home/fsp/vearch/vearch-gy-test_master_65.218-13817/db:/home/fsp/vearch/vearch-gy-test_master_65.218-13817/db -v /home/fsp/vearch/vearch-gy-test_master_65.218-13817/db1:/home/fsp/vearch/vearch-gy-test_master_65.218-13817/db1 -v /home/fsp/vearch/vearch-gy-test_master_65.218-13817/logs:/home/fsp/vearch/vearch-gy-test_master_65.218-13817/logs d000ea0175ea master docker run -d --name vearch-gy-test_router_65.218-13001 --cpuset-mems="1" --cpuset-cpus="1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,31" --net=host -v $DEPLOYBINDIR/conf/server_config.toml:/vearch/config.toml -v /home/fsp/vearch/vearch-gy-test_router_65.218-13001/db:/home/fsp/vearch/vearch-gy-test_router_65.218-13001/db -v /home/fsp/vearch/vearch-gy-test_router_65.218-13001/db1:/home/fsp/vearch/vearch-gy-test_router_65.218-13001/db1 -v /home/fsp/vearch/vearch-gy-test_router_65.218-13001/logs:/home/fsp/vearch/vearch-gy-test_router_65.218-13001/logs d000ea0175ea router docker run -d --name vearch-gy-test_ps_65.218-13081 -m 26000M --memory-swap 0M --net=host -v $DEPLOYBINDIR/conf/server_config.toml:/vearch/config.toml -v /home/fsp/vearch/vearch-gy-test_ps_65.218-13081/db:/home/fsp/vearch/vearch-gy-test_ps_65.218-13081/db -v /home/fsp/vearch/vearch-gy-test_ps_65.218-13081/db1:/home/fsp/vearch/vearch-gy-test_ps_65.218-13081/db1 -v /home/fsp/vearch/vearch-gy-test_ps_65.218-13081/logs:/home/fsp/vearch/vearch-gy-test_ps_65.218-13081/logs d000ea0175ea ps |
我这边按你的配置启动了1个master,1个router和1个ps是没有问题的。我现在机器有限,你第二个ps是如何启动的,用一模一样的参数吗,是在新机器上启动的吗? |
都是一台机器,命令也是一样的,https://hub.docker.com/r/vearch/vearch/tags f212feadc153 你也是用这个最新的镜像测的吗,我之前用的 3.2.7 版本的是没有问题的,用这个最新的镜像就报异常 |
是的,我用的就是这个镜像 |
我使用这个镜像,也测试了 1个master,1个router和1个ps 的情况,同样出现了相同的异常。
一个完全新的集群,调用 /list/server 就会产生如上异常。 我测试的机器 avx 和 avx512 指令集都是有的,CPU 型号是 Intel(R) Xeon(R) Silver 4208 CPU @ 2.10GHz ,这两台机器运行 3.2.7 版本的镜像都是正常的,使用最新的镜像就有问题 |
我这边也启动了两台ps试了一下,也是可以的。麻烦贴一下master,router和ps容器的日志吧 |
docker logs:
router
ps
容器日志: |
看日志都是正常的。麻烦贴一下环境相关信息吧,系统版本还有详细的cpuinfo |
cat /etc/os-releaseNAME="CentOS Linux" CENTOS_MANTISBT_PROJECT="CentOS-7" lscpuArchitecture: x86_64 |
我找了一台支持avx512的机器也试了,但是还是无法复现你说的情况 |
Vearch 版本 v3.4.2
使用如下镜像 docker 部署:
master * 1
router * 1
ps * 2
配置文件如下:
集群启动后查询集群状态(/_cluster/stats):
端口状态(/list/server):
接口报 500。
docker logs 日志如下:
容器日志:
我在集群启动后没有进行任何操作,直接查集群状态出现如上异常,我想知道是我配置的问题还是镜像的问题?
The text was updated successfully, but these errors were encountered: