[Bug]: msg: failed to get delegator 624 for channel base-rootcoord-dml_14_453896578611993902v0: can not find client of node 624 #37710
Labels
kind/bug
Issues or changes related a bug
stale
indicates no udpates for 30 days
triage/needs-information
Indicates an issue needs more information in order to work on it.
Is there an existing issue for this?
Environment
Current Behavior
偶尔出现 failed to get delegator, 才升级到 v2.4.14 两天,最近两天都有发生,以前用的版本是 2.3.21,没有发现类似问题。
Expected Behavior
我们负载均衡方式用了
proxy.replicaSelectionPolicy: round_robin
Steps To Reproduce
No response
Milvus Log
查询时日志都在 proxy 上,最开始出现查询 failed to get delegator 624 的日志是在,2024/11/15 10:32:45
624 节点,这个 collection 没有什么异常日志,在 kill 之前一直有那个 collection 的查询日志:2024/11/15 11:54:09,
看现象只是部分 proxy 查询不到。
看proxy 的日志, 我们有 30个 proxy 进程, 提示这个查询不到的只有 8个proxy 进程, proxy 的前端是用的 7层负载均衡,每个节点的机会是均等的,说明只是部分 proxy 缓存不一致。
统计每个proxy 的失败次数,也不均衡
根据上面 失败的proxy ,查 meta update success 日志,发现在 前一天才更新后,之后一直没更新过。
看代码应该是 UpdateShardLeaders 这部分前后数据不同,才会回收掉连接
Anything else?
No response
The text was updated successfully, but these errors were encountered: