398 Star 1.4K Fork 1.5K

GVPopenGauss / openGauss-server

 / 详情

【测试类型:功能测试】【测试版本:6.0.0】【资源池化】debug版本,stop备节点后start拉起,产生dms_smon_handle_cancel_ack相关core

待回归
缺陷
创建于  
2024-05-16 17:43

【标题描述】:debug版本,stop备节点后start拉起,产生dms_smon_handle_cancel_ack相关core

【测试类型:功能测试】【测试版本:6.0.0】【资源池化】debug版本,stop备节点后start拉起,产生dms_smon_handle_cancel_ack相关core

【操作系统和硬件信息】(查询命令: cat /etc/system-release, uname -a): ARM+openEuler

【测试环境】(单机/1主x备x级联备): 一主两备

【被测功能】: stop && start

【测试类型】: 功能测试

【数据库版本】(查询命令: gaussdb -V):
输入图片说明

【预置条件】: 一主两备资源池化集群

【操作步骤】(请填写详细的操作步骤):

  1. 主节点执行读写业务,备节点执行只读业务;
  2. stop备节点后start拉起备节点
    cm_ctl stop -n 2;sleep 15;cm_ctl start -n 2
    3.查看集群状态

【预期输出】: stop & start操作成功,集群状态正常

【实际输出】: 2节点拉起过程coredump

【原因分析】:

  1. 这个问题的根因
  2. 问题推断过程
  3. 还有哪些原因可能造成类似现象
  4. 该问题是否有临时规避措施
  5. 问题解决方案
  6. 预计修复问题时间

【日志信息】(请附上日志文件、截图、coredump信息):
输入图片说明

输入图片说明

相关日志保存至如下路径:
输入图片说明

【测试代码】: 不涉及

评论 (6)

haomeng 创建了缺陷
haomeng 添加协作者陈栋
展开全部操作日志

Hey @haomeng, Welcome to openGauss Community.
All of the projects in openGauss Community are maintained by @opengauss_bot.
That means the developers can comment below every pull request or issue to trigger Bot Commands.
Please follow instructions at Here to find the details.

Hi @haomeng, please use the command /sig xxx to add a SIG label to this issue.
For example: /sig sqlengine or /sig storageengine or /sig om or /sig ai and so on.
You can find more SIG labels from Here.
If you have no idea about that, please contact with @xiangxinyong , @zhangxubo .

haomeng 修改了描述
王恬静 添加了
 
qa_management_O_M
标签
王恬静 添加了
 
qa_dn_management
标签
陈栋 修改了备注
董宁 修改了备注
陈栋 计划截止日期设置为2024-06-05

问题出现情况
1.clean时候,只清理的owner,没有清理lock_mode
2.节点0请求页面,记录到converting,发claim消息,但claim消息丢失
3.节点0释放页面,满足释放条件,但因为允许DRC不一致,DRC没有改动,converting上依旧记录原先请求
4.另一个节点请求页面,记录到convert_q,并发现converting停留时间长,需要确认
5.smon线程进行确认,发现owner是空,但有锁模式,不符合校验

问题原因:原先clean阶段,清理不干净,清理的owner,但是没有清理lock_mode,导致后续校验不通过
问题分类:原先代码存在问题;模块:DMS-REFORM-drc clean

另外,该代码不用回合到家里
内部clean阶段已采取全部release,全量rebuild。不会有针对故障节点进行clean的流程

董宁 任务状态待办的 修改为已确认
董宁 任务状态已确认 修改为修复中
董宁 任务状态修复中 修改为已完成
董宁 任务状态已完成 修改为待回归

登录 后才可以发表评论

状态
负责人
项目
里程碑
Pull Requests
关联的 Pull Requests 被合并后可能会关闭此 issue
分支
开始日期   -   截止日期
-
置顶选项
优先级
预计工期 (小时)
参与者(4)
13084139 opengauss bot 1686829535
C++
1
https://gitee.com/opengauss/openGauss-server.git
git@gitee.com:opengauss/openGauss-server.git
opengauss
openGauss-server
openGauss-server

搜索帮助