应用直接中断连接导致数据被锁(生产故障)
这是一个由应用重启连接直接而导致数据被锁的问题。
系统大致结构
基本情况:
整个架构为了统一管理db连接,共享连接。
应用通过loadbalance连接db访问层。
db访问层后端代理若干db。
应用到loadbalance以mysql协议通信。
db访问层到db以JDBC方式通信。
故障: 某些数据库中的表数据相当长一段时间被锁,导致应用某些场景失败。
故障分析:应用开启一个事务的set autocommit=0命令是从app-lb-db访问层-db,期间如果某个事务还未执行完,而app强行中断连接,就会导致app