1. 程式人生 > >移動查勘通賠版本系統上線-對接理賠失敗,導致案件無法正常下發及處理

移動查勘通賠版本系統上線-對接理賠失敗,導致案件無法正常下發及處理

工作事故

升級開始時間:2017-5-4晚19:00

升級結束時間:2017-5-4晚22:00


2017-5-5-周五:

出現問題:

大部分分公司反饋無法接受通賠案件,一小部分分公司反饋能收到案件,但是無查勘信息。

實際原因:在做升級操作之前,考慮不周導致,只考慮了分公司是否需要做操作,除試點分公司需要做部分操作之外,全部操作均由總公司操作。

  • 試點分公司所需執行操作:

1、將接入項目包中的配置文件參數(核心對應的F5地址)修改並重啟服務

2、將分公司理賠端(自賠)相關參數修改為生產核心地址,然後重啟服務

  • 總公司所需操作:

1、停止移動查勘全部服務

2、備份5001版本對應項目包,APK,CSV文件

3、上傳5002版本對應項目包,APK,CSV文件

4、執行研發支持提供的修改強制升級5002版本APK對應sql語句

5、啟動單受管節點,查看運行狀態,經研發確認無誤之後,啟動所有集群受管節點

遺漏未執行操作:需要在數據庫中對每個分公司用戶插入通賠系統的F5地址

因為遺漏了這步操作, 導致了通賠無法下發案件到各分公司。



事故反思及如何完善:


事故反思:導致該事故產生的原因為考慮不周所致,核心因素是運維人員對整體流程有遺漏,運維仍然有待加強。


以後該如何完善:

1、有重大升級變更時,編寫升級時間軸,類似下圖:

技術分享

2、編寫runbook(運行手冊,也即操作步驟),也即在升級過程中,屬於我們操作的部分,我們該如何去做,要非常有條理性邏輯學地描述我們的操作步驟,建議按照時間順序編寫。

3、將時間軸以及runbook一並讓項目組同事及領導過目並提意見。




本文出自 “清風攬月的博客” 博客,謝絕轉載!

移動查勘通賠版本系統上線-對接理賠失敗,導致案件無法正常下發及處理