目錄
第 1章應急管理基礎\t1
1.1 基礎知識\t2
1.1.1 工作原則\t2
1.1.2 災難\t3
1.1.3 災難恢復\t4
1.1.4 災難備份\t4
1.1.5 災難備份中心\t4
1.1.6 關鍵業(yè)務功能\t5
1.1.7 業(yè)務影響分析\t5
1.1.8 恢復時間目標\t5
1.1.9 恢復點目標\t6
1.1.10 風險評估\t6
1.1.11 應急預案\t7
1.1.12 演練\t7
1.1.13 桌面演練\t7
1.1.14 模擬切換演練\t8
1.1.15 真實切換演練\t8
1.1.16 其他術語\t9
1.2 應急管理與業(yè)務連續(xù)性管理\t9
1.2.1 業(yè)務連續(xù)性管理的定義\t9
1.2.2 應急管理與業(yè)務連續(xù)性管理的關系\t10
1.3 應急管理與風險管理\t11
1.3.1 風險的定義\t11
1.3.2 信息安全風險的定義\t13
1.3.3 風險管理的定義\t15
1.3.4 應急管理與風險管理的關系\t16
1.4 應急管理和災難備份與恢復管理\t16
1.4.1 災難恢復的定義\t16
1.4.2 災難恢復7要素\t17
1.4.3 應急管理和災難備份與恢復管理的關系\t17
1.5 銀行業(yè)數據中心應急管理要求\t18
1.5.1 國家相關法律法規(guī)要求\t18
1.5.2 相關政府機構的要求\t25
第 2章銀行業(yè)數據中心應急管理概述\t29
2.1 數據中心的定義及分級\t30
2.1.1 數據中心的定義\t30
2.1.2 數據中心的分級\t31
2.2 云計算數據中心功能的演進\t32
2.3 銀行業(yè)數據中心典型組織架構\t34
2.3.1 如何建立數據中心的組織架構\t34
2.3.2 典型的銀行業(yè)數據中心組織架構\t36
2.4 銀行業(yè)數據中心的應急管理\t38
第3章銀行業(yè)數據中心應急管理組織架構\t41
3.1 銀行業(yè)數據中心應急管理組織成立目的\t42
3.2 銀行業(yè)數據中心應急管理組織架構\t42
3.2.1 應急領導小組\t43
3.2.2 應急執(zhí)行小組\t44
3.2.3 應急保障小組\t45
3.2.4 外部支持小組\t45
第4章銀行業(yè)數據中心應急管理策略、范圍、對象及目標\t47
4.1 應急管理策略\t48
4.1.1 事前預防策略\t48
4.1.2 事中響應與處置策略\t48
4.1.3 事后改進策略\t49
4.1.4 資源與文化保障策略\t50
4.2 應急管理范圍\t50
4.3 應急管理對象\t50
4.3.1 軟件\t51
4.3.2 硬件\t51
4.3.3 服務\t51
4.3.4 數據\t52
4.3.5 人員 \t52
4.4 應急管理目標\t52
第5章銀行業(yè)數據中心應急管理場所\t55
5.1 應急管理場所\t56
5.1.1 生產監(jiān)控場所\t56
5.1.2 應急指揮場所\t57
5.1.3 應急處置場所\t58
5.1.4 服務受理場所\t59
5.1.5 技術分析場所 \t59
5.1.6 測試演練場所\t60
5.2 應急場所的建設方法\t61
5.2.1 大屏幕顯示系統(tǒng) \t61
5.2.2 全球IP電話系統(tǒng)\t66
5.2.3 虛擬終端及云桌面\t69
第6章銀行業(yè)數據中心應急管理制度\t71
6.1 應急管理的規(guī)范與流程\t72
6.1.1 基本原則\t72
6.1.2 角色與職責分工\t72
6.1.3 7×24小時應急運維機制\t72
6.1.4 應急場景(包括但不限于)\t74
6.1.5 應急預案\t75
6.2 事件管理的規(guī)范與流程\t77
6.2.1 基本原則 \t77
6.2.2 角色與職責分工\t77
6.2.3 事件分類\t78
6.2.4 事件分級\t79
6.2.5 事件業(yè)務影響的認定\t81
6.2.6 事件活動的要求\t82
6.2.7 質量控制\t83
第7章銀行業(yè)數據中心主動性維護\t85
7.1 主動性維護基本原則\t86
7.1.1 RCM理論\t86
7.1.2 預防性維護和預測性維護\t89
7.1.3 主動性維護\t90
7.1.4 主動性維護與傳統(tǒng)維護觀念的差異\t91
7.1.5 主動性維護在銀行業(yè)數據中心運營中的價值\t92
7.1.6 主動性維護是降低數據中心TCO的新途徑\t92
7.2 硬件設備及機房環(huán)境設施技術實施方案\t93
7.2.1 運維內容\t93
7.2.2 硬件設備及機房環(huán)境設施的主動性維護理念\t93
7.2.3 案例\t94
7.3 網絡系統(tǒng)技術實施方案\t99
7.3.1 運維內容\t99
7.3.2 網絡系統(tǒng)的主動性維護理念\t99
7.3.3 案例\t100
7.4 主機、開放、windows、X86技術平臺實施方案\t105
7.4.1 運維內容\t105
7.4.2 主動性維護理念\t105
7.4.3 案例\t106
7.5 應用系統(tǒng)技術實施方案\t120
7.5.1 運維內容\t120
7.5.2 應用系統(tǒng)的主動性維護理念\t120
7.5.3 案例\t121
7.6 漏洞掃描與滲透測試\t127
7.6.1 運維內容\t127
7.6.2 主動性維護理念\t128
7.6.3 案例\t128
第8章銀行業(yè)數據中心應急場景及預案\t131
8.1 硬件與環(huán)境應急場景和預案\t133
8.1.1 應急場景清單\t133
8.1.2 場景一:ORACLE VSM虛擬帶庫應急\t135
8.1.3 場景二:SL8500物理帶庫應急方案\t138
8.1.4 場景三:Z13主機硬件故障\t140
8.1.5 場景四:IBM P系列小型機異常宕機\t144
8.1.6 場景五:HDS存儲設備應急方案\t149
8.1.7 場景六:NetApp存儲設備應急方案\t151
8.1.8 場景七:EMC存儲設備應急方案\t154
8.1.9 場景八:UPS系統(tǒng)應急方案\t158
8.1.10 場景九:PDU設備應急方案\t160
8.2 網絡應急場景和預案\t162
8.2.1 應急場景清單\t162
8.2.2 場景一:網絡設備某一板卡發(fā)生故障,該板卡所連接具有
冗余鏈路\t166
8.2.3 場景二:網絡交換機雙引擎中主引擎發(fā)生故障,備引擎正
常,主備引擎切換失敗\t168
8.2.4 場景三:外部因素導致生產中心互聯網應用系統(tǒng)不可用,
需要將流量切換到異地災備中心\t169
8.2.5 場景四:骨干線路丟包\t171
8.2.6 場景五:異常流量導致主備防火墻的通信異常\t174
8.2.7 場景六:VPN設備通道連接異常\t176
8.2.8 場景七:DNS設備的解析服務異常導致DNS服務異常\t178
8.3 數據恢復應急場景及預案\t180
8.3.1 應急場景清單\t181
8.3.2 場景一:數據庫熱備份恢復切換\t184
8.3.3 場景二:數據庫冷備份恢復切換\t184
8.3.4 場景三:物理磁盤數據應急恢復\t187
8.3.5 場景四:物理磁盤外部專業(yè)數據恢復應急處理\t191
8.4 主機應急場景和預案\t192
8.4.1 應急場景清單\t192
8.4.2 場景一:主機CICS聯機系統(tǒng)交易處理緩慢\t194
8.4.3 場景二:主機CICS聯機與外圍系統(tǒng)通信異常\t200
8.4.4 場景三:DB2沒有可以使用的ACTIVE LOG,DB2 LOG
不能工作\t204
8.4.5 場景四:一個BSDS文件無法訪問,無法對其進行讀/
寫操作\t206
8.4.6 場景五:DB2數據空間將耗盡\t208
8.4.7 場景六:磁盤故障觸發(fā)非計劃性Hyperswap\t210
8.4.8 場景七:系統(tǒng)DATASET的利用率超過閾值\t215
8.5 小型機應急場景和預案\t216
8.5.1 應急場景清單\t216
8.5.2 場景一:系統(tǒng)重要資源不足\t219
8.5.3 場景二:CICS交易繁忙以致出現交易排隊現象\t226
8.5.4 場景三:MQ通道狀態(tài)異常\t229
8.5.5 場景四:數據庫出現大量行鎖\t231
8.5.6 場景五:SQL(聯機或批量)執(zhí)行時間變長\t236
8.5.7 場景六:單臺應用服務器出現故障\t239
8.5.8 場景七:加速器邏輯通道夯\t244
8.5.9 場景八:簽名驗簽業(yè)務持續(xù)性緩慢\t248
8.5.10 場景九:ORACLE ASM磁盤被賦PVID導致磁盤組損壞\t253
8.5.11 場景十:ORACLE數據庫SQL語句執(zhí)行計劃突變\t259
8.6 X86平臺應急場景和預案\t263
8.6.1 應急場景清單\t263
8.6.2 場景一:云平臺計算節(jié)點資源不足\t265
8.6.3 場景二:ORACLE數據庫數據損壞\t269
8.6.4 場景三:MySQL Cluster數據庫SQL節(jié)點hang死\t271
8.6.5 場景四:存儲故障\t272
8.6.6 場景五:單臺負載均衡器故障\t275
8.6.7 場景六:WAS組件異常\t276
8.7 應用與運行應急場景和預案\t278
8.7.1 應急場景清單\t278
8.7.2 場景一:應用系統(tǒng)按需執(zhí)行重啟\t280
8.7.3 場景二:某應用系統(tǒng)的對端系統(tǒng)未正常收到返回報文\t282
8.7.4 場景三:因業(yè)務量高峰、系統(tǒng)處理能力不足引起的聯機交易
緩慢\t284
8.7.5 場景四:批量執(zhí)行中斷\t286
8.7.6 場景五:數據修改異常引發(fā)交易異常\t288
8.7.7 場景六:應用產品主備機切換應急預案 \t290
8.7.8 場景七:應用系統(tǒng)MQ隊列堆積 \t292
8.7.9 場景八:應用系統(tǒng)間密鑰恢復應急場景 \t294
8.7.10 場景九:應用產品版本回退應急預案 \t296
8.8 互聯網信息安全事件應急場景及預案\t297
8.8.1 應急場景清單\t297
8.8.2 場景一:互聯網應用系統(tǒng)網絡入侵\t299
8.8.3場景二:互聯網出口拒絕服務攻擊\t300
第9章銀行業(yè)數據中心應急處置及啟動\t303
9.1 應急處置策略與原則\t304
9.1.1 首查監(jiān)控\t305
9.1.2 關聯變更\t305
9.1.3 回顧歷史\t306
9.1.4 以我為因\t306
9.1.5 聯動后線\t307
9.1.6 并行排查\t307
9.1.7 信息共享\t308
9.1.8 恢復優(yōu)先\t308
9.2 應急處置實施方法論\t309
9.2.1 應急發(fā)現階段\t311
9.2.2 應急響應階段\t312
9.2.3 應急恢復階段\t312
9.2.4 應急驗證階段\t314
9.3 應急管理后評價\t314
第 10章銀行業(yè)數據中心應急管理工具建設\t319
10.1 應急預案管理平臺\t320
10.1.1 主要用途\t320
10.1.2 實現功能\t320
10.1.3 建設方法\t323
10.2 應急協(xié)作管理平臺\t324
10.2.1 主要用途\t324
10.2.2 實現功能\t325
10.2.3 建設方法\t328
10.3 運維流程管理平臺\t331
10.3.1 主要用途\t332
10.3.2 實現功能\t333
10.3.3 建設方法\t342
10.4 集中監(jiān)控管理平臺\t346
10.4.1 主要用途\t346
10.4.2 實現功能\t347
10.4.3 建設方法\t349
第 11章應急案例介紹\t353
11.1 在線客服人工服務異常案例\t354
11.1.1 系統(tǒng)簡介\t354
11.1.2 案例簡述\t354
11.1.3 處置詳情\t355
11.1.4 處置要素\t355
11.1.5 后續(xù)改進\t356
11.2 信用卡快捷支付退貨交易緩慢案例\t356
11.2.1 系統(tǒng)簡介\t356
11.2.2 案例簡述\t357
11.2.3 處置詳情\t357
11.2.4 處置要素\t357
11.2.5 后續(xù)改進\t358
11.3 個人理財產品銷售異常案例\t358
11.3.1 系統(tǒng)簡介\t358
11.3.2 案例簡述\t359
11.3.3 處置詳情\t359
11.3.4 處置要素\t359
11.3.5 后續(xù)改進\t360
11.4 部分借記卡行內轉賬失敗案例\t360
11.4.1 系統(tǒng)簡介\t360
11.4.2 案例簡述\t361
11.4.3 處置詳情\t361
11.4.4 處置要素\t361
11.4.5 后續(xù)改進\t362
11.5 小型機內存故障案例\t362
11.5.1 系統(tǒng)簡介\t362
11.5.2 案例簡述\t363
11.5.3 處置詳情\t363
11.5.4 處置要素\t363
11.5.5 后續(xù)改進\t364
11.6 存儲鏈路抖動案例\t364
11.6.1 系統(tǒng)簡介\t364
11.6.2 案例簡述\t365
11.6.3 處置詳情\t365
11.6.4處置要素\t365
11.6.5 后續(xù)改進\t366
11.7 某互聯網應用系統(tǒng)漏洞被利用進行網絡入侵攻擊\t366
11.7.1 系統(tǒng)簡介\t366
11.7.2 案例簡述\t367
11.7.3 處置詳情\t367
11.7.4 處置要素\t367
11.7.5 后續(xù)改進\t368
11.8 某地互聯網出口Web服務器遭受DDoS攻擊案例\t368
11.8.1 系統(tǒng)簡介\t368
11.8.2 案例簡述\t369
11.8.3 處置詳情\t369
11.8.4 處置要素\t370
11.8.5 后續(xù)改進\t370
11.9 某系統(tǒng)交易緩慢案例\t370
11.9.1 系統(tǒng)簡介\t370
11.9.2 案例簡述\t371
11.9.3 分析過程詳述\t371
11.9.4 處置詳情\t373
11.9.5 處置要素\t374
11.9.6 后續(xù)改進\t374
11.10 某系統(tǒng)投產新版本后批量執(zhí)行緩慢案例\t375
11.10.1 系統(tǒng)簡介\t375
11.10.2 案例簡述\t375
11.10.3 分析過程詳述\t376
11.10.4 處置詳情\t377
11.10.5 處置要素\t377
11.10.6 后續(xù)改進\t378
參考資料\t379