金蝶系统及其他业务系统基础设施软件运维服务需求说明
一、供应商资质需求
1.具有履行合同所必需的专业技术能力,具有固定的生产或经营场所和一定数量的专业技术人员,具备有效期内的ISO9001质量管理体系认证证书、ISO27001信息安全管理体系认证,IS020000信息技术服务管理体系认证。
2.供应商必须具有独立承担民事责任的能力,具备合法有效的营业执照,成立年限不少于2年,注册资金不少于50万。
3.具有依法缴纳税收和社会保障资金的良好记录。
4.具有良好的商业信誉和健全的财务会计制度,近3年内在经营活动中无重大违法记录。
5.响应方具备专门的运维团队,运维团队人员需要如下资质。具有Linux认证、Oracle OCM认证、MySQL OCP认证其中Oracle OCM认证人员最少须具备8名。
6.本项目不接受联合体报名。
二、服务需求
对北京航食的各类Windows Server和Linux服务器系统、数据库系统(MySql数据库、SQL Server数据库、Oracle数据库和redis数据库)、虚拟化集群、备份系统提供支持保障服务,并解决各系统运行中出现的问题,保证系统的高可用,同时确保数据的安全和日常维护过程中的技术文档整理。
三、基本服务内容
1.巡检服务
国家法定节假日和其他国家重大事项除外,按照协商好的季度/月度,安排工程师进行操作系统、数据库系统、虚拟化集群、备份系统巡检服务。通过巡检了解系统功能和限制,在问题发生前采取预防措施,巡检专家需执行完善的巡检步骤,收集相关系统信息(包括系统配置、数据库配置、存储情况、备份有效性、性能状况等),分析系统现状,发现潜在问题并给出相关调整建议,以降低潜在的数据丢失、安全侵犯、停机、性能下降或资源限制抢救无效等风险。
2.数据库系统巡检服务
(1)详细服务内容:
Ø了解当前数据库的运行状况,定位当前的运作水平;
Ø明确数据库运行性能不足的原因;
Ø分析数据库规划与配置,并给出合理化建议;
Ø分析数据库的资源使用情况,并给出合理化建议;
Ø分析数据库的安全性,并给出合理化建议;
Ø分析数据库的可靠性,并给出合理化建议;
Ø分析数据库的备份和恢复策略,并给出合理化建议;
Ø分析数据库运行的性能问题,并给出性能调整和优化建议;
Ø分析影响性能较大的SQL/CRUD 语句,并结合应用检查,给出合理化建议;
(2)技术实现:
Ø数据库的配置情况,包括磁盘规划、内存规划、数据文件规划、日志文件规划、网络连接规划等信息。
Ø备份恢复策略的基本信息,包括业务要求、备份方法、备份计划、恢复方法、恢复计划、恢复测试计划等等。
Ø容灾规划,包括业务要求、现有容灾水平等等。
Ø数据库安全,包括口令管理、权限管理等信息。
Ø初始化参数,主要涉及初始化参数设置的合理性等信息。
Ø数据库文件信息,包括文件数量、文件大小、文件位置、文件的空间使用等信息。
Ø表空间信息,包括表空间的空间管理、现有空间使用等信息。
Ø回滚段信息,包括回滚段的大小、变化特征、参数配置等信息。
Ø后台告警日志文件(如:)信息,包括以往数据库出现的各种重要问题等等。
Ø等待事件,包括导致数据库性能下降的内部等待事件等等。
Ø数据库高速缓存使用分析(如:oracle db_cache),包括数据库内存的配置、命中率等使用状况信息。
Ø数据库I/O 统计信息,包括数据库的物理和数据文件I/O 等信息。
Ø数据库内存竞争分析(如:Oracle LATCH),包括各种数据库内部锁的使用状况等信息。
ØSQL/CRUD 优化,找到消耗数据库资源多的语句,了解这些语句的执行方法。
Ø日志文件分析:
进程跟踪文件;
监听进程的日志和跟踪文件;
应用端的日志和跟踪文件。
(3)重点分析内容:
重点分析系统空间增长趋势,并提出相关建议:根据表空间每日的增长情况,制定表空间增长及使用空间基线,评估表空间的增长趋势及增长所需要的空间,并对当前剩余空间评估可使用的天数。
重点分析系统性能增长趋势,并提出相关建议:根据系统业务增长趋势及系统压力变化情况,制定每套系统性能基线均值及高峰期间性能基线,对系统性能进行预测与分析。通过对每月末及月初,重大节假日期间的性能数据、业务数据进行综合对比分析,评估系统性能趋势。
(4)需要提交的报告:
Ø发现并处理系统存在的问题;
Ø发现并处理系统潜在的问题;
Ø数据库的整体信息描述;
Ø数据库备份恢复策略的评估和建议;
Ø数据库安全的评估和建议;
Ø初始化参数设置的评估和建议;
Ø数据库文件,包括控制文件、数据文件、日志文件的使用评估和建议;
Ø数据库中的表空间使用、表空间碎片的评估和建议;
Ø回滚段的使用评估和建议;
Ø数据库常见错误的分析和建议;
Ø数据库等待事件的评估和建议;
Ø数据库内存使用的评估和建议;
Ø数据库的I/O 分析和建议;
Ø数据库SQL/CRUD 运行状况的评估和建议;
Ø数据库内存闩锁竞争的应用状况评估和建议;
Ø建议汇总。
3.操作系统巡检服务
通过健康检查了解操作系统当前运行情况,在发生问题前采取预防措施。需要工程师执行完善健康检查步骤,收集系统信息,分析系统现状,发现潜在问题并给出相关调整建议。
巡检内容与方法主要内容:
Ø评价操作系统当前的运行状态
Ø评价操作系统性能情况
Ø分析故障、性能瓶颈和资源竞争情况
Ø指出存在的问题,提出解决建议
巡检方法:
Ø操作系统工具和命令检查操作系统
Ø收集性能图表
Ø检查置文件和日志
4.虚拟化集群巡检服务
由负责虚拟化集群维护的工程师对维护范围内的系统进行预防性检查维护,及时掌握系统的运作信息,对系统的日志记录进行分析。发现有性能下降或者报错等现象,要确定产生原因,在提交巡检报告时提出升级或变更的建议。
具体虚拟集群的巡检内容如下:
Ø系统运行诊断;
Ø检查主要内置硬件设备和外围设备运行情况;
Ø检查所有连接接口,CABLE、电源稳定性等可能容易导致设备出现问题的敏感备件;
Ø检查系统运行情况,包括CPU,内存,硬盘,各种适配卡,电源等的使用情况,检查Error Log、清理Error Log File,检查文件系统使用空间;
Ø协助用户方系统管理员解决和分析日常设备运行中出现的问题。
5.备份系统巡检服务
由负责备份系统维护的工程师对维护范围内的系统进行预防性检查维护,及时掌握系统的运作信息,对系统的日志记录进行分析。发现有性能下降或者报错等现象,要确定产生原因,在提交巡检报告时提出升级或变更的建议。
备份系统的巡检内容如下:
Ø备份系统运行诊断;
Ø检查主要备份设备和介质运行情况;
Ø检查备份任务执行情况;
Ø协助用户方系统管理员解决和分析日常备份系统运行中出现的问题。
6.请求式现场服务
应北京航食的请求,运维商需提供服务期内的数据库专家现场技术服务,内容包括:
Ø软件安装帮助;
Ø软件升级的规划和实施;
Ø数据库的重新规划;
Ø现场问题的诊断及分析;
Ø实施问题的解决方案;
Ø数据库性能调整;
Ø系统故障的处理。
在客户提出申请后,运维商协商时间,安排资深工程师进行现场服务。
|