无人零售产品:如何从0-1搭建运维故障告警平台? .doc
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
无人零售产品:如何从0-1搭建运维故障告警平台? 一、概念引入 在无人零售行业中,设备故障告警和维护是一个长期以来没有形成完整业务闭环的问题,导致一线运维工作人员效率较低,对用户的体验也造成了一定的负面影响。因此,笔者研究了行业内相关产品,并对相关业务人员的需求进行了调研,最终初步形成了运维故障告警平台的概念。 二、告警概念 告警是系统发生故障时,监控单元根据指定的告警策略,通过提前确定好的推送渠道,将告警通知推送给指定的接收方(服务端、客户端)。在无人零售行业中,告警闭环是一个完整的业务过程,包括机器端、服务端和客户端三个部分。机器端:设备通过工控将出发的软件或硬件故障同步到监控平台(服务端);服务端:监控平台经过一系列的告警策略,将告警消息推送至运维人员(客户端);客户端:运维人员接收告警通知后,到设备点位处维护设备;机器端:设备维护完成,更新设备状态并上传到服务端。 三、用户画像和需求 在无人零售行业中,运维工作人员和项目运营负责人是两类典型的用户。用户A,小张,一线运维工作人员,负责设备故障维护工作。由于区域较广,设备数量较多,随之而来的故障也较多。小张希望有一个故障告警的推送服务,实时告知他哪台设备有故障需要维护,哪条告警优先级更高更紧急,该推送服务将会极大提升他的日常工作效率。用户B,老李,总部项目运营负责人,负责公司总部无人设备产品的线下运营。他希望有一个实时的故障监控平台,能让他任何时候都能了解到全国无人设备的运营情况、故障情况以及告警处理情况。 四、功能结构组成 根据行业内产品和用户需求,笔者将运维故障告警平台的组成拆分为六个部分:故障数据、故障监控、故障告警、告警处理、设备健康度评分和故障数据仓库。 五、故障数据 故障数据是运维故障告警平台的核心组成部分。笔者建议可从故障数据分类、故障数据存储、故障数据筛选和过滤、故障数据仓库产品化等方面着手。故障分类是指对不同类型的故障的分类,以便制定针对性的告警策略用于告警的触发和推送。故障数据存储是指根据无人设备的软硬件底层设计,提前制定一套相对匹配公司业务需求的存储字段,如设备号、故障名称、故障码、故障开始时间、恢复时间、持续时间、故障次数等。故障数据筛选和过滤是指人为过滤掉不影响无人设备正常交易的故障或是运营运维人员在补理货和维护故障时产生的干扰性故障。数据仓库产品化是指通过一定的形式将每一条故障保存至产品化仓库中,便于后期及时更新和维护。 六、故障监控 故障监控是运维故障告警平台的另一个核心组成部分。笔者将之分为故障日志监控和故障告警监控。故障日志监控是指以单条故障作为最小颗粒度,对单台设备进行实时监控和记录。故障告警监控是指以一条告警任务作为最小颗粒度,对单台设备的实时状态和维护进度进行记录,并在运维人员维护完毕后同步告警任务及设备状态。 七、故障告警 故障告警是运维故障告警平台的第三个核心组成部分。在行业内,故障告警在产品层面有多种实现方式。笔者在研究了多个产品并调研了业务需求后,将故障告警理解为故障告警策略,并将之拆分为告警名称、告警对象、告警指标、触发条件和消息推送等几个组成部分。 八、结论 无人零售产品:如何从0-1搭建运维故障告警平台?是笔者针对无人零售行业的设备故障告警和维护问题所提出的解决方案。通过对行业内产品和用户需求的研究,笔者初步形成了运维故障告警平台的概念,并将其拆分为故障数据、故障监控、故障告警、告警处理、设备健康度评分和故障数据仓库六个部分。该平台的建立将会极大地提高运维工作人员的日常工作效率和用户的体验。
剩余7页未读,继续阅读
- 粉丝: 8
- 资源: 4万+
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助