• 阿里巴巴DevOps实践指南(二十)|业务系统安全工程

    5 月 13 日,特斯拉服务系统宕机,市值一夜间蒸发 2800 亿。6 月 3 日苹果 iCloud 云存储服务器故障,用户无法登录。8 月 27 日,思科员工删除虚拟机,导致思科损失 1600 万。12 月 25 日,谷歌服务全球性宕机。频发...
    文章 2021-07-06 333浏览量
  • 千人坐席的云呼叫中心,是如何实现大容量高并发的?

    系统随时都面临着宕机的危险。针对这个问题&xff0c;件率先采用分布式架构和云原生技术&xff0c;打造了高并发、高稳定、高安全的云呼叫中心&xff0c;支持公有云、私有云、混合云等多种方式部署&xff0c;实现了计算与存储的高...
    文章 2022-06-12 46浏览量
  • 数据中心供电系统可用性问题分析

    许多负载宕机的故障发生在UPS与IT设备负载之间。过去,用户通常在UPS以及发电机之间引入冗余设备,但是他们往往容易忽略终端配电一级的单路径故障点,例如他们在UPS和IT设备负载之间设置多个断路器,而且UPS和IT负载...
    文章 2017-07-03 1033浏览量
  • 谁动了我的实例&磁盘-ECS主动运维历史事件查询

    由于宿主机软硬件故障等原因触发宕机迁移或重启的非预期系统事件 因实例错误实例重启 由于操作系统内部错误导致系统崩溃引发实例重启的非预期系统事件 其中因系统维护实例重启这种类型,就是您在待处理页面所看到的...
    文章 2018-05-25 9684浏览量
  • 十大虚拟化最佳实践(转自Wes Miller的文章)

    如果虚拟机在部署时并未让适当的团队成员知道,这就意味着新系统有可能成为新零日漏洞的可恶来源,造成网络中其他关键业务系统宕机。虚拟系统应该得到充分认识,也不能想当然。必须像对实际的物理系统一样,对虚拟...
    文章 2017-11-08 1284浏览量
  • [数据恢复答疑]RAID真的安全吗?

    存储在这块故障盘上的原有数据就要通过其他硬盘的数据恢复出来,当然这个过程中控制器(硬RAID为RAID卡,软RAID实际上是个驱动)会负责这个工作,同时为了保证不宕机控制器也会保证存储的正常化,不会让操作系统认为...
    文章 2017-11-22 1387浏览量
  • ITIL部署实施系列之基础架构规划

    当网络中硬件和软件技术处于时代发展主流水平,升级系统已不能明显提升IT基础架构的安全水平时,其架构中最薄弱的环节就是操作客户机的人。往往在业务系统进行全面铺开的时候,由于用户缺乏安全意识和规范操作行为,...
    文章 2017-11-27 1601浏览量
  • 中小型企业运维之路

    再比如,曾发生某区域因代码更新问题,导致该区域大面积宕机,影响包括消息队列等在内的大量产品异常,如果这时候我们把所有的都交给产品,平台的问题就会导致企业运营的业务全面宕机,而平台方也仅仅会按照产品宕机...
    文章 2019-09-12 1426浏览量
  • 云数据中心呼唤安全可控的运维

    系统安全,主要是通过实现供电零终端、制冷不间断、网络高可靠等措施来保障系统安全稳定地运行。在系统安全领域,越来越多的新兴技术手段正得到运用,例如利用高压发电组自动并机发电,保证不间断供电,当市电发生...
    文章 2017-08-02 1334浏览量
  • 云数据中心呼唤安全可控的运维

    系统安全,主要是通过实现供电零终端、制冷不间断、网络高可靠等措施来保障系统安全稳定地运行。在系统安全领域,越来越多的新兴技术手段正得到运用,例如利用高压发电组自动并机发电,保证不间断供电,当市电发生...
    文章 2017-08-02 1699浏览量
  • 云数据中心呼唤安全可控的运维和检测

    系统安全,主要是通过实现供电零终端、制冷不间断、网络高可靠等措施来保障系统安全稳定地运行。在系统安全领域,越来越多的新兴技术手段正得到运用,例如利用高压发电组自动并机发电,保证不间断供电,当市电发生...
    文章 2017-07-03 1602浏览量
  • 云数据中心呼唤安全可控的数据中心运维

    系统安全,主要是通过实现供电零终端、制冷不间断、网络高可靠等措施来保障系统安全稳定地运行。在系统安全领域,越来越多的新兴技术手段正得到运用,例如利用高压发电组自动并机发电,保证不间断供电,当市电发生...
    文章 2017-07-10 1528浏览量
  • 重新理解“无容灾不上云”:应用多活将成为云原生容灾...

    理论上来说是可以做到“永不宕机&xff0c;但为什么还有这么多规模大、时间长的系统故障发生&xff1f;如何减少宕机事故的发生&xff1f;InfoQ 采访了阿里云全局高可用技术团队&xff0c;谈谈如何保证复杂系统中的业务可持续...
    文章 2022-02-24 81浏览量
  • 关于Kubernetes规划的灵魂n问

    还有近24%的客户选择的原因是:可以有更高的部署密度,从而降低基础设施成本。超过28%的客户认为,在物理上可以更加灵活地选择网络、存储等设备和软件应用生态。在公共云上,我们应该如何选择呢?2017年10月,阿里...
    文章 2020-01-31 778浏览量
  • 关于Kubernetes规划的灵魂n问

    还有近24%的客户选择的原因是:可以有更高的部署密度,从而降低基础设施成本。超过28%的客户认为,在物理上可以更加灵活地选择网络、存储等设备和软件应用生态。在公共云上,我们应该如何选择呢?2017年10月,阿里...
    文章 2020-02-05 3611浏览量
  • 关于Kubernetes规划的灵魂n问

    还有近24%的客户选择的原因是:可以有更高的部署密度,从而降低基础设施成本。超过28%的客户认为,在物理上可以更加灵活地选择网络、存储等设备和软件应用生态。在公共云上,我们应该如何选择呢?2017年10月,阿里...
    文章 2020-02-05 2287浏览量
  • 弹性计算双周刊 第15期

    弹性计算团队正在通过强化对于硬件服务器的管控能力,对操作系统的定制能力,和对故障隔离能力等等多个维度提升客户对稳定性的体验,宕机率大大降低,在业界遥遥领先。云栖大会弹性计算专场,新一代异构计算“昊天、...
    文章 2018-10-16 2667浏览量
  • 评估数据中心改造配电系统

    运维人员为此不断面临各种高难度的挑战,一方面要尽量减少各种运营支出,尽可能缩短设备宕机时间,一方面还要提高系统安全稳定性以及自身操作设备人身安全。一旦电力分配系统的情况被记录下来,就需对系统中需改造的...
    文章 2017-07-04 1378浏览量
  • 关于阿里云飞天计划的想法

    想要数据安全就必须保证系统不出问题&xff0c;保证文件系统不出错&xff0c;正常情况下对ECS操作很多的。包括&xff1a;升级服务器&xff0c;优化功能&xff0c;修改配置文件等&xff0c;很容易导致服务器出问题&xff08;人为原因&xff09...
    文章 2021-09-14 262浏览量
  • 网管必读:交换技术简介及应用分析

    并且要求网络系统宕机稳定可靠,不间断运行。要在注重考虑高性能、可管理性、高可靠性、适用性和性能价格比的基础上选择产品。2.邮电行业:电信系统由于其经营特点和为公众服务的目的,决定了电信系统机构在地理...
    文章 2017-11-22 864浏览量
  • 天梭M13为何具有大型水平的高可用性

    RAS特性是主机与一般服务器的主要区别,同时也是主机设计的一个难题,业界产品在技术上普遍具备了超过99.99%的高可用性,但是银行、保险、证券交易所等核心业务系统宕机事件仍时有发生。100%的可靠是不存在的,但...
    文章 2017-08-02 1562浏览量
  • 困知,勉行-阿里云服务观

    10月16日,面对现场8000余位开发者,阿里云技术领军者飞天负责人唐洪、技术保障负责人刘振飞、产品负责人张东晖直面阿里云在服务上出现的问题,并分别从技术、运维安全保障、产品等维度坦率地讲述发生问题的原因所在...
    文章 2016-12-25 3636浏览量
  • 走近华佗,解析自动化故障处理系统背后的秘密

    也可能Kernel出现类似208天的问题(Linux Kernel著名的一个Bug:系统连续运行208.5天自行重启),引起机器大批量的宕机。基于以上考虑,结合华佗自我保护机制,华佗引入Quota管理和手工驾驶,即当故障率超过华佗预设...
    文章 2016-12-18 4972浏览量
  • 游戏公司借助Veeam获得了24x7全天候可用性

    Como 表示,在软件升级损坏虚拟机时以及宕机时间超出 SLA 的要求范围时,Instant VM Recovery 变得尤为有用。他说:“Veeam 能够将一切恢复到之前的状态,也就是上一次备份时的数据状态,为 Take-Two 带来了稳定性和...
    文章 2017-08-09 1300浏览量
  • Linux常见安全策略与实践

    防止负荷过载造成服务器宕机。用户可以执行命令ulimit-a查看自己的的资源限制情况。2.4.加强Xinetd的安全 Xinetd是Linux系统一个传统的网络服务守护进程,它可以同时监听多个制定的端口,在接收到用户请求时,根据...
    文章 2017-08-15 2125浏览量
  • 重新定义数据库的时刻,阿里云数据库专家带你了解...

    网卡挂掉了,看上去像机器在系统中消失了,但本质上和宕机没有区别,因为宕机看上去也是机器突然消失了,所以在这种情况下,P问题就是A问题。第二种,机器的硬件不稳定,比如磁盘很卡导致响应请求很慢,这时候取决于...
    文章 2018-05-23 3248浏览量
  • 基于OneDNS实现上网安全防护和监控

    100%稳定宕机&xff0c;助力地产行业安全运维处置效率的提升。OneDNS的独特优势有哪些呢&xff1f;威胁拦截功能:基于微步在线海量高价值威胁情报&xff0c;能够以99.9%的准确性识别并阻止链接恶意软件远控地址、钓鱼地址、...
    文章 2022-05-31 27浏览量
  • 阿里云基础产品技术月刊 2019年3月

    阿里云区块链服务的定位是提供安全稳定的技术平台,构建可信的企业协作网络,链接可信数据。基于这一平台,阿里云区块链服务将协同众多优秀行业合作伙伴,共创垂直领域的业务解决方案,布局区块链行业生态。阿里云...
    文章 2019-04-11 4650浏览量
  • 阿里云基础产品技术月刊 2019年2月

    通过Blink实时流计算平台,已经在Blink平台上完成了内存故障预测模型的搭建,并打通数据反馈路径并将预测宕机的相关结果回流到阿里云日志服务(SLS)的日志中。后续计划和ECS的调度系统打通,增加系统中宕机风险的...
    文章 2019-03-13 3176浏览量
  • 任务管理入门:如何有效控制大规模设备

    集群的机器业务迭代必不可免的有发布的需求,同时机器也可能由于某种原因宕机,因此针对任务需要检测其状态并采用不同的策略进行充实。如图8所示: 任务执行时,节点上定时上报其上任务的心跳信息 任务管理集群的...
    文章 2021-08-24 251浏览量
1 2 3 4 ... 11 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化


http://www.vxiaotou.com