• 走近华佗,解析自动化故障处理系统背后的秘密

    MaxCompute:阿里云数加-大数据计算服务,华佗用MaxCompute进行大规模系统故障的数据挖掘,用以提高故障检测准确率和预测故障发生。阿里云数加-大数据计算服务MaxCompute产品地址:...
    文章 2016-12-18 4972浏览量
  • 疫情期,APP 崩了怎么办?阿里工程师公开高可用架构...

    于运行态或已有应用可以通过 AHAS 探针形态(除AHAS SDK外更轻的方案)在不修改代码的情况下进行业务洪峰的流量强力控制、消息场景的削峰填谷,而对于结构复杂的可以将系统内或外不稳定的因素迅速降级让业务保持稳定...
    文章 2020-02-18 4675浏览量
  • 阿里云双11访谈之云数据库

    第二点就是稳定性,阿里云的服务得保证稳定性,无论是小到一个网卡的故障,大到一个机房的故障都能保证数据库的稳定性要求。第三点是用户的可用性。用户只需要在控制台上点击鼠标,就可以完成以前需要几个人甚至是...
    文章 2017-11-01 6866浏览量
  • HP compaq dx2708故障

    故障排除:问朋友发生故障前对机器进行了哪些操作?朋友说拆机前一直都用的很好,没有安装过新软件。没有蛛丝马迹,只有从上面的四个可能的故障原因里排 查。重启后,进入安全模式,运行msconfig命令,把启动项里...
    文章 2017-11-13 1515浏览量
  • 疫情期,APP 崩了怎么办?阿里工程师公开高可用架构...

    于运行态或已有应用可以通过 AHAS 探针形态(除AHAS SDK外更轻的方案)在不修改代码的情况下进行业务洪峰的流量强力控制、消息场景的削峰填谷,而对于结构复杂的可以将系统内或外不稳定的因素迅速降级让业务保持稳定...
    文章 2020-02-18 5620浏览量
  • 智能防盗报警系统前端报警设备的选择

    在市场上除了GSM全球移动报警主机可以不使用固定电话线以外,其它报警主机都需要使用城市固有的电话通信线路,这时就产生了防盗报警的隐患——万一电话线被剪断或者电话线路出现故障怎么办?报警主机的无线转发功能...
    文章 2017-07-05 3145浏览量
  • 如何做好一名稳定性SRE-业务团队系统稳定性的思与行

    3.做扁鹊:在系统发生问题时快速解决问题 2.自动化、系统化、数据化SRE不是在做一种收尾型、擦屁股的工作,而是在做一种探索性、前瞻性的工作,但SRE不可避免的,会面对很多重复性的工作,所以除了要在组织和机制上...
    文章 2020-10-26 7129浏览量
  • 再流弊的技术,也抵不过一次事故:兼谈技术管理

    系统越来越大、自动化和智能化程度越来越高,开飞机的人,水平跟不上,怎么办?机器再强大,也需要人来操作。你说是不?1.为什么运维更容易发生事故?其实相比运维,开发人员还是幸福的。开发更多关注功能、怎么快速...
    文章 2017-08-15 1707浏览量
  • SAP数据中心概述

    若单个元件出现故障,其正在服务的负载可以立即转移到其他元件上,不会影响系统稳定性。如果因火灾引发硬件故障,数据可以从备份系统中恢复。数据中心的消防措施:这么多服务器聚集在一起,万一着火了怎么办?数据...
    文章 2018-06-23 1729浏览量
  • 21世纪了还愚公移山?数据库这么迁移更稳定

    2、稳定性保障,迁库是大事,改造过程中,稳定性重中之重,主要有系统压测,线上流量回放,故障演练。系统压测:主要针对新库进行性能测,防止新库有意外情况。线上流量回放:Edsger W.Dijkstra说过如果调试程序是一...
    文章 2019-03-14 10702浏览量
  • 阿里云新品发布会周刊第...该怎么保护我们的数据信息安全

    服务器具有维护成本低,安全稳定,高可扩展性和 7 X 24 小时的售后支持的优势,因此云服务器成为中小企业建站的首要选择。国内的云服务器竞争也进入了跑马圈地的时代,以阿里云、腾讯云、百度云三大BAT为首,不断...
    文章 2020-05-16 374浏览量
  • 阿里云新品发布会周刊第...该怎么保护我们的数据信息安全

    服务器具有维护成本低,安全稳定,高可扩展性和 7 X 24 小时的售后支持的优势,因此云服务器成为中小企业建站的首要选择。国内的云服务器竞争也进入了跑马圈地的时代,以阿里云、腾讯云、百度云三大BAT为首,不断...
    文章 2020-05-16 2094浏览量
  • 2017QCon分享:从淘宝到云端的高可用架构演进

    这个给我们带来的启示是什么,云服务本身也是会发生故障的,比如买了云数据库,我们没有办法假设它是100%可用的,当它出现问题我们怎么办,是给云厂商提工单说什么时候能恢复,还是我自己能够有一个容灾的方案解决这...
    文章 2017-10-25 3005浏览量
  • ?分布式系统与单节点系统的本质区别是什么?

    如果系统故障发生时仍然能继续正常运行&xff0c;我们将这样的特性称为容错性。故障是不可避免的&xff0c;所以我们需要构建出具有可靠组件的系统。消除单点故障&xff0c;比如前文提到的单节点数据库&xff0c;可能是我们朝此...
    文章 2022-01-25 34浏览量
  • 轻松解决电脑死机故障攻略_软件

    这个我们遇到的最多,当DIRECTX9.0刚刚发布时,因为程序的编制不是很完善,同时对硬件支持的限制,一些使用WIN98系统的机器在安装该软件时,会经常出现蓝屏或死机现象,造成系统工作极不稳定 还有,一些游戏软件在...
    文章 2017-11-07 1110浏览量
  • 纯干货|从淘宝到云端的高可用架构演进

    这个给我们带来的启示是什么,云服务本身也是会发生故障的,比如买了云数据库,我们没有办法假设它是100%可用的,当它出现问题我们怎么办,是给云厂商提工单说什么时候能恢复,还是我自己能够有一个容灾的方案解决这...
    文章 2017-06-19 2266浏览量
  • 网络空间有别传统社会:治理需多方参与 遏制病毒传播居...

    15日,勒索病毒发生后的第四天,中央网信办网络安全协调局负责人表示,勒索病毒仍在传播,但速度已明显放缓,对广大用户而言最有效的应对措施是要安装安全防护软件,及时升级操作系统和各种应用的安全补丁。“相较于之前,...
    文章 2017-07-03 1636浏览量
  • 支付系统高可用架构设计实战,可用性高达99.999!

    系统发生OOM的时候&xff0c;就可以catch住这个异常&xff0c;从而避免这次OOM。3.1.2 某些环节快速失败“fail fast原则”Fail fast原则是当主流程的任何一步出现问题的时候&xff0c;应该快速合理地结束整个流程&xff0c;而...
    文章 2021-12-16 67浏览量
  • 信息系统项目管理01——信息化和信息系统

    (2)MMTR——平均维护时间,可维护性用此度量,这是系统发生故障后维修和恢复正常花费的平均时间。1.4 软件工程 1 需求 1 好的需求应该具有无二义性、完整性、一致性、可测试性、确定性、可跟踪性、正确性、必要性...
    文章 2020-12-11 200浏览量
  • 支付系统高可用架构设计实战,可用性高达99.999!

    系统发生OOM的时候&xff0c;就可以catch住这个异常&xff0c;从而避免这次OOM。3.1.2 某些环节快速失败“fail fast原则”Fail fast原则是当主流程的任何一步出现问题的时候&xff0c;应该快速合理地结束整个流程&xff0c;而...
    文章 2021-12-17 71浏览量
  • SAP数据中心概述

    不会影响系统稳定性。如果因火灾引发硬件故障&xff0c;数据可以从备份系统中恢复。数据中心的消防措施&xff1a;这么多服务器聚集在一起&xff0c;万一着火了怎么办&xff1f;数据中心被分为多个防火分区。数千个火灾探测器和...
    文章 2021-12-04 46浏览量
  • SAP数据中心概述

    不会影响系统稳定性。如果因火灾引发硬件故障&xff0c;数据可以从备份系统中恢复。数据中心的消防措施&xff1a;这么多服务器聚集在一起&xff0c;万一着火了怎么办&xff1f;数据中心被分为多个防火分区。数千个火灾探测器和...
    文章 2021-11-29 45浏览量
  • 车联网上云最佳实践(二)

    由于在高并发环境下,系统来不及同步处理,请求往往会发生堵塞,比如说,大量的insert,update之类的请求同时到达MySQL,直接导致无数的行锁表锁,甚至最后请求会堆积过多,从而触发too many connections错误。...
    文章 2018-08-22 2776浏览量
  • 阿里、万国、XDC+数据中心建设经验分享

    其次将数据中心所有的系统做到了标准化,每个数据中心软件是恒定的,每当总控制系统进行软件升级的时候,对它控制逻辑进行升级的时候,会同步升级到每一个数据中心的控制系统,来保障整体系统的软件版本始终是统一的...
    文章 2017-08-01 1858浏览量
  • 如何改变Redis用不好的误区

    对于安全的命令可以直接使用,对于不安全的命令需要分析和审批后才能打开,这也是由配置中心控制的,这样就解决了研发人员使用Redis时的规范问题,并且将Redis定位为缓存角色,除非有特殊需求,否则一律以缓存角色...
    文章 2017-12-20 5182浏览量
  • 《深入分布式缓存》之“从实际案例看Redis的使用”

    对于安全的命令可以直接使用,对于不安全的命令需要分析和审批后才能打开,这也是由配置中心控制的,这样就解决了研发人员使用Redis时的规范问题,并且将Redis定位为缓存角色,除非有特殊需求,否则一律以缓存角色...
    文章 2018-01-26 1137浏览量
  • 救火必备!问题排查与系统优化手册

    如果想从根源上规避问题,必须从系统本身出发:按照性能、稳定性和可维护性三个方向,持续优化你的系统实现,扼杀问题于摇篮之中,让自己每天都能睡个安稳觉。老板:既要快,又要稳,还要好。哦,工资的事你别担心,...
    文章 2020-07-13 2695浏览量
  • 车联网上云最佳实践(一)

    消息队列集群:由于在高并发环境下,系统来不及同步处理,请求往往会发生堵塞,比如说,大量的insert,update之类的请求同时到达MySQL,直接导致无数的行锁表锁,甚至最后请求会堆积过多,从而触发too many ...
    文章 2018-08-31 3093浏览量
  • 100个为什么让你了解分布式光伏发电

    分布式光伏系统并网需考虑安全、光伏配置、计量和结算方面的问题,在安全方面并网点开关是否符合安全要求、设备在电网异常或故障时的安全性能否在电网停电时可靠断开以保证人身安全。在光伏配置方面光伏容量的配置、...
    文章 2017-07-03 2448浏览量
  • [QCon讲稿实录]谈高质量架构产品化输出

    尤其是去年发生了多起IDC故障,用户对高可靠系统架构的需求格外高。所以针对这种情况,我们又推出了EWS服务,目的让用户能够简单的获取高质量架构的能力。首先来看一下EWS 的业务架构,EWS的全称是Enterprise ...
    文章 2016-04-25 5361浏览量
1 2 3 4 5 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化


http://www.vxiaotou.com