-
运维收藏:日志标准化必须面对的 4 类问题
所属栏目:[经验] 日期:2021-05-27 热度:62
在很多安全分析类产品建设的过程中都会涉及到关联分析,比如日志分析、soc、态势感知、风控等产品。之前的文章中阐述过五种最常见的关联分析模型,在文中也介绍了:要想达到很好的关联分析效果,前提是对采集过来的日志进行标准化解析。解析的维度越多、内[详细]
-
怎样利用cron任务在Linux中计划和方便任务
所属栏目:[经验] 日期:2021-05-27 热度:195
有时,你可能需要定期或以预定的时间间隔执行任务。这些任务包括备份数据库、更新系统、执行定期重新引导等。这些任务称为 cron 任务。cron 任务用于自动执行的任务,它有助于简化重复的、有时是乏味的任务的执行。cron 是一个守护进程,可让你安排这些任[详细]
-
加薪,首先要提速,Linux shell的12个巧妙技巧让你运维熟练
所属栏目:[经验] 日期:2021-05-27 热度:62
对于管理员或用户而言,命令行不仅是可以完成所有任务的工具,而且还是可以永远开发的高度定制的工具。 最近,有一篇有关CLI中一些有用技巧的翻译文章。但是我觉得翻译人员没有足够的CLI经验,也没有遵循所描述的技巧,因此许多重要的事情可能会被遗漏或误[详细]
-
传授你一套秘籍,教你实现模拟弱网环境
所属栏目:[经验] 日期:2021-05-27 热度:174
运维过程中,最复杂的问题,莫过于网络的问题,而网络问题最烦的就是无法复现,这篇介绍一个强大的网络模拟工具Netem。 Netem是从linux 2.6以上内核版本开始提供的一个网络模拟功能模块,它主要用来在性能良好的网络环境中,模拟出复杂的网络传输性能,比[详细]
-
被变更伤害的码农,是如何成功自救的?
所属栏目:[经验] 日期:2021-05-27 热度:173
作为一个合格的码农,我们每时每刻都在为开发新功能、修复Bug、提升系统性能挥洒汗水。变更发布是产品迭代的必经之路,但是变化总伴随着风险,互联网公司轰动一时发生的大故障,往往跟变更有关。一半以上的故障是由变更引入的,毫无疑问,减少变更引入的故[详细]
-
超级全面的权限系统设计方案发布了
所属栏目:[经验] 日期:2021-05-26 热度:91
这是权限最基础也是最核心的模型,它包括用户/角色/权限,其中用户和角色是多对多的关系,角色和权限也是多对多的关系。 用户是发起操作的主体,按类型分可分为2B和2C用户,可以是后台管理系统的用户,可以是OA系统的内部员工,也可以是面向C端的用户,比如阿里云[详细]
-
涨工资,首先要提速,Linux shell的12个巧妙技巧让你运维高效
所属栏目:[经验] 日期:2021-05-26 热度:137
人们经常使用cut甚至awk只是通过模式或使用分隔符减去字符串的一部分。 另外,许多人使用$ {VARIABLE:start_position:length}进行子字符串bash操作,这非常快。 但是bash提供了一种使用#,##,%和%%来处理文本字符串的强大方法-它称为bash变量扩展。[详细]
-
安全强化你的Linux服务器的七个技巧
所属栏目:[经验] 日期:2021-05-26 热度:96
保护服务器安全的第一件事是更新本地存储库,并通过应用最新的修补程序来升级操作系统和已安装的应用程序。 在 Ubuntu 和 Debian 上: $ sudo apt update sudo apt upgrade -y 在 Fedora、CentOS 或 RHEL: $ sudo dnf upgrade 2、创建一个新的特权用户 接[详细]
-
加强你的 HTTPS,你需要这么做
所属栏目:[经验] 日期:2021-05-26 热度:154
其中,帧类型可以分为: DATA:用于传输HTTP消息体 HEADERS:用于传输首部字段 SETTINGS:用于约定客户端和服务端的配置数据。比如设置初识的双向流量控制窗口大小 WINDOW_UPDATE:用于调整个别流或个别连接的流量 PRIORITY:用于指定或重新指定引用资源的[详细]
-
容器监控系统如何做,一片文章告诉你答案
所属栏目:[经验] 日期:2021-05-26 热度:61
随着线上服务的全面docker化,对docker容器的监控就很重要了。SA的监控系统是物理机的监控,在一个物理机跑多个容器的情况下,我们是没法从一个监控图表里面区分各个容器的资源占用情况的。 为了更好的监控容器运行情况,更重要的是为了后续的容器动态调度[详细]
-
系统管理员爱不释手的6款服务器监控工具
所属栏目:[经验] 日期:2021-05-26 热度:75
Conky能在多个的平台上运行,像Windows,Linux,Mac OS,大多数BSD都可以。它有简单的文本、总线进度条,图形窗口不同字体和颜色来显示信息,用户界面简单,300多个内置对象,对于系统管理员来说是个神器。 2、Glances Glances是一个跨平台监控工具,它用P[详细]
-
核心网运维的困难
所属栏目:[经验] 日期:2021-05-26 热度:177
维护人员既要做分析、又要去操作,可能最后分析没做好、操作无法落实。维护人员就是解决设备问题。现有的运维机制是:设备产生告警、监控收告警派工单、维护人员处理工单、监控核实回单质量完成闭环。看似多么完美的管理流程。实际上,维护人员在看到告警[详细]
-
从基础搭建一个自动化运维体系
所属栏目:[经验] 日期:2021-05-26 热度:193
DevOps的出现有其必然性。在软件开发生命周期中,遇到了两次瓶颈。第一次瓶颈是在需求阶段和开发阶段之间,针对不断变化的需求,对软件开发者提出了高要求,后来出现了敏捷方法论,强调适应需求、快速迭代、持续交付。第二个瓶颈是在开发阶段和构建部署阶[详细]
-
Traefik mesh:更方便的服务网格
所属栏目:[经验] 日期:2021-05-26 热度:121
副标题#e# Traefik mesh没有通过sidecar的形式进行流量拦截或者修改,那是怎么实现的呢? 它其实是借助于CoreDNS,它通过修改CoreDNS的少量配置,让用于允许使用Mesh端点而不是标准的Kubernetes端点,Mesh端点和用于服务并行运行,用户可以选择是否使用它。[详细]
-
你要偷偷学会排查线上CPU飙高的情况,然后吓坏所有人!
所属栏目:[经验] 日期:2021-05-26 热度:80
通过上面的堆栈信息,可以看出,占用CPU资源的线程主要是卡在JDBC底层的TCP套接字读取上。连续执行了很多次,发现很多线程都是卡在这个地方。 通过分析调用链,发现这个地方是我代码中有数据库的insert,并且使用TDDL(阿里内部的分布式数据库中间件)来创[详细]
-
大数据理解:Docker虚拟化解析
所属栏目:[经验] 日期:2021-05-26 热度:74
一款产品从开发到上线,从操作系统,到运行环境,再到应用配置。作为开发+运维之间的协作我们需要关心很多东西,这也是很多互联网公司都不得不面对的问题,特别是各种版本的迭代之后,不同版本环境的兼容,对运维人员都是考验 .Docker之所以发展如此迅速,[详细]
-
Kubernetes上对应用程序进行故障解决的方案
所属栏目:[经验] 日期:2021-05-26 热度:160
从 Docker 迁移到 Docker Swarm,再到 Kubernetes,然后处理了多年来的所有各种 API 更改之后,我非常乐意发现部署中出现的问题和把问题进行修复。我今天分享下我认为最有用的5条故障排除技巧,以及一些其他的使用技巧。 kubectl 瑞士军刀 kubectl 就是我[详细]
-
Saltstack批量管理文件和实现
所属栏目:[经验] 日期:2021-05-26 热度:165
使用场景 在维护大量服务器的时候,系统一般初始化并上线以后,我们希望所有的服务器系统的某些配置文件一样,这时候我们需要一种工具来批量管理这些文件,保证配置文件的一致性,比如:/etc/resolv.conf这个文件。我们会希望这个文件不管在任何时候都是统[详细]
-
怎样在 CentOS/RHEL 系统中操作带 VLAN 标记的以太网卡
所属栏目:[经验] 日期:2021-05-26 热度:175
在某些场景中,我们希望在 Linux 服务器(CentOS/RHEL)的同一块以太网卡(NIC)上分配来自不同 VLAN 的多个 IP。这个可以通过使用 VLAN 标记接口来实现。但是要做到这一点,我们必须确保交换机的端口上连接了多个 VLAN,也就是说我们可以在交换机上添加多[详细]
-
如何更好地做好运维管理?
所属栏目:[经验] 日期:2021-05-26 热度:136
如果你已经在做运维管理工作或是正想往运维管理方向发展,那么请搬上板凳,带好瓜子听我娓娓道来。我能给出一些个人的建议,让你在运维管理的道路上少走弯路。如有问题也可以在留言区进行留言,大家一起讨论共同进步。 运维管理要做些什么 如果一名从基层[详细]
-
无数据,不上班!运维“数据思维”至关重要?
所属栏目:[经验] 日期:2021-05-26 热度:84
信通院的一些分析数据表明,企业IT的信息化历程逐渐完成,同时企业对IT的精益运行的需求越来越迫切,在这个场景下,数据的思维和使用能力成为制约提升IT生产效率的桎梏。 笔者以为,企业数字化的范畴放在运维领域,更多的场景还处在数据量化的扩展,因此除[详细]
-
浅谈监控,可观测性与数据存储
所属栏目:[经验] 日期:2021-05-26 热度:184
在实践中,所有这些概念/术语,目标都是增强工程师对于线上系统运行情况的了解。 对工程师而言,监控/可观测性工程存在的意义,是帮助工程师发现问题,定位问题,解决问题。 对系统自身而言,这些工作都是通过数据的采集/存储/分析,以及进一步迭代来完成[详细]
-
优秀的 Nginx 极简教程,覆盖了常用场景
所属栏目:[经验] 日期:2021-05-26 热度:199
nginx-sreopen重新打开日志文件。 nginx-cfilename为Nginx指定一个配置文件,来代替缺省的。 nginx-t不运行,而仅仅测试配置文件。nginx将检查配置文件的语法的正确性,并尝试打开配置文件中所引用到的文件。 nginx-v显示nginx的版本。 nginx-V显示nginx的[详细]
-
怎样从基础思考设计你的 DevOps 运维服务体系?
所属栏目:[经验] 日期:2021-05-25 热度:137
原始阶段,运维工程师与各部门无数的磨合、探索下,慢慢形成了最初的体系,其无形的规范着运维的工作和注意事项,工程师通过这个纲领开展日常工作并保障业务的健康发展,这个阶段可以说是制度为王、制度规范,没有系统的运维平台,有的只是零散的一些大小[详细]
-
关于故障复盘的一些经验
所属栏目:[经验] 日期:2021-05-25 热度:196
有句话说,常在河边走,哪有不湿鞋。我身边经常会看到不少数据故障。每每碰到这些问题,原因都是让人唏嘘不已。 而碰到故障的时候,除了通常都会说的后续改进,其实很多人对于问题的认识和理解还不够深入,这里主要包含几个方面: 1)害怕承担更多责任,会[详细]