优先级从高到低排列,不是全部都要会,但前面的必须熟练。

第一层:Linux 系统(运维的命根子)

技术 具体内容 熟练程度要求
基本操作 cd、ls、cp、mv、rm、chmod、chown ✅ 肌肉记忆
用户权限 useradd、sudo、su、文件权限 rwx ✅ 必须会
进程管理 ps、top、htop、kill、systemctl ✅ 必须会
网络命令 ip addr、netstat、ss、curl、ping、traceroute ✅ 必须会
磁盘管理 df、du、fdisk、mount、lvm ⭐ 常用
文本处理 grep、awk、sed、tail -f、less ✅ 必须会
防火墙 iptables / ufw / firewalld ⭐ 常用
系统调优 ulimit、sysctl.conf、内核参数 ⭐ 进阶
Shell 脚本 bash 脚本,能写自动化脚本 ✅ 核心能力
Python 脚本 运维自动化、写小工具 ⭐ 强烈建议

一句话:Linux 不熟,运维干不了。这是入场券。

第二层:容器与编排(现代运维核心)

技术 具体内容 熟练程度要求
Docker 镜像构建、容器启动、docker-compose ✅ 必须会
Dockerfile 编写 Dockerfile 打包应用 ✅ 必须会
容器网络 bridge、host、overlay ⭐ 常用
容器存储 volume、bind mount ⭐ 常用
Kubernetes Pod、Deployment、Service、Ingress ⭐ 微服务必会
K8s 运维 kubectl 命令、排错、扩缩容 ⭐ 进阶
Helm K8s 包管理工具 ⭐ 进阶
Harbor 私有镜像仓库 ⭐ 常用

一句话:Docker 是现在运维的基本技能,K8s 是中大型项目的标配。

第三层:监控告警(出了问题要第一时间知道)

技术 用途 熟练程度要求
Prometheus 指标采集(CPU、内存、QPS、延迟) ✅ 必须会
Grafana 可视化面板,看数据 ✅ 必须会
Alertmanager 告警规则、钉钉/企微/邮件通知 ✅ 必须会
Node Exporter 采集服务器基础指标 ✅ 常用
Blackbox Exporter 探测服务是否存活 ⭐ 常用
Zabbix 传统监控,老项目还在用 ⭐ 了解即可

一句话:不会 Prometheus + Grafana,等于瞎运维。

第四层:日志收集(排查问题靠日志)

技术 用途 熟练程度要求
ELK Elasticsearch + Logstash + Kibana ⭐ 主流方案
Loki + Grafana 轻量级,跟 Grafana 集成好 ⭐ 推荐新项目用
Filebeat 采集日志文件发送到 ES/Loki ✅ 常用
日志规范 统一日志格式、打 traceId ⭐ 进阶

一句话:日志收不起来,出了问题就是大海捞针。

第五层:CI/CD 自动化发布(别手动部署)

技术 用途 熟练程度要求
GitLab CI 代码提交自动构建、测试、发布 ✅ 强烈建议
Jenkins 老牌 CI 工具,插件多 ⭐ 了解
GitHub Actions 云上 CI,简单项目够用 ⭐ 推荐
Ansible 批量配置服务器,自动化部署 ⭐ 核心能力
发布策略 蓝绿发布、滚动发布、灰度发布 ⭐ 必须懂

一句话:手动发布 = 定时炸弹,自动化是底线。

第六层:数据库运维(数据不能丢)

技术 用途 熟练程度要求
MySQL 主从复制 读写分离、高可用 ⭐ 必须懂
MySQL 备份恢复 mysqldump、xtrabackup ✅ 必须会
MySQL 慢查询优化 explain、慢查询日志 ⭐ 常用
Redis 运维 持久化 RDB/AOF、哨兵、集群 ✅ 必须会
Redis 监控 内存、连接数、命中率 ⭐ 常用
PostgreSQL 运维 基本管理、备份 ⭐ 了解

一句话:备份不做、主从不配,出事就是你的锅。

第七层:网络与安全(守住大门)

技术 用途 熟练程度要求
Nginx 进阶 反向代理、负载均衡、限流、HTTPS ✅ 必须会
SSL 证书 Let's Encrypt 免费证书、证书续期 ✅ 必须会
DNS 解析 域名配置、CDN ⭐ 了解
防火墙 iptables 规则、云安全组 ✅ 必须会
SSH 加固 密钥登录、禁 root、改端口 ✅ 必须会
入侵检测 Fail2ban、WAF ⭐ 进阶

第八层:进阶能力(加分项)

技术 用途 什么时候需要
Terraform 基础设施即代码(IaC) 团队规模大了需要
SkyWalking / Zipkin 链路追踪 微服务排查问题
ELK 日志分析 日志聚合查询 项目大了必须
云厂商工具 阿里云/腾讯云控制台、SLB、OSS 用云就得会
成本优化 缩容、预留实例、Spot 实例 省钱用

一张表看优先级

优先级 技术栈 一句话
🔴 P0 Linux + Shell + Docker 不会这个别说自己是运维
🟠 P1 Prometheus + Grafana + 监控告警 出了问题要立刻知道
🟡 P2 Nginx + CI/CD + 备份 发布和恢复要自动化
🟢 P3 K8s + 日志收集 + 安全 项目大了再深入
🔵 P4 Terraform + SkyWalking + 云厂商 高级运维/SRE 方向

现实建议:如果你是后端开发兼运维,先把 Linux + Docker + Prometheus/Grafana + Nginx + Shell 脚本 这五样吃透,能覆盖 80% 的运维场景。其余的等真遇到了再学,来得及。

Logo

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目,面向数字基础设施四大核心场景(服务器、云计算、边缘计算、嵌入式),全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐