Tatai 3.0:让任意服务器上的 Java 应用,拥有云原生级的高可用体验

从 2.0 的轻量运维面板到 3.0,Tatai 完成了一次关键进化:在不引入 Docker/K8s 的前提下,为传统服务器应用赋予“平滑升级、智能日志中心、硬件可观测”三大企业级能力

⚠️ 当前状态:Tatai 3.0 正在积极研发中,本文介绍的功能均已进入开发/设计阶段。欢迎关注、提出建议,也欢迎提前沟通使用场景。


🖼️ 效果预览(3.0 核心界面抢先看)

| 平滑升级控制台 | 日志中心 · 运维大盘 | Infrastructure 硬件视图(物理机专属) |

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

以上为设计示意图,实际界面以最终发布版本为准。


一、原生平滑滚动升级:发布业务零中断

以前

升级一个 Jar 包,要先停旧进程、上传新包、再启动。这几十秒的业务中断,在高峰时段可能就是几十笔订单失败。

现在

Tatai 3.0 内置了轻量级代理与 A/B 双槽位机制。您只需在 Web 界面点“平滑更新”,选择新 Jar 包:

  • 新版本在后台静默启动,并通过健康检查自动验证(HTTP / TCP)
  • 验证通过后,流量在 毫秒级 切换至新版本
  • 旧版本优雅退出,等待已有请求处理完毕

整个过程用户无感知,业务零中断。
如果新版本有问题,点击“回滚”即可秒级切回上一版本,无需重新上传。

您不需要学习 Docker、不需要配置 Nginx,Tatai 开箱即用。

适用场景

  • 生产环境 Jar 包升级,要求不停服
  • 团队没有容器化经验,但仍希望获得滚动更新能力
  • 需要一键回滚,降低发布风险

二、全新日志中心(LogCenter):从“看日志”到“管日志”

Tatai 3.0 将日志功能从应用管理中完全解耦,打造了一个独立的日志中心,提供全局视角的日志运维体验。

1. 运维大盘:一眼看清所有应用的日志健康度

进入日志中心,首先看到的是运维大盘

  • 以卡片或列表展示所有应用的日志健康摘要:最近 24 小时 ERROR 数、WARN 数、日志总量
  • 支持按时间范围(天/周/月)聚合,快速识别异常波动的应用
  • 点击任意应用可直接跳转到该应用的完整日志详情页

不再需要逐个应用翻日志——大盘直接告诉您“谁在出问题、什么时间开始的”。

2. 全量日志检索与分页查看

  • 支持百万行级归档日志的秒级分页浏览,内存永不溢出
  • 按文件名、时间范围、关键词过滤,精准定位问题
  • 实时日志流式推送(WebSocket),支持 tail -f 效果,且可随时暂停滚动

3. 智能多行合并(Java 堆栈友好)

  • 自动识别日志行首特征(如时间戳或 JSON 字段),将 Java 堆栈等碎片合并为完整条目
  • 支持传统文本格式和 JSON 格式,可自定义时间戳字段、级别字段

4. 一键打包下载 + 可选脱敏

  • 极速模式:直接流式压缩下载,GB 级日志几秒完成
  • 安全模式:对手机号、身份证、自定义敏感词进行脱敏,异步后台队列处理,不占用业务 CPU

5. 故障现场保留(自动 Profiling)

当自愈探针判定应用假死或资源耗尽时,Agent 会在杀死进程之前自动执行:

  • jstack 线程快照
  • 系统诊断命令(CPU、网络、文件句柄等)

这些现场信息与日志关联保存至日志中心,您可直接下载,交给开发精准定位——再也不用“重启后什么痕迹都没了”


三、硬件基础设施透视(Infrastructure 视图):给物理机用户的专属 HUD

💡 说明:本页面主要面向 物理机/裸金属服务器 用户,因为需要读取 CPU 温度、风扇转速、电源功耗等底层硬件传感器数据(云服务器和虚拟机通常无法提供)。但 Tatai 3.0 本身适用于所有服务器环境——云服务器和虚拟机用户同样可以完整使用平滑升级、日志中心、自愈探针、Master-Agent 管理等核心功能。

对于运行在物理机或裸金属上的应用,硬件状态往往是个黑盒。Tatai 3.0 专门为这类用户提供 Infrastructure 视图,以战斗机 HUD 风格实时展示:

  • CPU 核心温度与频率:热力图标识,高温自动预警
  • 内存 & Swap 用量:直观进度条
  • 磁盘 IOPS / 延迟
  • 风扇转速 & 电源功耗(需要硬件支持)
  • 网络入口/出口吞吐量

同时支持集群拓扑图:Master 统一纳管多台 Agent,点击任意物理机节点即可下钻查看该机器的硬件详情。

适合 IDC 运维、边缘计算、无人值守机房等物理机部署场景,让您对所有物理节点的健康状况一目了然。


四、架构升级:单机版进化为主从微集群

  • Master:提供 Web 界面、用户认证、数据存储、告警推送
  • Agent:极轻量守护进程(无数据库、无 Web),部署在各业务服务器上,负责执行命令、采集指标、转发日志

这意味着:您可以用一个 Tatai 控制台,管理成百上千台服务器(物理机、云服务器、虚拟机均可)上的应用,同时依然保持单机版一样的简单部署体验。


五、更多提升

  • 应用依赖感知与链式拉起:基础服务重启后,自动按顺序启动下游服务
  • 自愈熔断:如果应用启动即闪退,自动停止重试并发送高危告警
  • 告警通道内置:钉钉、企微、飞书、邮件,开箱即用
  • 中英文双语界面:国际化完整支持

写在最后

Tatai 3.0 不会变成笨重的商业软件。我们依然坚持:

  • 单二进制部署,无容器依赖
  • 资源占用极低(Agent < 50MB)
  • 开源免费,社区优先

平滑升级、智能日志中心、硬件透视——这三项能力不是概念堆砌,而是我们在服务真实用户后提炼出的刚需。

无论您用的是云服务器、虚拟机还是物理机,Tatai 3.0 都能为您的 Java 应用带来更现代、更可靠的运维体验。

如果您正被以下问题困扰:

  • 每次升级都要中断业务
  • 出问题拿不到现场信息
  • 物理机硬件状态不可见(额外增值)

不妨关注 Tatai 3.0 的进展。


当前状态:Tatai 3.0 正在研发中,预计 2026 年 Q3 发布首个预览版。欢迎提前沟通使用场景、反馈需求,我们一起打磨真正好用的运维工具。

📬 联系作者:wangqi@dlyuanli.cn
📦 项目地址:[GitHub - Tatai 3.0(即将开放仓库)]

让运维回归简单,让任意服务器拥抱云原生。

Logo

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目,面向数字基础设施四大核心场景(服务器、云计算、边缘计算、嵌入式),全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐