工作经历
上海哔哩哔哩科技有限公司 - 高级开发工程师 P2-2上海
2023/07 - 至今
- 独立负责混沌工程故障引擎 ChaosBlade 的二开和自研工作,满足规模化场景和复杂场景的故障模拟,支撑 150+ 应用完成混沌实验,帮助公司完成 2 次重大机房维度断网故障演练。
- 深度参与堡垒机架构升级和多活改造的技术设计和开发工作,实现堡垒机从重终端到轻终端的演进,解决陈年技术债务问题。
- 深度参与作业平台多活改造,重构文件上传/下载模块和作业区域拓扑路由管理模块,推进作业路由元信息的有效性治理。
- 使用 Dify 构建智能体工作流分析,作业执行失败原因、服务事故故障原因,提升 oncall 效率。
上海云刻行信息科技有限公司 - 软件工程师上海
2022/05 - 2023/07
跟随前司云服务总监创业,致力于打造机器人行业 SaaS 产品。
- 使用 Helm charts、Vault Cloud 和 GitHub Workflows 构建研发 CI/CD 流水线并持续优化性能并降低成本。
- 维护公司混合云 Kubernetes 集群和 Istio 服务网格 ,在此基础上帮助业务完成服务交付,认证授权,链路追踪等工作。
- 自建开源版本 Argo Workflows,熟练使用并掌握其工作原理, 参与优化 Workflow 的资源消耗,启动以及运行速度。在其基础上设计开发刻行自有的 CRD “CosRun”,满足用户在大批量数据处理,回归测试,机器人仿真等场景的需求,与已有数据平台进行深度集成,帮助公司实现获客。
上海高仙自动化科技发展有限公司 - 软件工程师上海
2021/09 - 2022/05
- 使用 NodeJS&Socket.io 和 Java&Ngrok 构建实时机器人控制系统,以较低的延迟实现远程 SSH 访问以进行维护。
- 使用 GitLab Pipelines 和 Kustomize 维护服务部署的 CI/CD 管道。
专业技能
云原生开发
- 熟悉 RESTful/gRPC API 的设计原则,能够开发基于 Go、Java 和 Python 语言的微服务。拥有三年使用诸如 protoc 和 Buf 等 gRPC 工具链的经验。
- 理解 Kubernetes operator 的工作原理,并且能够使用 kubebuilder 开发 Custom Resource Definition(CRD) operator。
- 理解 Kubernetes Container Runtime Interface(CRI)的底层原理,且在实践混沌工程的过程中具备相关的开发经验。
容器与编排技术
- 具备维护混合云 Kubernetes 集群的经验,熟悉基础的云服务产品。
- 拥有在生产环境中对 Kubernetes 节点和服务进行故障排查的丰富经验。
教育经历
上海海洋大学 - 学士计算机科学与技术
2016/09 - 2020/06
GPA:3.5/4。荣获推免名额。
个人项目
开源社区 chaosblade-io Maintainer
2025/09 - 至今
- 项目概述:ChaosBlade 是阿里巴巴开源的一款简单易用、功能强大的混沌工程实验注入工具,于 2021 年加入 CNCF Sandbox 项目,目前在 GitHub 上拥有超过 6.2k Stars,并在钉钉用户社群中聚集了 3200 余名活跃用户。
- 个人贡献:积极参与项目发展,共提交 33 个 Issue 和 41 个 Pull Request,涵盖功能优化、问题修复及文档完善等多个方面,为项目的稳定性和社区活跃度作出重要贡献。
- 社区认可:凭借持续的高质量贡献,获得社区全票通过的 Maintainer 晋升认可,彰显了在开源技术领域的专业能力和影响力。