马超云

高级大数据工程师上海

领导团队设计大型数据系统架构，并着手于机器学习模型的开发与部署。

主要项目：实时风险评估系统

带领团队建立了一个实时风险评估系统，用于分析实时交易数据，快速识别并回应潜在欺诈活动。

项目架构：使用Apache Kafka处理实时流数据，利用Apache Flink进行流数据的实时处理与分析，机器学习模型部署于Apache Spark MLlib以及TensorFlow Serving中。
技术栈：Scala, Kafka, Flink, Spark, TensorFlow, Kubernetes
个人职责：负责整体系统架构设计，实现实时数据处理流水线，开发和优化机器学习模型，并配合DevOps团队通过Docker和Kubernetes部署上线。同时，负责监控系统性能，保证系统稳定高效运行。

在数据狂潮科技担任初级大数据工程师，负责处理和分析大型数据集，设计并实施数据处理工作流。

主要项目：用户行为分析平台

构建了一个处理和分析用户行为日志的平台，该系统能够处理每日数十亿级别的事件日志。

项目架构：使用Hadoop HDFS存储日志文件，MapReduce进行初步的日志清洗，Hive用于实现数据仓库功能，利用Pig做一些复杂的数据转换，利用Spark SQL进一步深入分析。
技术栈：Java, Hadoop, Hive, Pig, Spark, Kafka（用于实时数据收集）
个人职责：负责搭建Hadoop集群环境，编写MapReduce作业进行数据清洗，以及通过Hive和Spark SQL来分析数据，生成报告供业务团队使用。