CV
杨润颀
数据分析 / 数据科学方向实习生
金融科技与分析硕士|计算机工程本科
手机号: 17705277078
电子邮箱:randyyang123@hotmail.com
居住地: 江苏省扬州市
教育背景
圣路易斯华盛顿大学(Washington University in St. Louis)
金融科技与分析 硕士
GPA:3.8 / 4.0
2025.08 – 2026.12
宾夕法尼亚州立大学(Pennsylvania State University)
计算机工程 本科
GPA:3.5 / 4.0
2020.09 – 2024.12
主修课程
金融科技与分析(硕士)
- 数据分析与可视化(Data Analytics & Visualization)
- 大数据系统与应用(Hadoop & Spark)
- 数据库系统基础 (SQL)
- 数据驱动决策与金融分析
- A/B 测试
- 数据挖掘
- 区块链/加密货币
计算机工程(本科)
- 数据结构与算法
- 操作系统
- 计算机网络
- 计算机组成原理
- 计算机视觉
- 人工智能
- 数字图像处理
工作经历
上海椰岛游戏 | 游戏测试
游戏测试部|2025.03 – 2025.08
- 游戏日志与数值分析:基于游戏运行日志,使用Excel对帧率、硬件温度、内存占用等核心指标进行版本对比与趋势分析,辅助定位性能瓶颈;结合抽卡机制与经济系统测试数据,对关键数值分布进行统计分析,为版本优化与参数调整提供数据参考。
- 缺陷数据统计:通过 Jira/Trello 管理Bug数据,利用 Excel 分析不同版本及模块的缺陷分布并输出报表 ;帮助团队识别高频问题模块,优化协作流程,提升版本稳定性 。
- 测试工作与数据处理:参与多款游戏的战斗系统、UI 交互等核心功能模块测试,设计并维护 120+ 条测试用例 ;系统性收集功能与兼容性数据,有效拦截多个潜在高风险/阻断性 Bug,保障版本按期高质量交付 。
江苏狄诺尼信息技术有限公司 | 软件研发实习
软件研发部|2024.05 – 2024.07
- 学习并参与 C++ / ObjectARX 二次开发,在 AutoCAD 环境中实现定制化功能
- 参与 AICAD 项目研发,使用 Python 调用大语言模型 API,协助实现 CAD 自动绘图功能
- 在项目中参与需求分析与技术实现,将业务需求转化为可执行的程序逻辑
项目经历
简易文件传输系统 | 个人项目
2023.01
- 基于 TCP/IP socket 编程 实现客户端–服务器文件传输系统
- 对文件传输过程中的 延迟与稳定性进行测试与对比分析,通过调整缓冲区大小优化传输性能
- 实现基础错误处理逻辑,提高系统在异常网络条件下的稳定性
技术栈:C / C++,TCP/IP,Linux
虚拟磁盘管理系统 | 团队项目
2023.02 – 2023.05
- 设计并实现基于 JBOD 思想 的磁盘管理模块,支持挂载、卸载与读写操作
- 构建缓存管理策略,实现数据查找、更新与 MRU 算法,有效提升磁盘访问效率
- 通过实验对比不同缓存策略下的系统性能,验证优化效果
技术栈:C / C++,Linux,缓存机制
基于 SRGAN 的超分辨率生成对抗网络研究 | 科研项目
2024.07 – 2024.08
- 使用 PyTorch 实现 SRGAN,用于图像超分辨率任务
- 通过实验对比不同超参数组合(学习率、批次大小、训练轮次)对模型效果的影响
- 在 Set5、Set14、BSD100 等数据集上评估模型性能,结果优于传统插值方法
技术栈:PyTorch,GAN,数字图像处理
Sheetz Cooler Sensor GUI – 库存可视化监控系统 | 校企合作项目
2024.08 – 2024.12
- 基于 Flask 开发在线库存监控系统,负责后端数据处理与前端展示逻辑
- 设计数据采集与传输流程,接收 Arduino 传感器数据并进行解析与存储
- 构建动态库存模型,优化数据解析与存储逻辑,确保系统在高负载下稳定运行
- 主导需求分析与软件架构设计,协调软硬件集成,提升系统可靠性
技术栈:Python,Flask,Arduino,HTML / CSS / JavaScript
可在此处查看Demo: 点击跳转Demo
电商用户复购预测 | 个人项目
2026.02-2026.03
- 项目背景:基于天猫用户行为日志数据(点击、收藏、加购、购买等),构建用户—商家复购预测模型,使用Python并通过机器学习方法识别“双11”活动中新产生的潜在复购用户,为商家制定精准营销策略提供数据支持,从而提升营销转化效率与用户复购率。
- 数据清洗预处理:针对双十一期间的 5400万+ 条用户行为明细日志,结合传统的Pandas并引入Polars库进行数据提取与清洗。有效解决了单机处理千万级数据的内存溢出痛点,将特征提取耗时大幅压缩。
- 特征工程与 EDA:构建包含用户全局购买力、店铺热度及“用户-商家”深度交互矩阵的特征体系。基于 Plotly 绘制相关性热力图开展探索性分析,发现常规统计特征相关性偏弱,精准定位“特定店铺的历史互动深度”为高潜复购的核心特征。
- 模型训练与调参优化:采用LightGBM构建二分类预测模型,对本进行复购概率预测;按8:2划分训练集与验证集,以AUC作为主要评估指标;通过Optuna贝叶斯优化调参,最终模型AUC≈0.68,相比基线模型,显著提升用户复购识别能力。
技术栈:Python, Polars, Pandas, LightGBM
用户及销售分析 | 个人项目
2025.11-2025.12
- 项目背景:该项目主要运用进阶SQL(窗口函数、视图构建、多表联结)诊断某电商平台业务的整体情况,重点分析用户及商品的相关数据,识别平台增长瓶颈并提出改进策略。进而设计AB Test对策略进行验证,提升平台的营收表现。
- 核心指标分析:基于平台的整体运营数据,对GMV、ARPU、DAU/MAU等关键指标进行了趋势分析。通过分析发现了业务的波动趋势和增长的疲软阶段,并制定了相关的促销和优化策略,以提升淡季销售。
- 用户分层分析:使用RFM模型细分用户群体,结合购买频次与金额构建 8 层 RFM 矩阵,下钻剖析重要价值用户的品类偏好及分期付款习惯,提出了针对不同用户群体的个性化营销建议。同时通过对用户支付流程的分析,建议支持更多本地化支付方式以及分期付款等提升用户转化率。
- 商品销售分析:利用商品交易额和评分数据,识别平台上各商品类别的销售情况。通过帕累托分析,建议重点提升高交易额品类的营销和客户服务,同时通过组合销售和捆绑销售策略来提高滞销商品的销售额,提升滞销商品的营收。
- 策略AB实验设计:设计ABTest方案,包含观测指标选取、样标本量和实验周期计算、分流策略以及显著性检验方法等,对如上提出的策略进行验证,完成完整的实验方案设计。
技术栈:SQL, AB Test
论文与研究
- Exploring SRGAN-Based Model for Image Super-Resolution(2024)
站内列表:Publications
技能
编程与数据分析
- 熟练使用 Python 进行数据分析,掌握 Pandas、NumPy 等常用数据分析库
- 熟悉常见数据清洗流程(缺失值处理、异常值识别、数据格式转换),能够基于业务问题构建分析指标
- 熟悉 SQL 基本语法,能够进行多表查询、聚合分析,并基于结果定位业务或数据问题
- 掌握 Tableau 的基础使用,能够制作常见数据可视化图表与简单交互式 Dashboard,用于支持数据分析结论展示
数据工程 / 系统基础
- 了解 ETL / ELT 数据处理流程,具备基础数据工程思维
- 熟悉 Linux 基本命令与开发环境
- 了解 Spark / Hadoop(HDFS、MapReduce) 的基本原理与使用场景
机器学习
- 熟悉常见机器学习模型的基本原理,包括线性回归、KNN、决策树、随机森林等
- 掌握 PyTorch,具备深度学习模型训练与评估经验
- 具备 大语言模型 API 调用与集成经验
语言能力
- 托福 102
- 可熟练使用英文进行技术交流与文档撰写
其他
- 熟练使用 Office(Word / Excel / PowerPoint)
- 熟悉计算机硬件组装
- 熟练使用 ChatGPT、Claude、DeepSeek-R1、Gemini 等大模型工具