关于我
你好,我是 陈明天,一名关注后端、数据库基础设施与机器学习系统的软件工程师。目前在 卡内基梅隆大学 攻读信息网络硕士,预计 2026 年 12 月毕业。
我曾在 TikTok 担任 SDE II,拥有 3 年以上后端与数据库基础设施经验;目前在 TikTok Seattle 做 SDE 实习,方向是推荐系统召回基础设施。
我有一只叫薄荷的猫,他负责监督我写代码。
对了,他还有一个 AI 助手叫 Hachimi 🐝。这句话是我写的,博客里有些文章也是。
教育经历
卡内基梅隆大学
信息网络硕士 | 匹兹堡 | 2025.08 – 至今 | 预计 2026.12 毕业
相关课程:深度学习导论、机器学习系统、数据库系统、操作系统设计与实现、分布式系统。
北京工业大学
软件工程学士 | 北京 | 2018.09 – 2022.07
工作经历
软件开发工程师实习生,推荐基础设施
TikTok
2026.05 – 2026.08 | Seattle, WA
负责推荐召回基础设施,将多类 retriever 集成到统一召回中心,用于候选集生成。
软件开发工程师 II
TikTok
2024.10 – 2025.06
参与 ByteScale 核心模块开发,这是服务 10 PB+ 数据的 Go 云数据库中间件;主导 60+ 数据库、200+ TB 规模的自动扩缩容与迁移工作。
软件开发工程师 I
TikTok
2022.08 – 2024.10
使用 C++ 开发数据库核心模块,交付 resharding、升级、GTID 分配等方向的性能与可靠性改进。
软件开发实习生
美团
2021.06 – 2021.12
优化金融 ETL 流水线中的 Java/Spring 中间件性能与验证流程。
项目经历
BusTub 查询执行引擎
CMU 15-645
实现 scan、join、aggregation、window executor,并优化查询执行路径,最终获得课程 leaderboard 第 2 名。
x86 操作系统与 PebPeb Hypervisor
CMU 15-410
实现一个单核多线程 x86 操作系统,覆盖 25 个 syscall、round-robin 调度、虚拟内存、software exception delivery、键盘/定时器中断,以及带 autostack 支持的 pthread-style 用户线程库;并继续扩展出 PebPeb paravirtualization hypervisor,支持 exec_guest、hypercall dispatch 和面向 guest kernel 的 virtual interrupt delivery。
混合精度 KV Cache 压缩
CMU 15-642
提出 S4,用 attention saliency 同时指导长上下文 LLM KV cache 的 token 保留与逐 token 量化精度选择。
NVIDIA Blackwell CUDA GEMM Kernel 优化
CMU 15-642
实现 FP16 GEMM kernel,使用 async TMA load、software pipelining、warp specialization、cluster execution 与 Tensor Core execution。
语音到音素识别模型
CMU 11-785
构建 19.96M 参数的 attention-free ASR 模型,包含 CNN、BiLSTM、pyramidal BiLSTM、CTC decoding 与 SpecAugment。
技术栈
编程语言
CC++JavaPythonGo
SQLKotlinJavaScriptBash
基础设施 & 数据
MySQLPostgreSQLMongoDBRedis
InfluxDBElasticSearchKafkaRabbitMQ
RocketMQETL分布式数据库
框架 & 工具
Spring BootFlaskDjangoVue.js
DockerKubernetesAWSGrafana
GitHub ActionsThriftLinux