聚焦 计算机视觉与多模态学习 方向,精通 PyTorch、TensorFlow 等主流深度学习框架,熟练应用 YOLO 系列、EfficientNet、BERT 等经典模型,在目标检测、图像增强、视觉语言融合等领域有深入研究。具备从算法研发到工程化落地的全链路能力,掌握模型训练、超参数调优、推理性能优化等关键技术,同时了解边缘设备与云端协同的部署方案,熟悉 Kubernetes 容器化部署流程。深耕学术研究与技术转化,在医学影像分析、罕见疾病图像识别等细分领域有专项积累,发表多篇相关技术论文,具备将前沿学术成果转化为教学案例的能力。
学员评价
项目经验四足机器人研发项目:主导视觉识别与语音交互模块开发,该项目为华清远见核心实训案例。基于 ESP32-S3 与 USB 摄像头搭建硬件平台,集成目标检测算法与自然语言处理模型,实现 “视觉识别 - 语音指令 - 动作响应” 的闭环交互,支持 “握手”“跟随” 等 10 + 语音指令,目标识别准确率达 95% 以上。医疗影像 AI 分析项目:参与胶质母细胞瘤术前 MRI 影像分析研究,基于病灶网络映射技术构建生存时间预测模型,通过融合多模态影像特征与临床数据,使预测误差降低 12%,相关研究成果已形成学术论文发表。罕见图像识别优化项目:提出 “提示反向学习” 技术方案,用于提升视觉语言模型对罕见图像的识别能力。通过优化模型注意力机制与数据增强策略,在特定数据集上使识别准确率提升 8.3%,解决小众场景下的数据稀疏问题。

