AIE310004: 计算机视觉
计算机视觉是一门研究如何让机器“看”的学科,是目前人工智能方向最热门、同时也发展最快的研究领域之一。本课程将通过介绍计算机视觉的基本问题,帮助学生掌握该领域的基本概念,基础知识和基本方法,为对计算机视觉感兴趣的学生从事相关领域研究打开一扇大门。课程还将通过经典文献阅读、经典算法与应用验证,锻炼学生在计算机视觉工程中的实际动手能力。
本课程涵盖了计算机视觉的发展历程,传统计算机视觉方法的介绍,包括传统计算机视觉特征和早期图像分类框架。同时,我们将深入探讨神经网络的基础知识,以及卷积神经网络、Transformer模型和扩散模型等神经网络结构。课程还将重点介绍基于卷积神经网络和Transformer的图像分类、目标检测和图像分割方法,以及最新的前沿内容,如大规模多模态预训练模型和视觉生成模型。除此之外,我们还将探讨在构建计算机视觉模型时可能遇到的实际问题,如模型参数过多、数据不均衡和领域差异等,并提供相应的解决方案。本课程包括三次实践课程,学生将有机会亲自动手搭建图像分类模型、目标检测模型和图像生成模型,以加深对课程内容的理解和应用能力的培养。