x

xiaolaohu

V1

2023/02/02阅读:29主题:红绯

OpenMMLab学习记录(一)

一、计算机视觉的应用

首先简单的介绍了计算机视觉应用的相关应用,cv的应用场景比较广,自己补充了一点也并不是很全。

  • 图像分类:也可以称为图像识别,顾名思义,就是辨别图像是什么,或者说图像中的物体属于什么类别。
image-20230202160533469
image-20230202160533469
  • 目标检测:目标检测通常包含两方面的工作,首先是找到目标,然后就是识别目标,如人脸识别等

    image-20230202160737165
    image-20230202160737165
  • 图像分割:基于图像检测的,它需要检测到目标物体,然后把物体分割出来。

  • 无人驾驶

    image-20230202160757256
    image-20230202160757256
  • 风格迁移:风格迁移是指将一个领域或者几张图片的风格应用到其他领域或者图片上。比如将抽象派的风格应用到写实派的图片上。

    image-20230202162234293
    image-20230202162234293
  • 图像重构:图像重构,也称为图像修复(Image Inpainting),其目的就是修复图像中缺失的地方,比如可以用于修复一些老的有损坏的黑白照片和影片。通常会采用常用的数据集,然后人为制造图片中需要修复的地方。

    image-20230202161321234
    image-20230202161321234
  • 图像生成:图像生成是根据一张图片生成修改部分区域的图片或者是全新的图片的任务。这个应用最近几年快速发展,主要原因也是由于 GANs 是最近几年非常热门的研究方向,而图像生成就是 GANs 的一大应用。

    image-20230202160844600
    image-20230202160844600
  • 文本生成图片:给出一段描述,然后生成图片;

    image-20230202161729326
    image-20230202161729326
  • 图文生成:给图片生成一段描述。

    image-20230202162035628
    image-20230202162035628

二、深度学习框架

OpenMMLab构建了深度学习时代最具影响力的开源计算机视觉算法体系。它旨在

  • 提供优质库,降低算法重实现难度
  • 创建针对各种后端和设备的高效部署工具链
  • 为计算机视觉研发打下坚实的基础
  • 用全栈工具链弥合学术研究和工业应用之间的差距
image-20230202162309482
image-20230202162309482
image-20230202162523297
image-20230202162523297

三、个人研究兴趣与方向

1、MMPose and MMHuman3D

image-20230202162706135
image-20230202162706135

2、MMEditing

image-20230202162727977
image-20230202162727977

四、本次课程学习内容

  • 训练器学习、训练流程使用、训练流程控制

  • 抽象模块使用

  • 数据接口使用

  • 日志与可视化

  • 神经网络部署

    后续继续跟进本次课程中涉及到的OpenMMLab库的使用方法、涉及到的算法解析等内容

分类:

人工智能

标签:

图像处理

作者介绍

x
xiaolaohu
V1