查看: 5937|回复: 18|关注: 0

[我分享] 集理论、算法、代码于一体,快速实现入门到精通的飞跃!

[复制链接]

181

主题

744

帖子

21

最佳答案
  • 关注者: 6
发表于 2016-9-19 23:18:44 | 显示全部楼层 |阅读模式
本帖最后由 dataminingwang 于 2017-8-27 15:41 编辑

《MATLAB计算机视觉与机器认知》简介:国家重点实验室项目实战积累与集体智慧结晶!

王文峰,中国科学院西部之光学者,中国自动化学会认知计算与系统专委会和中国人工智能学会认知系统与信息处理专委会委员、IEEE及Springer旗下多个国际会议委员及Session chair、国务院高端智库专家、国家自然科学基金项目评审专家、CV-MATH发起人。

阮俊虎,西北农林科技大学香江学者,香港理工大学博士后。长期从事数据挖掘、优化理论的应用研究,是有一定国际影响力的物联网与大数据专家,曾受邀担任多个SCI期刊的客座编委。

CV-MATH,由计算机视觉和数学研究者构成的研究小组,作为第三主编的成员有(按姓氏拼音顺序)何姣姣(昆明理工大学)、刘帅奇(河北大学)、马海菲(广东科技学院)、邵永胜(西安交通大学)、王平(南京航空航天大学)、伍鹏(长江大学)、余维(湖北科技学院)、曾凡玉(电子科技大学)、张锋(电子科技大学)、邹辉(华侨大学)。

刘衍琦,中科院计算所烟台分所工程师,长期从事大规模图像/声纹/视频检索及其大数据应用,对以图搜图、图文识别进行过深入研究及应用,曾主编和参编《MATLAB计算机视觉与深度学习实战》、《MATLAB图像与视频处理实用案例详解》等。

郭裕兰,国防科技大学电子科学学院教师,中国人工智能学会优秀博士学位论文获得者,研究方向为三维视觉与模式识别。已在TPAMI和IJCV等期刊及会议上发表学术论文50余篇,合作出版专著1部,担任TPAMI等30余个国际期刊的审稿专家,AAAI等多个国际会议的程序委员会委员,以及IEEE TPAMI期刊客座编辑。

王海洋,中科院计算所网络数据科学与技术重点实验室工程师,长期从事数据采集、信息检索、数据挖掘、情报分析等项目架构和实施,负责和参与天玑团队核心系统等战略项目,开发的网络信息采集软件已被2000多家企业使用。



王文峰

王文峰

阮俊虎

阮俊虎

CV-MATH

CV-MATH

刘衍琦

刘衍琦

郭裕兰

郭裕兰

王海洋

王海洋
第一届matlab应用展示大赛:激励;互助;高效

181

主题

744

帖子

21

最佳答案
  • 关注者: 6
 楼主| 发表于 2016-9-19 23:20:08 | 显示全部楼层
本帖最后由 dataminingwang 于 2017-8-27 09:40 编辑

内 容 提 要
这是一本用MATLAB演示计算机视觉原理的基础理论著作,从最初等的视频图像转换入手,层层递进,理论与实战并重但侧重于实战,借助混合编程及其图形用户界面(GUI)设计,以简洁的方式展现有一定挑战性的视频识别、目标跟踪、行为分析等关键视觉技术,同时扩展到机器认知层面,介绍仪器字符识别、机器故障诊断等有趣的应用,使读者在最短时间内完成入门、进阶、精通与实战的跨越!本书主编、副主编均在中国科学院、985工程大学国家重点实验室从事智能算法设计与应用,部分理论功底扎实的优秀研究生也参加了主要章节的编撰。本书既可作为算法工程师、高校教师和广大科技工作者的参考资料,也可作为相关专业研究生教材和高年级大学生毕业设计工具书。


全书分为九章,以计算机视觉为主,并延伸和扩展到机器认知,理论与案例实践并重,在有限的篇幅内尽可能对各技术模块的算法思想、建模过程、编程实现及GUI设计进行比较系统地介绍,具体内容架构如下:

第一届matlab应用展示大赛:激励;互助;高效

181

主题

744

帖子

21

最佳答案
  • 关注者: 6
 楼主| 发表于 2016-9-19 23:20:23 | 显示全部楼层
本帖最后由 dataminingwang 于 2017-8-27 09:41 编辑

【第一章】视频图像采集与读取。
本章介绍视频图像采集与读取等基础知识。数字视频图像处理是计算机视觉与机器认知的基础。通常图像数据有两个来源,一是由视频转换得到的图像序列,二是直接采集的图像数据。不管是哪一种图像数据来源,MATLAB都可将其以矩阵的形式读入工作空间,从而对视频图像的处理简化为对矩阵数据的处理。完成处理之后又可以通过图像显示这一环节将矩阵数据还原成图像,当然也可以将处理后的图像序列还原成视频。在MATLAB视频图像处理工具箱中就有一些相关函数可以直接使用,本章也提供了这些函数的主要用法及实例。考虑到本章所有函数和技术模块是全书的基础,所有代码均给出了详尽的注释。值得一提的是,本章介绍的视频图像转换同时也包含了用MATLAB设计GUI的主要思想及核心代码,后续各章节的GUI程序设计都是以此为基础,继续集成常用算法并完成衔接和扩展。
第一届matlab应用展示大赛:激励;互助;高效

181

主题

744

帖子

21

最佳答案
  • 关注者: 6
 楼主| 发表于 2016-9-19 23:20:37 | 显示全部楼层
本帖最后由 dataminingwang 于 2017-8-27 09:41 编辑

【第二章】视频图像变换及融合。
视频变换需要先把视频转换为图像,然后进行每一帧的图像变换,完成后再将图像转换为视频,因此这里只需要介绍图像变换。图像变换是指用数学建模的方法来描述图像位置、大小和形状等变化的方法。实际应用中,如果一幅图像的画面过大或过小,均需要对其进行缩小或放大处理。若拍摄时,景物与摄像头不成相互平衡关系的时候,图像会发生几何畸形,比如会将一个圆形拍摄成一个椭圆形。出现这样的情况后,需要对图像进行畸变校正。对目标物进行匹配时,需要对图像进行缩放、旋转、平移等变换。所以,图像变换作为图像处理和分析的基础是本章的重点内容,而图像融合作为一个补充内容。两个视频的融合需要先把两个视频分别转换为图像,然后,进行每一个对应帧的图像融合,完成后再将融合的图像转换为视频,因此这里只需要介绍图像融合。图像融合是把不同传感器的同一目标或同一场景的两幅或多幅图像进行综合,通过多幅图像间的互补信息的利用来提高图像的可用性、清晰度和可识别性,从而获得对同一场景目标更为准确、可靠、全面的图像描述,以便更适合人眼的观察,做进一步的技术处理。考虑读者基础的差异,本章代码注释仍然较为详细。
第一届matlab应用展示大赛:激励;互助;高效

181

主题

744

帖子

21

最佳答案
  • 关注者: 6
 楼主| 发表于 2016-9-19 23:20:53 | 显示全部楼层
本帖最后由 dataminingwang 于 2017-8-27 09:42 编辑

【第三章】视频图像噪声及处理。
视频和图像作为最常见的视觉信息的基本载体在人们的日常生活和工作中所起的作用越来越显要,这是其他信息所不能取代的。然而,在视频图像产生、传输,量化等过程中,自然图像常常会被引入各种噪声,进而导致视频和图像质量下降,大大增加了信息解译的复杂性,同时降低了视频图像的可编译性,影响了认知效果以及信息的可用性,给视频图像增强、复原、重建,识别等后续工作带来了严重的影响。视频噪声处理需要先将视频转换为图像,处理完成后再将减少噪声的图像转换为视频,因此这里仅需介绍图像去噪。主要介绍了图像去噪的算法设计思想及在工程应用中涉及到的一系列算法(包括均值滤波、中值滤波、小波阈值滤波、轮廓波变换和非局部均值滤波等),并借助MATLAB加以实现。本章开始接触到一些真实的工程应用,读者可以更好地理解算法原理,对于如何进行算法设计、数学建模,以及如何将算法表达为代码将有更加深刻的认识。
第一届matlab应用展示大赛:激励;互助;高效

181

主题

744

帖子

21

最佳答案
  • 关注者: 6
 楼主| 发表于 2016-9-19 23:21:07 | 显示全部楼层
本帖最后由 dataminingwang 于 2017-8-27 09:42 编辑

【第四章】视频图像阈值及分割。
图像分割(ImageSegmentation)是把图像分割成若干个特定的、具有独特性质的区域并提取出感兴趣的目标的技术和过程。在对图像的研究和应用中,人们往往仅对图像的某些部分感兴趣(目标或背景),它们一般对应图像中的特定的、具有独特性质的区域。为了分析和识别目标,需要将它们分割并提取出来。图像分割是由图像处理转到图像分析的关键。一方面,它是目标图像表达的基础,对特征测量有重要的影响。另一方面,图像分割和分割的目标表达、特征提取和参数测量等将原始图像转化为数学表达形式,使得利用计算机进行图像分析和理解成为可能。本章主要介绍图像分割的基本概念和分割所用的主要方法,具体包括边缘检测、灰度阈值分割、全局阈值分割、动态阈值分割和区域生长及分割等一系列常见的图像分割方法,在代码注释上,侧重于前几章没有注释过的技术模块,其它基础部分的代码注释被省略,甚至部分基础代码不予展示,以便适应读者进阶的过程与需求。

第一届matlab应用展示大赛:激励;互助;高效

181

主题

744

帖子

21

最佳答案
  • 关注者: 6
 楼主| 发表于 2016-9-19 23:21:26 | 显示全部楼层
本帖最后由 dataminingwang 于 2017-8-27 09:43 编辑

【第五章】图像特征计算与应用。
本章以人脸检测、行人检测等应用为例,主要对图像处理中的几个比较常用的特征提取方法及其应用实例进行介绍,这些常用的特征包括Haar-like特征、Hog特征、LBP特征以及SIFT特征。这些特征都各有优缺点,在使用的时候应该根据实际的场景进行选择,这样才能够在识别性能和运算性能之间找到平衡点。显而易见,本章已经开始接触一些相对高级的工程应用了,因此相应地,对于每个技术模块,都补充了相关基础定义、基础函数和基础模块的说明。在介绍Haar-like特征人脸检测之前,说明了Haar-like特征的种类、计算和个数;在介绍Hog特征行人检测之前,介绍了一些必要的准备工作,包括图像的预处理、梯度和滑动。为了适应读者进阶的需求,在本章的最后两节,基础介绍开始精减,重心转移到算法思想。在介绍利用LBP特征进行纹理分类之前重点介绍了LBP特征的演化;而在介绍利用SIFT特征进行模板匹配之前,侧重说明了SIFT算法的特点、设计框架与设计过程。
第一届matlab应用展示大赛:激励;互助;高效

181

主题

744

帖子

21

最佳答案
  • 关注者: 6
 楼主| 发表于 2016-9-19 23:21:39 | 显示全部楼层
本帖最后由 dataminingwang 于 2017-8-27 09:43 编辑

【第六章】运动目标检测及跟踪。
运动目标检测是计算机视觉与机器认知的一个重要环节,在计算机视觉的多个应用领域,诸如运动编码、行为分析及场景理解中,运动目标检测一直是研究的热点问题。运动目标检测的主要目的是将图像中的前景和背景分割开来,提取感兴趣的运动目标,并获取描述每一个运动目标特征的相关参数,为解决视觉问题提供必要信息。本章介绍运动目标检测及跟踪的算法设计思想、数学建模过程,并提供算法编程实现、拓展与优化。这一章开始接触到更实用、更高级的知识层面,读者经过前面几章的学习已经具备计算机视觉研究的基础,相应地,本章算法的介绍更加趋于具体化、系统化和数学化。介绍了运动目标检测及跟踪的算法设计思想、数学建模过程和算法编程实现、拓展与优化,其中数学建模过程具体介绍了帧间差分法建模和改进过程,其后的算法代码实现不仅包括了帧间差分法和改进的帧间差分法,而且考虑了一些特殊问题与对应的算法,并结合MATLAB编程实现。
第一届matlab应用展示大赛:激励;互助;高效

181

主题

744

帖子

21

最佳答案
  • 关注者: 6
 楼主| 发表于 2016-9-19 23:21:54 | 显示全部楼层
本帖最后由 dataminingwang 于 2017-8-27 09:44 编辑

【第七章】目标定位及字符识别。
这一章读者将开始接触到了机器认知层面的知识,具体算法是计算机视觉中的图像目标提取和识别。同时,有了前面七章的基础,这里我们不仅仅介绍图像目标提取和识别,同时也将深入地介绍视频识别与跟踪。除此之外,对于图像目标定位、提取和识别的算法思想也做了详尽的描述,而模型方面的介绍也趋于简单化,这就意味着从这一章开始,计算机视觉研究者开始尝试机器认知层面的应用,需要学会基于算法设计思想,自行完成机器认知相关的数学建模了。视频轨迹分析是目标识别与跟踪的延伸,为了帮助读者顺利完成计算机视觉到机器认知的过渡与衔接,从内容架构上分为图像目标提取与识别和视频识别与轨迹分析,其中图像目标提取与识别具体分为图像采集与目标检测、图像目标归一化处理与图像字符提取与识别,而视频识别与轨迹分析则分为问题描述与建模思想、算法功能与技术流程,最后提供了MATLAB进行视频人脸识别与跟踪的核心代码。
第一届matlab应用展示大赛:激励;互助;高效

181

主题

744

帖子

21

最佳答案
  • 关注者: 6
 楼主| 发表于 2016-9-19 23:22:04 | 显示全部楼层
本帖最后由 dataminingwang 于 2017-8-27 09:45 编辑

【第八章】机器故障认知与检测。
作为前几章的延伸,本章将进一步开阔机器视觉的研究和应用的思路。主要介绍如何用声音信息进行机器故障诊断。读者会惊喜地发现,这部分扩展应用不会占用太多的研究时间,可作为算法跨领域的扩展应用—与图像滤波去噪算法有很多的相似之处!这一章将一个实际应用案例作为一个专门模块进行系统全面地介绍,包括机器故障诊断的问题描述与建模思想、分析过程与编程实现。其中,分析过程与编程实现又具体到该问题的不同方面,包括齿轮振动信号的数字滤波处理、齿轮振动信号的频谱分析、波形分析中常用的有量纲指标、无量纲指标计算和齿轮振动信号的相关分析等。
第一届matlab应用展示大赛:激励;互助;高效
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

站长推荐上一条 /3 下一条

快速回复 返回顶部 返回列表