内容简介
本书以数字图像处理为基础,结合人工智能在电影制作中的应行编写,全书内容分为数字图像处理概论、人工智能在电影制作中的应用两大模块共12章。 本书所有拍摄素材均为编著团队实地拍摄或代码运行所得,其中图像基础部分是数字图像处理课程的核心内容含丰富的教学案例,是重要的学。 本书可作为数字媒体技术专业和电影制作专业课程的教材,也可作为电影技术培训班的培训教材,还可作为电影相关从业人员的参考用书。
目录
第1章 数字图像基础 1.1 数字图像处理的概念 1.2 数字图像处理的应用 1.3 图像数字化的概念 1.4 图像采样与量化 1.5 直方图 1.6 读取、显示和保存图像案例第2章 空域处理 2.1 点运算 2.2 代数运算 2.3 仿射变换第3章 频域处理 3.1 二维离散傅里叶变换 3.2 快速傅里叶变换 3.3 傅里叶变换中的高频低频分量 3.4 离散余弦变换 3.5 卷积定理 3.6 滤波器设计 3.7 卷积函数案例 3.8 中值滤波与维纳滤波第4章 图像边缘检测 4.1 边缘的定义 4.2 灰度阈值法分割 4.3 边缘检测案例第5章 图像压缩与编码 5.1 图像压缩概述 5.2 图像编码 5.3 图像压缩与传输模型 5.4 常见无损编码方式第6章 数学形态学 6.1 数学形态学的步骤与优势 6.2 与数学形态学相关的集合的基本概念 6.3 膨胀和腐蚀 6.4 开运算和闭运算 6.5 基本的形态学算法应用 6.6 灰度形态学第7章 基础 7.1 霍夫变换 7.2 拉东变换第8章 人工智能理论基础 8.1 人工智能的定义与发展 8.2 机器学 8.3 线回归 8.4 感知机与前馈神经网络 8.5 线判别分析 8.6 决策树 8.7 朴素贝叶斯 8.8 邻算法 8.9 支持向量机 8.10 聚类第9章 神经网络的简单实现 9.1 Python环境配置 9.2 数学函数库Numpy 9.3 神经网络框架Pytorch 9.4 卷积神经网络 9.5 手写数字识别 9.6 多分类任务第10章 光流网络 10.1 光流计算原理 10.2 Lucas-Kanade光流估计算法 10.3 Farneback稠密光流 10.4 光流数据集Flyingchairr/> 10.5 Flow网络 10.6 Flow2.0网络第11章 生成对抗网络 11.1 生成对抗网络概述 11.2 利用生成对抗网行超分辨率图像生成 11.3 利用生成对抗网行图像风格迁移第12章 神经网络综合应用 12.1 着色网络 12.2 Artline图像线框提取 12.3 人体姿态估计参考文献
摘要与插图
第pan style="font-family:宋体">章
数字图像基础
人类通过五官接收外界信息感知世界。通常情况下,七成以上的信息是通过视觉系统获取的。图像处理技术是对图像信行处理的技术。目前的图像处理技术主要是利用计算机对数字图行处理。
本章介绍图像处理技术的基础概念,图像数字化,直方图的基本概念和实验设计,并提供一组程序参考。本章中的内容是后续大部分内容的基础。
1.pan style="font-family:宋体">数字图像处理的概念
pan style="font-family:宋体">)图像的概念
图像作为人类视觉系统的基础,是人类用于感知世界的重要信息源。广义而言,图像是所有的光学等信息的合集,例如报刊书籍上的页面信息、影视作品中的画面等。随着探测器的发展,部分人眼无法感受到的非可见光范畴内的光波信号等也可行获取,例如红外线、紫外线、射线等,利用特殊的感知器获取这一类不可见信号的结果也可以视为图像。
2)模拟图像
模拟图像是利用方法获取到实际物质世界中光学信息后的结果。通常而言,这一类记录图像的方式都是利用物理及化学反应等方式直接记录光学信息,常见的便是胶
片等。
模拟图像本身的信息量极大,以普通面图像为例,模拟图像在二维坐标系中虽然是有限范围,但是在范围内可行无限细分。由于是物理方式记录,通常记录中不存在分辨率等影响,因此在传统影视摄像或者一些特殊领域内,可以利用极小的胶片放大出极高分辨率的图像。然而这种利用物理方式记录的信息,处理及保存都具有较高难度,这一点也导致模拟图像在发展中逐渐衰落、退出主流舞台的原因。
3)数字图像
数字图像是对模拟图行数字化后的结果。数字图像是将模拟图像中原本行无限细分的信行调整,转换为一个有限元素的矩行保存。这样的操作模式让数字图像可以在计算机行储存。因此,数字图像在图像信息上水远小于模拟图像,尽管如此,可以利用计算行储存传输处理的特使得数字图像逐渐流行。同时,随着感知器以及计算机技术的发展,数字图像的分辨率逐渐提升,对于人眼这个利用视觉细胞对光学信行感知的系统而言,数字图像已经可以达到模拟图像所能取得的信息程度,当前世界上为主要的图像都是以数字图像为基础。
4)数字图像处理
数字图像处理,是对数字图行处理,将图像转变为有限二维矩阵,利用计算机对矩阵内的数行处理获取信息或者对图行强化等,比起利用物理方式对模拟信号处理更为便利,操作的方式也更加多样化,这一领域也成为计算机科学中的一大分支。
数字图像处理主要可以分为两类。
类是对数字图像的内行分析,例如对图像中的场景、文字、人脸信息行识别,随后反映出所需要的信息。这一类技术常见于需要对图像内行提取的情况。这种处理情况下,输入的内容是数字图像,而输出的内容可能是一段文字,也可能是匹配结果的反馈,或者内容的坐标等。
类是对图像本行处理,例如提升分辨率、增强画面内容、去除不必要的冗余信息等。这一类技术目前常见于图像处理软件或者流媒体处理中。在这种处理情况下,输入的内容是数字图像,输出的内容也是数字图像。
1.2数字图像处理的应用
早期的计算机满足不了图像处理的要求,直到20世纪80年代,随着高速计算机和大规模集成电路的发展,图像处理技术趋于成熟,得到了广泛应用,90年代开始,数字图像处理的应用涉及人类生活的各个方面。图像压缩和多媒体技术的突破和发展、文本和图像分析和理解、文字和图像识别展、图像通信和传输的广泛应用等,数字图像处理技术取得广泛的开拓的发展入成熟应用阶段。2pan>世纪,随着人工智能技术的发展,数字图像处理正改变人们的生活方式。
当前,数字图像处理的应用含了航天航空、生物医学工程、通信、工业、军事、、教育、文化、艺术等各个领域。比如在航天航空中的遥感细分方向,数字图像处理在农林资源调查、农作物长势监测、自然灾害监测预报、地势地貌测绘、地质构造解译、环境污染检测等多领域应用。在医学影像方向,数字图像处理在X线成像、CT扫描、核磁共振、B超、内镜、等仪器中广泛应用。在影视领域,数字图像处理在拍摄系统、成像系统、动作捕捉系统、剪辑、二维跟踪、三维跟踪、绿幕抠像等和领域获得核心应用。
1.3图像数字化的概念
将模拟图像转换为数字图像的过程称为图像数字化。模拟图像本身是连续的数据,计算机中可以计算的数据尤其是保存的方式,必须存在一个计量单位。将原本连续的数据以……