这张图说人张八是什么意思思?里面的数字说的是什么?计算机的

计算机是怎么知道两张图片相似的呢?
> 计算机是怎么知道两张图片相似的呢?
计算机是怎么知道两张图片相似的呢?
  很多搜索引擎可以用一张图片,搜索互联网上所有与它相似的图片。你输入网片的网址,或者直接上传图片,Google就会找出与其相似的图片。下面这张图片是美国女演员Alyson Hannigan。本文引用地址:    上传后,Google返回如下结果:    类似的&相似图片搜索引擎&还有不少,TInEye甚至可以找出照片的拍摄背景。    ===================================================  这种技术的原理是什么?怎么知道两张图片相似呢?  根据Neal Krawetz博士的解释,原理非常简单易懂。我们可以用一个快速算法,就达到基本的效果。  这里的关键技术叫做&感知哈希算法&(Perceptual hash algorithm),它的作用是对每张图片生成一个&指纹&(fingerprint)字符串,然后比较不同图片的指纹。结果越接近,就说明图片越相似。  下面是一个最简单的实现:  第一步,缩小尺寸。  将图片缩小到8&TI8的尺寸,总共64个像素。这一步的作用是去除图片的细节,只保留结构、明暗等基本信息,摒弃不同尺寸、比例带来的图片差异。    第二步,简化色彩。  将缩小后的图片,转为64级灰度。也就是说,所有像素点总共只有64种颜色。  第三步,计算平均值。  计算所有64个像素的灰度平均值。  第四步,比较像素的灰度。  将每个像素的灰度,与平均值进行比较。大于或等于平均值,记为1;小于平均值,记为0。  第五步,计算哈希值。  将上一步的比较结果,组合在一起,就构成了一个64位的整数,这就是这张图片的指纹。组合的次序并不重要,只要保证所有图片都采用同样次序就行了。    得到指纹以后,就可以对比不同的图片,看看64位中有多少位是不一样的。在理论上,这等同于计算&汉明距离&(Hamming distance)。如果不相同的数据位不超过5,就说明两张图片很相似;如果大于10,就说明这是两张不同的图片。  具体的代码实现,可以参见Wote用python语言写的imgHash.py。代码很短,只有53行。使用的时候,第一个参数是基准图片,第二个参数是用来比较的其他图片所在的目录,返回结果是两张图片之间不相同的数据位数量(汉明距离)。  这种算法的优点是简单快速,不受图片大小缩放的影响,缺点是图片的内容不能变更。如果在图片上加几个文字,它就认不出来了。所以,它的最佳用途是根据缩略图,找出原图。  实际应用中,往往采用更强大的pHash算法和SIFT算法,它们能够识别图片的变形。只要变形程度不超过25%,它们就能匹配原图。这些算法虽然更复杂,但是原理与上面的简便算法是一样的,就是先将图片转化成Hash字符串,然后再进行比较。  昨天,我在isnowfy的网站看到,还有其他两种方法也很简单,这里做一些笔记。    一、颜色分布法  每张图片都可以生成颜色分布的直方图(color histogram)。如果两张图片的直方图很接近,就可以认为它们很相似。    任何一种颜色都是由红绿蓝三原色(RGB)构成的,所以上图共有4张直方图(三原色直方图 + 最后合成的直方图)。  如果每种原色都可以取256个值,那么整个颜色空间共有1600万种颜色(256的三次方)。针对这1600万种颜色比较直方图,计算量实在太大了,因此需要采用简化方法。可以将0~255分成四个区:0~63为第0区,64~127为第1区,128~191为第2区,192~255为第3区。这意味着红绿蓝分别有4个区,总共可以构成64种组合(4的3次方)。  任何一种颜色必然属于这64种组合中的一种,这样就可以统计每一种组合包含的像素数量。    上图是某张图片的颜色分布表,将表中最后一栏提取出来,组成一个64维向量(7414, 230, 0, 0, 8, &, 109, 0, 0, 3415, 53929)。这个向量就是这张图片的特征值或者叫&指纹&。  于是,寻找相似图片就变成了找出与其最相似的向量。这可以用皮尔逊相关系数或者余弦相似度算出。  二、内容特征法  除了颜色构成,还可以从比较图片内容的相似性入手。  首先,将原图转成一张较小的灰度图片,假定为50&TI50像素。然后,确定一个阈值,将灰度图片转成黑白图片。    如果两张图片很相似,它们的黑白轮廓应该是相近的。于是,问题就变成了,第一步如何确定一个合理的阈值,正确呈现照片中的轮廓?  显然,前景色与背景色反差越大,轮廓就越明显。这意味着,如果我们找到一个值,可以使得前景色和背景色各自的&类内差异最小&(minimizing the intra-class variance),或者&类间差异最大&(maximizing the inter-class variance),那么这个值就是理想的阈值。  1979年,日本学者大津展之证明了,&类内差异最小&与&类间差异最大&是同一件事,即对应同一个阈值。他提出一种简单的算法,可以求出这个阈值,这被称为&大津法&(Otsu&s method)。下面就是他的计算方法。  假定一张图片共有n个像素,其中灰度值小于阈值的像素为 n1 个,大于等于阈值的像素为 n2 个( n1 + n2 = n )。w1 和 w2 表示这两种像素各自的比重。  w1 = n1 / n  w2 = n2 / n  再假定,所有灰度值小于阈值的像素的平均值和方差分别为 &1 和 &1,所有灰度值大于等于阈值的像素的平均值和方差分别为 &2 和 &2。于是,可以得到  类内差异 = w1(&1的平方) + w2(&2的平方)  类间差异 = w1w2(&1-&2)^2  可以证明,这两个式子是等价的:得到&类内差异&的最小值,等同于得到&类间差异&的最大值。不过,从计算难度看,后者的计算要容易一些。  下一步用&穷举法&,将阈值从灰度的最低值到最高值,依次取一遍,分别代入上面的算式。使得&类内差异最小&或&类间差异最大&的那个值,就是最终的阈值。具体的实例和Java算法,请看这里。  ?  有了50&TI50像素的黑白缩略图,就等于有了一个50&50的0-1矩阵。矩阵的每个值对应原图的一个像素,0表示黑色,1表示白色。这个矩阵就是一张图片的特征矩阵。  两个特征矩阵的不同之处越少,就代表两张图片越相似。这可以用&异或运算&实现(即两个值之中只有一个为1,则运算结果为1,否则运算结果为0)。对不同图片的特征矩阵进行&异或运算&,结果中的1越少,就是越相似的图片。
分享给小伙伴们:
我来说两句……
微信公众号二
微信公众号一计算机的一个?“”中的?是什么意思_百度知道
计算机的一个?“”中的?是什么意思
计算机的一个?“”中的?是什么意思
答题抽奖
首次认真答题后
即可获得3次抽奖机会,100%中奖。
类class是一种面向对象的程序设计语言中,对具有相同属性和方法的一组对象的集合。它为属于该类的所有对象提供了统一的抽象描述。类是对象的模板,对象是类的实例。举个通俗的例子车,是一个概念,但不是一个具体的对象,这就是一个类。它有自己的属性,如有轮子,能行驶,能载物,交通工具。(属性,方法,事件)而某人的一台车,就是一个具体的对象,是类的一个具体的实例。它继承了车这个类的属性。有轮子,能行驶,能载物,交通工具等等。。。同时它也可以具有自己的属性,方法,事件等。从若干台车抽象出总体的属性和方法的集合,就是类了。
百度知道合伙人官方认证企业
主营:互联网教育 初高中生教育 电脑培训 就业指导 大学生培训
为您推荐:
其他类似问题
换一换
回答问题,赢新手礼包
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。关于计算机c语言, 这幅图中的%-6.2e是什么?那个1.23e+002又怎么看?求解_百度知道
关于计算机c语言, 这幅图中的%-6.2e是什么?那个1.23e+002又怎么看?求解
答题抽奖
首次认真答题后
即可获得3次抽奖机会,100%中奖。
%-6.2e;-6左对齐6个字符位置;
.2保留小数点后2位有效值; e采用以10为底的幂表示法;如=3.^4表达为:(左对齐6个字符位置)3.52e+4
采纳率:83%
来自团队:
为您推荐:
其他类似问题
换一换
回答问题,赢新手礼包
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。莱布尼兹发明计算机,看到了中国的一张图后“开窍”
莱布尼兹发明计算机,看到了中国的一张图后“开窍”
博大精深的《易经》,不仅影响了中国的一大批先贤,还在影响着世界。
早在17世纪,欧洲一批数学家,就已开始设计和制造以数字形式进行基本运算的数字计算机。
1642年,为了协助担任税务局长的父亲,年仅19岁的法国数学家帕斯卡,成功地制造了第一台钟表齿轮式机械计算机,但仅能做加减法运算。
在此基础上,德国数学家、哲学家莱布尼兹,于1678年发明了可做乘除运算的计算机,进一步解决了十进制数的乘、除运算。
虽然,这些机械的计算机性能还过于落后,远远满足不了人们的需要。
但为以后的计算机发展奠定了坚实的基础。
当时,莱布尼茨计算机的研究,并没不容易,也不顺利。
受到《易经》“阴阳谓之道”的启发,莱布尼茨注意到了“二进制”。
但在研制乘除法计算时,莱布尼茨反复试验,却总无法提高计算机的运行速度。
如何用一种更适合机器运算的记数方法,这让莱布尼茨陷入了困境和深深思考中。
冥想苦想很久,莱布尼茨又一次想到了中国的《易经》。
于是,他向远在中国的朋友白晋神父求助。
白晋神父得知后,从中国寄给了他一张神秘的方圆图。
这是一张什么样的图呢?
能引起莱布尼茨的注意和兴趣,并从中受到灵感启发?
原来,白晋神父寄给莱布尼茨的是一张伏羲先天八卦图。
受到八卦图的启迪,莱布尼茨还读到了《易经》64卦,并从阴阳卦爻中再次启发。
《易经》系辞说:是故易有太极,是生两仪,两仪生四象,四象生八卦。
在复杂《易经》中,其图案只由简单的“——”和“-- --”符号组成。
符号“——”代表阳爻,也代表数字“1”;
符号“-- --”代表阴爻,也代表数字中的“0”。
毫无疑问,电子计算机是人类历史上最伟大的发明之一。
而计算机,采用二进制的记数方法,就是“0”和“1”组成。
由此,我们可以得知莱布尼茨的计算机理论,就来源于中国的《易经》。
(原创声明:未经许可,禁止进行刊载、摘编、复制及建立镜像等任何使用。如需刊载,请通过本平台留言获得授权。)
责任编辑:
声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
今日搜狐热点由于时常有本科学生来向笔者询问计算机图形学是做什么的,为了使得学生能够快速了解计算机图形学,有利于他们在选择研究生方向做出适合自己的选择,特撰写此文。本文仅仅为笔者对计算机图形学浅薄的理解,不涉及对概念的定义,是非学术性的。因此,笔者尽量尝试用通俗的语言介绍一下计算机图形学的内容及其应用,以帮助还未接触计算机图形学领域的学生来了解该学科方向。笔者对其中的有些内容的理解也是很有限的,值得进一步的学习和交流。有不当之处,还请读者谅解指正。
一、什么是计算机图形学?
&& 什么是计算机图形学?计算机图形学(Computer
Graphics,简称CG)的内容比较丰富,与很多学科都有交叉,因此笔者认为是无法严格定义的。
在“Wiki百科”和“百度百科”上,对“计算机图形学”的解释为:计算机图形学是一种使用数学算法将二维或三维图形转化为计算机显示器的栅格形式的科学。简单地说,计算机图形学的主要研究内容就是研究如何在计算机中表示图形、以及利用计算机进行图形的计算、处理和显示的相关原理与算法。虽然通常认为CG是指三维图形的处理,事实上也包括了二维图形及图像的处理。
狭义地理解,计算机图形学是数字图象处理或计算机视觉的逆过程:计算机图形学是用计算机来画图像的学科,数字图象处理是把外界获得的图象用计算机进行处理的学科,计算机视觉是根据获取的图像来理解和识别其中的物体的三维信息及其他信息。
注意,这些都是不确切的定义,实际上,计算机图形学、数字图象处理和计算机视觉在很多地方的区别不是非常清晰,很多概念是相通的,而且随着研究的深入,这些学科方向不断的交叉融入,形成一个更大的学科方向,可称之为“可视计算”(Visual
Computing)。这是后话,此处不详述。
二、计算机图形学的主要内容
在学科开创之初,计算机图形学要解决的是如何在计算机中表示三维几何图形,以及如何利用计算机进行图形的生成、处理和显示的相关原理与算法,产生令人赏心悦目的真实感图像。这是狭义的计算机图形学的范畴。随着近40年的发展,计算机图形学的内容已经远远不止这些了。广义的计算机图形学的研究内容非常广泛,如图形硬件、图形标准、图形交互技术、光栅图形生成算法、曲线曲面造型、实体造型、真实感图形计算与显示算法,以及科学计算可视化、计算机动画、自然景物仿真、虚拟现实等。
根据笔者的理解,计算机图形学主要包含四大部分的内容:建模(Modeling)、渲染(Rendering)、动画(Animation)和人机交互(Human–computer
Interaction, HCI)。
1、建模(Modeling)
要在计算机中表示一个三维物体,首先要有它的几何模型表达。因此,三维模型的建模是计算机图形学的基础,是其他内容的前提。表达一个几何物体可以是用数学上的样条函数或隐式函数来表达;也可以是用光滑曲面上的采样点及其连接关系所表达的三角网格来表达(即连续曲面的分片线性逼近),如下图所示。
三维建模方法主要包含如下的一些方法:
l计算机辅助设计(CAD)中的主流方法是采用NURBS(非均匀有理B-样条、Bezier曲线曲面)方法(已成为CAD工业领域的标准),这也是计算机辅助几何设计(CAGD)所研究的主要内容。此类表达方法有一些难点问题仍未解决,比如非正规情况下的曲面光滑拼合,复杂曲面表达等。这部分涉及的数学比较多,国内做这块的学者比较多些。
l细分曲面(Subdivision
surface)造型方法,作为一种离散迭代的曲面构造方法,由于其构造过程朴素简单以及实现容易,是一个方兴未艾的研究热点。经过十多年的研究发展,细分曲面造型取得了较大的进展,包括奇异点处的连续性构造方法以及与GPU图形硬件相结合的曲面处理方法。
利用软件的直接手工建模。现在主流的商业化的三维建模软件有Autodesk
3D Max和 Maya。其他还有面向特定领域的商业化软件,比如面向建筑模型造型的Google
Sketchup,面向CAD/CAM/CAE的CATIA和AutoCAD,面向机械设计的SolidWorks,面向造船行业的Rhino等。这些软件需要建模人员有较强的专业知识,而且需要一定时期的培训才能掌握,建模效率低而学习门槛高,不易于普及和让非专业用户使用。
基于笔划或草图交互方式的三维建模方法。草图交互方式由于其符合人类原有日常生活中的思考习惯,交互方式直观简单,是最近几年研究的热点建模方法。其难点是根据具体的应用场合,如何正确地理解和识别用户的交互所表达的语义,构造出用户所希望的模型。
基于语法及规则的过程式建模方法。特别适合具有重复特征和结构化的几何物体与场景,比如建筑、树木等。最近几年有较多的论文及较大的发展。
基于图像或视频的建模方法。这是传统的计算机视觉所要解决的基本问题。在计算机图形学领域,这方面的发展也很迅速。有一些商业化软件或云服务(比如Autodesk的123D),已经能从若干张照片重建出所拍摄物体的三维模型。该方法的问题是需要物体本身已经存在,而且重建的三维模型的精度有限。
l基于扫描点云(深度图像如Kinect、结构光扫描、激光扫描、LiDAR扫描等)的建模(Reconstruction)方法。随着深度相机的出现及扫描仪的价格迅速下降,人们采集三维数据变得容易,从采集到的三维点云来重建三维模型的工作在最近几年的Siggraph(Asia)上能常见到。但是,单纯的重建方式存在精度低、稳定性差和运算量大等不足,远未能满足实际的需求。
基于现有模型来合成建模的方法。随着三维模型的逐渐增多,可以利用现有的三维模型通过简单的操作,比如cut
and paste,或者分析及变形等手段,来拼接或合成新的三维模型。这种通过“学习”模型数据库的知识来进行建模的手段在近3-5年里研究得非常热门。从某方面来讲,就是“大数据时代”背景下计算机图形学领域中的一个具体的表现。
除了上述的这些建模方法,还有其他的一些建模方法,在此不再一一列举。
在对三维几何模型的构建过程中,还会涉及到很多需要处理的几何问题,比如数据去噪(denoising
or smoothing)、补洞(repairing)、简化(simplification)、层次细节(level
of detail)、参数化(parameterization)、变形(deformation
or editing)、分割(segmentation)、形状分析及检索(shape
analysis and retrieval)等。这些问题构成“数字几何处理”的主要研究内容。笔者自2005年起开设了多年的《数字几何处理》的研究生课程:
虽然有上述所提到的这么多的三维建模方式,但是至今为止,仍没有适合一般家庭用户的轻松简单的建模工具。现有的电子设备(比如相机,手机等)能够帮助人们轻松获得图像和视频,但是,不是人人都有能力来构建三维几何模型。如何让大众能够像获取图像那样能够随时随地地获取或者构建三维模型,仍然是计算机图形学的任重道远的主要任务之一!今天,计算机图形学仍未进入“大数据时代”。只有让大众能够轻松进行三维建模,并上载分享他们所构建的模型数据,计算机图形学才可能进入大数据时代。
另外,随着三维打印(3D
printing)的新兴技术的逐渐普及,人们对三维模型的需求也日益增加。笔者个人认为,几何建模和三维打印的未来是共呼吸,同命运的:也只有当人人都能轻松建模时,三维打印才有可能走向千家万户。
三维几何建模的任务仍然任重道远,大家仍需共同努力!
3、动画(Animation)
动画是采用连续播放静止图像的方法产生物体运动的效果。计算机动画借助于编程或动画制作软件生成一系列的景物画面,是计算机图形学的研究热点之一。研究方向包括:人体动画,关节动画,运动动画,脚本动画,具有人的意识的虚拟角色的动画系统等。另外,高度物理真实感的动态模拟,包括对各种形变、水、气、云、烟雾、燃烧、爆炸、撕裂、老化等物理现象的真实模拟,也是动画领域的主要问题。这些技术是各类动态仿真应用的核心技术,可以极大地提高虚拟现实系统的沉浸感。计算机动画的应用领域广泛,比如动画片制作,广告、电影特技,训练模拟,物理仿真,游戏等。
网上的一些3D动画的视频:
Larva虫虫:
The Killer Bean:
房地产动画广告宣传片:
4、人机交互(Human–Computer
Interaction, HCI)
人机交互(Human-Computer
Interaction, 简写HCI)是指人与计算机之间以一定的交互方式或交互界面,来完成确定任务的人与计算机之间的信息交换过程。简单来讲,就是人如何通过一定的交互方式告诉计算机来完成他所希望完成的任务。
计算机图形学的顶级会议ACM
SIGGRAPH是“ACM
Special Interest Group on GRAPHics and Interactive Techniques”的缩写,缩写中只包含了Graphics,而忽略了Interactive
Techniques,在长时间没有得到计算机图形学研究的重视。最近,包括在SIGGRAPH会议上,以及人机交互的顶级会议SIGCHI上,陆续出现了许多新兴的人机交互技术及研究论文。大家逐渐重视起来。
在早期(上个世纪60-70年代),只有以键盘输入的字符界面;到了80年代,以WIMP(窗口、图符、菜单、鼠标)为基础的图形用户界面(GUI)逐渐成为当今计算机用户界面的主流。
近年来,以用户为中心的系统设计思想,增进人机交互的自然性,提高人机交互的效率是用户界面的主要研究方向。陆续提出了多通道用户界面的思想,它包括语言、姿势输入、头部跟踪、视觉跟踪、立体显示、三维交互技术、感觉反馈及自然语言界面等。
事实上,人体的表面本身就是人机界面。人体的任何部分(姿势,手势,语言,眼睛,肌肉电波,脑波等)都可以成为人机对话的通道。比如2010年微软出的Kinect就是一种无需任何操纵杆的基于体感的人机界面,用户本身就是控制器。Kinect在微软的Xbox游戏上取得了极大的成功,之后在其他方面也得到了很多的应用。
特别是到了今年(2013年),人机交互设备有了巨大的发展,各种自然的交互手段层出不穷,极大地丰富了用户与机器交互的体验,方便了用户的操作,轻松表达了用户的交互意图。可以说,
我们正处在图形与交互技术极速发展的浪尖!
以下是最近几年(特别是今年)出现的一些值得关注的新兴的人机交互设备:
lMicrosoft Kinect:
1)Kinect由微软于2010年推出的对XBOX360体感外设,它不需要使用任何控制器,仅依靠相机捕捉三维空间中玩家的运动,同时它导入了即时动态捕捉、影像辨识、麦克风输入、语音辨识、社群互动等功能。Kinect彻底颠覆了游戏的单一操作。使人机互动的理念更加彻底的展现出来。之后,基于Kinect的各种应用像雨后春笋般的冒出来,包括人机交互,手势识别,几何建模等。
2)在2013年5月28日的Xbox
One发布会上,微软展示了新一代Kinect
2.0,新 Kinect能感知的语音、手势和玩家感觉信息,将给玩家带来前所未有的互动性体验:
lLeap Motion:
Leap Motion为放在键盘和显示器之间的小小金属棒,就能让任何一位用户通过简单的手势完成人机交互。Leap
的响应惊人的准确,对各种自然而简洁的手势都能识别。不必站起来或者摆动手臂,Leap Motion
是简单而毫不费力的交互方式。我们在4月份就预订了一台,到现在还未到货,估计要到下个月到货。到货后我们会对其进行评测。
是一款能在用户挥动并指向屏幕时测量各种肌肉产生的电活动来完成交互的腕带。MYO
超越 Leap Motion
的一点是,MYO
对用户的位置没有限制。尽管MYO只听令于身体的一个部分(手臂),但是其应用的场合还是很多的。期望未来会有更多的听令于身体的其他部分的交互设备。
lGoogle Glass:
Google Glass为Google公司在2012的I/O开发者大会上正式公布的,在看起来普普通通的眼镜上配置强大的计算机和显示器。这款设备小巧而不显眼,可以在任何时间地点使用,即用户想要专注于周围环境时不会碍事。不过对其未来的发展各有说法,让我们拭目以待。
l3D Printer:这个就不用笔者详细说了,这两年太火了。正如上面所提到的观点,笔者觉得3D打印的出现带给了我们从事计算机图形学研究的工作者许多的机会。挑战和机会并存!我们应该要抓住这次机会!
l3Doodler:
3Doodler是玩具和机器人公司Wobble
Works开发的全球首款“3D打印笔”,可以帮助人们在半空中创造出三维结构的模型。今后人们可以在三维空间中来“画图”交流和表达想法了。
lApple iWatch:
iWatch由苹果公司推出的一款智能手表。现在仍是概念产品,面世时间未定。其界面看看视频就知道有多酷。但是其技术上的实现笔者也没有完全想通,呵呵。
除了上述介绍的外,最近还有其他很多新的人机交互类的电子科技产品,比如透明手机,可折叠的屏幕,具有气味和触感反馈的头盔等,就不一一介绍了。
由此可见,以前在科幻电影里出现的“神器”逐渐被实现,计算机图形学及相关技术在其中发挥了重要的作用。同时,这些设备的出现,也带给了计算机图形学领域更多的探索和机会。
5、其他内容
上述所提到的只是计算机图形学的主要的四个内容。事实上,与计算机图形学相关的学科还有很多,以下仅介绍几个最为相关的研究方向:
l虚拟现实(Virtual
Reality):利用计算机图形产生器,位置跟踪器,多功能传感器和控制器等有效地模拟实际场景和情形,从而能够使观察者产生一种真实的身临其境的感觉。虚拟现实技术主要研究用计算机模拟(构造)三维图形空间,并使用户能够自然地与该空间进行交互。对三维图形处理技术的要求特别高。简单的虚拟现实系统早在70年代便被应用于军事领域,训练驾驶员。80年代后随着计算机软硬件技术的提高,它也得到重视并迅速发展。它已在航空航天、医学、教育、艺术、建筑等领域得到初步的应用。
l可视化(Visualization):利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。现已成为研究数据表示、数据处理、决策分析等一系列问题的综合技术。上面提到的虚拟现实技术也是以图形图像的可视化技术为依托的。在现在的大数据时代的背景下,可视化的内容除了传统的科学可视化外,现在还有信息可视化,可视分析等方面。
l可视媒体计算与处理(Visual
Media Processing):几何数据,被认为是继声音、图像、视频之后的新一代数字媒体,是计算机图形学的研究重点。最近几年,计算机图形学与图像视频处理技术相结合的研究与技术日益增多。正如笔者在上面所提及的,图像和视频的大数据处理能带给计算机图形学很多处理手段上的更新。另一方面,随着而计算机图形学技术,恰可以与这些图像处理,视觉方法相交叉融合,来直接地生成风格化的画面,实现基于图像三维建模,以及直接基于视频和图像数据来生成动画序列。当计算机图形学正向地图像生成方法和计算机视觉中逆向地从图像中恢复各种信息方法相结合,可以带来无可限量的想象空间,构造出很多视觉特效来,最终用于增强现实、数字地图、虚拟博物馆展示等多种应用中去。因此,在很多方面,计算机图形学与图像处理、视频处理、多媒体处理、计算机视觉等学科逐渐融合在一起,有成为一个更大的学科的趋势。
l医学图像处理(Medical
Imaging):随着医学成像技术的发展与进步,图像处理在医学研究与临床医学中的应用越来越广泛。与一般意义上的图像处理比较,医学图像处理有其特殊性和不同的侧重点。医学图像处理由生物医学成像(X射线、CT、MRI)和生物医学图像处理两部分组成,在生命科学研究、医学诊断、临床治疗等方面起着重要的作用。医学图像分析中涉及的两个最为重要的内容为图像分割与图像配准。
l计算机艺术(Computational
Arts):计算机图形学的发展也提供给了艺术家发挥和实现想象的丰富的技术手段。计算机艺术的发展速度远远超出了人们的想象,在代表计算机图形研究最高水平的历届SIGGRAPH年会上,精彩的计算机艺术作品层出不穷。在计算机图形学领域,还有几个关于计算艺术方面的会议,包括非真实性图形学(Non-Photorealistic
Graphics)和Computational
Aesthetics(计算美学)等。吸引了计算机工作者、艺术家、建筑师、设计师等方面的人员在一起,通过头脑风暴和交流讨论的方式进行一些有创意的技术研究。
学习计算机图形学需要哪些基础?
计算机图形学是一门与很多学科都交叉的学科方向。因此,要学好计算机图形学和做好计算机图形学方面的研究,除了计算机图形学的基础知识以外,你还需要有其他方面的一些知识。当然你懂得越多当然会越好。
计算机图形学进入我国大概在上个世纪70年代末和80年代初,那时国内还没有计算机学科。于是,开始学习和研究计算机图形学的大部分都是搞数学的一些学者和教授。由此可见,计算机图形学是需要数学知识较多的一门计算机应用技术学科,在我国也是应用数学的一个重要分支(国内的很多高校和科研院所的数学专业都有计算机图形学方向)。
计算机图形学里面用到的数学比较多,列举一些常用的,包括:微积分、线性代数、矩阵计算、微分几何、数值计算和分析、计算方法、偏微分方程、微分方程数值解、最优化、概率、统计、计算几何等。
计算机图形学领域的一位优秀学者Greg
Turk教授在1997年曾写过一篇“计算机图形学中的数学”(Mathematics
for Computer Graphics)的帖子,详细可见:
其中文翻译版本可见:
笔者在多年从事计算机图形学研究中对数学的体会是:“数学不是没有用,而是不够用!”。对数学的学习和应用将是“活到老,学到老”。重要的是,从以前看似枯燥的数学到看到它的实际应用的过程中,你会更容易享受数学的美妙。在你不断进行计算机图形学的研究的过程中,你会感觉到你的数学知识越来越不够用,从而真正理解其中的数学思想和数学方法。
另一方面,想成为一名计算机图形学的研究者也不必精通各门数学!在大学里,你所学的那些数学看起来都很抽象,枯燥无味,这是因为你并不知道它们的用处,甚至连讲课的老师也不知道,而你们的目的只是记住那些定理和公式,考个好分数。与大学学习数学不一样的是,你在计算机图形学的学习和研究过程中会感受到数学的用处和美妙,这时你学习数学的目的将更加明确,兴趣将更加浓厚,学习方法将更加有效。因为你是在使用数学的过程中在学习数学!想想看你是如何学会中文说话的?以上提到的常用的数学课程你不必都要熟悉,许多研究工作者从不需要考虑其中提到的某些数学知识,成功的研究者总是将某一方面的数学知识和数学工具用到极致!
总之,关于计算机图形学与数学的关系,归纳起来就是以下几个原则:
计算机图形学的研究需要用到较多的数学知识,有较好数学功底的学生从事计算机图形学有一定优势;
即使没有学太多的数学也不要紧。数学的知识不需要都学会了再去做问题,在解决问题的过程中去学习数学是最快的学习方法。即,研究过程中若遇到什么数学知识再去学相关的知识,学习起来会更有兴趣,掌握起来会更快更扎实;
学习数学要结合图形,即“数形结合”,需要有图形的想象能力;数学公式不重要,是“纸老虎”,重要的是背后的思想及其所表达的概念,公式只是它们的一个抽象表达;
活到老,学到老。要不断学习新的知识和技术,使自己不断进步和增长功力,才是王道。
在计算机图形学中,大部分的想法都要通过实际例子来验证的,再好的理论也要拿实际例子来得到验证和应用。因此,利用编程语言来实现想法或算法是必须要有的能力。C/C++是计算机图形学最常用的编程语言。
笔者要求学生必须掌握C++编程语言和面向对象编程思想,这是大家通用的“语言”。网上的大部分的资源、类库、算法代码基本上都是C++写的,因此,你若需要利用这些资源,必须掌握甚至精通C++语言。
关于计算机图形学所需要的编程能力的几点看法:
从事计算机图形学和图像处理的研究需要有较强的编程能力,要对编程有极大的兴趣和热情;
如果你对编程比较“感冒”或“厌恶”,则建议你不要选择计算机图形学方向;
不太会编程不要紧,任何人都是从不会到会的!只要你对编程有兴趣,觉得编程“好玩”,您完全可以在很短的时间内极大地提高您的编程水平。笔者在长期的教学实验和科研过程中,摸索和发展出一套有效的方法,能够在最短的时间内,帮助学生(包括数学专业的学生)快速提高编程的能力。
英语基础要好,因为需要大量阅读英文文献和进行英文论文的写作;英文的听说能力也要好些,因为要跟国际学者交流讨论;
计算机图形学中的很多算法是真实物理世界的模拟,因此,如果你要进行基于物理的建模和仿真,一些物理知识和理论也需要的,比如力学(动力学,运动学,流体力学)和光学等;
其他学科的知识,根据具体研究的需要去学习即可,不必刻意去提前学多少。
4、计算机图形学的教材
上面列举的只是在你从事计算机图形学的学习和研究中可能要用到的东西,不必所有的都学会才能开始计算机图形学的学习和研究。一门知识点不懂不要紧,重要的是要能尽快学习新知识的能力和速度!事实上,最好的学习方法就是在使用中学习。因此,计算机图形学的学习和研究提供了你学习其他相关知识的好的过程。
现在市面上的计算机图形学的教材有很多,但是很多教材的内容仅仅是计算机图形学的基本知识,知识点也比较陈旧。不能指望通过一本或几本教材就能学会计算机图形学。计算机图形学的内容远比教材中或你想象中的内容多得多。正如笔者上面所述,计算机图形学作为一门技术科学,特别是在当前的互联网、移动互联网、大数据时代及第三次工业革命的时代背景下,最近几年的发展日新月异!务必要通过跟着老师做相关研究来了解计算机图形学最新的发展和趋势。除了阅读最新的最新的科研论文外,还需要不断关注信息科技及电子科技的一些前沿发展。要相信,计算机图形学是好玩的,是有用的,更是有未来的!充满热情和激情,才能做好计算机图形学方面的研究。
四、SIGGRAPH简介
&& 说到计算机图形学,不能不提SIGGRAPH。
ACM SIGGRAPH是“ACM
Special Interest Group on GRAPHics and Interactive Techniques”(计算机图形专业组)的缩写,成立于1967年,致力于推广和发展计算机绘图和动画制作的软硬件技术。从1974年开始,ACM
SIGGRAPH每年都会举办一次年会(也称为SIGGRAPH),至今年已经举办了40次。SIGGRAPH是计算机图形学顶级年度会议,代表着世界级水平的研究,能在SIGGRAPH上发表论文是许多从事计算机图形学研究的工作者的梦想。
SIGGRAPH每年7月底或8月初在美国召开(2011年在加拿大温哥华召开,是SIGGRAPH首次在美国以外的城市举行)。事实上,SIGGRAPH是世界上影响最广、规模最大,同时也是最权威的一个集科学、艺术、商业于一身的CG展示、学术研讨会,参会人数众多,一般有2--4万人。绝大部分计算机图技术软硬件厂商每年都会将最新研究成果拿到SIGGRAPH年会上发布,大部分游戏的创作者也将他们本年度最杰出的艺术作品集中在SIGGRAPH上展示。因此,SIGGRAPH在图形图像技术,计算机软硬件以及CG等方面都有着相当的影响力。
从2008年开始,Siggraph来到亚洲,每年冬天(11或12月)在亚洲的一个城市(2008,新加坡;2009,日本;2010,韩国;2011,中国香港;2012,新加坡)召开,称为SIGGRAPH
Asia。今年的Siggraph
Asia将在2013年11月19-22号于中国香港召开。
与SIGGRAPH一样,发表者SIGGRAPH
Asia上的研究论文也代表着计算机图形学领域的最前沿和最高水准,所有研究论文都发表在ACM
Transactions on Graphics期刊上,这是计算机图形学领域唯一的一个Top
(I区)的学术期刊。可以形象地将SIGGRAPH和SIGGRAPH
Asia分别比喻为计算机图形学领域的“夏季奥运会”和“冬季奥运会”。
在SIGGRAPH会议上,除了研究论文外,还有很多其他内容,比如课程、短文、海报、CG企业展示、电子剧场、动画节、新型科技展示、艺术画廊、教育等,比你想象得要多得多。很多活动都是并行的,因此你需要每天提前计划好所参加的活动。视觉中国网站的“Siggraph
2007会议报道”有详尽的关于Siggraph
2007年的报道:
虽然这是6年前的Siggraph介绍,但上述链接的内容仍然是对SIGGRAPH比较全面的介绍。其中有很多视频和材料,详细介绍了Siggraph盛会的情况,而且有对计算机图形学的历史发展的介绍。建议详细查看。
五、其他问题
如何选择适合自己的工作(研究方向)?
就两点:兴趣 +
兴趣是第一位的,是否擅长需要尝试和不断学习成长!将学会将自己的天赋发挥到极致!
自己是否适合学习和从事计算机图形学的研究?
看看自己是否满足以下两个条件:
对计算机图形学或图像处理具有强烈的兴趣和激情;
2)喜欢算法设计和编程。
若上述两个条件都满足(觉得好玩!),则可以尝试选择计算机图形学作为自己的研究方向。
3、从事研究工作需要哪些品质?
激情、好奇心、努力!
4、为何选择从事研究工作?
5、如何在研究生期间取得成功?
&六、更多参考材料
有关更多地了解计算机图形的知识和内容,可搜索并参考Internet上的丰富的资源介绍,比如,等。本文的写作过程中也参考了网上的许多资源。
国外和国内有很多有关《计算机图形学》的课程网站,可以通过查看相关视频和课件更多地了解计算机图形学的内容。
国内外有很多从事计算机图形学研究的教授学者的网站,会列出他们所做的有关计算机图形学方面的研究,可以更为深入了解计算机图形学领域所研究的东西。
与计算机其他学科一样,每年都有计算机图形学方面的很多会议。这些会议会有该领域的最新进展和研究工作,是了解计算机图形学发展及趋势的重要手段。在计算机图形学方面,可以通过以下链接来获得各个会议的信息
建议加该链接为你的浏览器的标签。
lInternet上经常会有计算机图形学相关的科技信息,要有意识经常关注,随时了解该学科方向的动态、发展和未来。
计算机图形学及相关学科在近些年来得到迅速的发展,特别是2013年出现的各种交互人机交互技术的出现,我们正处在技术极速发展的浪尖!计算机图形学前景诱人,形势逼人。相对于美国等西方国家,我国的计算机图形学相关产业还相对落后,但这正是留给我们这代人的机会!相信通过我们的努力,是可以逐渐缩短差距的,也带来了巨大的挑战和机会。
最后,要相信,计算机图形学是很好玩的,是有用的,更是有未来的。“相信是成功的开始”。祝各位能够感受计算机图形的美妙,能够在计算机图形学的海洋中享受快乐和成功!J
祝您健康、快乐、成功!
中国科技大学,图形与几何计算实验室()
个人主页:
2013年8月8日
【日添加】刘永进. 中国计算机图形学研究进展[J]. 科技导报, ): 76-85. []
版权所有@刘利刚}

我要回帖

更多关于 说人张八是什么意思 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信