如何评价 ARM 的 big.LITTLEbigdecimal 大小小核切换技术

?&??&??&?正文
ARM:我们在大小核主流架构中加了一颗“小药丸”
上网时间:
作者:余敏?
从2009年到2014年的五年间,包括笔记本、平板电脑和智能手机在内的移动计算市场发生了很大的变化,ARM近年开始扩大与x86架构的优势差距。全球基于ARM的设备从2009年的有1.8亿台迅猛增长到16.4亿台。相比之下,x86架构的移动计算设备在2009年为1.7亿台,至2014年仅实现不到50%的增长。现在,全球已交付的基于ARM内核架构的SoC超过600亿颗,几乎7亿移动用户在使用基于ARM处理器的设备,仅2014年就出货了14亿只智能手机。与此同时,目前可穿戴设备绝大部分也是基于ARM的。2014年,基于ARM的移动计算设备的出货量占到了整体的90%。ARM移动市场全球营销总监James Bruce和ARM处理器部门市场营销总监Ian Smythe就移动设备市场发展趋势和ARM处理器技术演进进行了分享,还介绍了ARM big.LITTLE架构最新进展。ARM处理器部门市场营销总监Ian SmytheARM移动市场全球营销总监James Bruce问:ARM在哪些方面推动着创新?James Bruce:过去五年,智能手机在显示、相机功能、互联、传感器、视频、CPU、GPU、存储带宽等方面都有相当明显的进展。现在智能手机已经成为数字生活的信息中心,它能够满足个人目前的大部分计算需求,比如4K视频游戏、移动办公等等。此外,当前的物联网、智能家居应用也大多以智能手机作为远程控制的终端。一些生物识别技术也开始在智能手机上使用,而更高清更流畅的视频应用、更高端的交互体验等等或许会成为下一代智能手机的新亮点。这些更高端更复杂的功能应用需要更高性能的处理器作为支撑。ARM鼓励并营造生态系统厂商共同创新,我们自身的重要创新就是big.LITTLE架构,它可以应对移动设备日益复杂功能以及对功耗的要求。Ian Smythe:ARM在今年2月发布的64位Cortex-A72移动处理器架构,在性能、功耗方面继续提升。A72相较于2014年发布基于Cortex-A15处理器的设备性能可提升3.5倍,主频达到2.5GHz;而通过工艺的提升,采用16FF+工艺的A72相比采用28nm的A15功耗降低高达75%。如果将A72与A53以big.LITTLE大小核进行配置,还能将功耗降低40%-60%。A72+A53的大小核架构组合会比A57+A53功耗降低很多,A72是后推出的架构,因此早期客户都选择了A57+A53的架构,近来客户选择A72+A53架构的情况越来越多,因为该组合将大幅度降低功耗。Cortex-A72性能提升的同时功耗也大幅降低本文来自《国际电子商情》7月刊杂志,版权所有,谢绝转载本文下一页:
[ 投票数:?
免费订阅资讯速递
信息速递-请选择您感兴趣的技术领域:
通信与网络
分销与服务
制造与测试
工业与医疗
计算机与OA
无源器件与模组
供应链管理
什么是大小核架构?
国际电子商情提供相关大小核架构技术文章及相关大小核架构新闻趋势,及更新最新相关大小核架构电子产品技术
什么是Helio X20?
国际电子商情提供相关Helio X20技术文章及相关Helio X20新闻趋势,及更新最新相关Helio X20电子产品技术
什么是未来处理器?
国际电子商情提供相关未来处理器技术文章及相关未来处理器新闻趋势,及更新最新相关未来处理器电子产品技术
说: 各种说法和意见都有,大家唯有静待后续发展,苹果能做这么大,背后也少不了律师团队,各种情况都会应对的了,很…----评《》说: 现在贸易商越来越来难,其实主要来说无非就两个方面:1、终端客户对你产品品质的质疑,甚至于只相信代理商(当然某些代理商我表示不敢苟同)…----评《》说: 当前最大的谬误就是将设备联网说成是物联网。特别是把穿戴设备也说成是物联网的核心应用,因此也就把苹果手机的衰落看成是物联网的…----评《》说: 之前的公司明确向所有供应商说明,过年过节不可以给这边的员工送礼,不可以请吃,否则员工开除。所以,收不收礼就变得异常简单了。所以说,如…----评《》说: 社会整体的发展,技术的发展引起不同的分工,对于我们而言不过是社会这个大环境的特有国情与日本有所不同。不过我到是比…----评《》说: 个人感觉分深入分析必需有更细的数据来判断,比如乐视电视,手机等主要产品准确主的出货量,乐视汽车什么时候会量产,量产能否达到回收投入成本的…----评《》说: 安卓网络机顶盒,已经几年了,电子产品更新换代太快,小微企业一不留神就跟不上行业的发展!…----评《》说: 美国的工业再造并不是代工生产这个环节。而是以低碳科技为代表的信息、生物、分子、航天、互联网、机器人等高科技产业,以及抛…----评《》说: 都别说风凉话了,这种情况下的员工,其实是弱势群体,选择罢 工还是需要很大的勇气,公司能妥善解决,谁愿意闹事?!…----评《》说: 全球范围内而言,电子产业尤其是半导体产业,本身已经进入了发展成熟阶段。之前高速发展时期的资本密集投入与人才密集投入,已…----评《》说: 深圳要有点自信,华为越做越大,密集的深圳容纳不下,溢出到周边是很正常的,以深圳的电子配套环境,任何电子厂商都不能完…----评《》说: 大家都来玩的时候,说明这个就会成为趋势,完全的取代是不可能,最起码5年内不会,大客户的价格有多低谁也不知道。IC电商对…----评《》说: 连这些老牌公司都撤了,LED照明已过度竟争了……----评《》说: 价格是中小代理商的命门,有真正商业价值的服务仍在探索中。趋势如此,开放灵活,剩者为王。…----评《》说: 愚以为华为搬去东莞和比亚迪搬到惠州,正是深莞惠一体化的的第一步棋。行政的意愿由企业来具体完成。…----评《》说: 电子元器件平台的电商化是一种趋势,电商会让整个行业的物料成本透明化,信息和数据公开化,他们增值和创造利润的点不在是传统企业差价赚取方式,而且…----评《》说: 从成品的出货、网购上能搜到哪些来看,确实很难得到内里原因的分析!我给您补充一点:那就是穿戴式和今年新热VR一样,…----评《》说: 房地产代表出来说道了,要求其公允,无异于缘木求鱼。现在应该科技、工业制造等站出来,表达自己的述诉求。ZF再根据总体情况,制定该抑制哪…----评《》说: 建议国家打击这种(硬件免费+内容和服务收费)持续打压、扼杀硬件创新动力的行为,允许某时段使用该手段进行品牌宣传,但持续…----评《》说: 跟原供应商协商一下,看看少折点价换货行不行。如果常用货稍好点,换位思考一下,你们的客户购买产品…----评《》说: 不管是不是电商平台,最终落脚点还是在IC产品性能和稳定性上,电商平台给IC供应商多了一个渠道,但与此同时如果这个渠道本身的推广费…----评《》说: 拒付钱。建立防错机制。先小量到货后批量到货。考察供应商诚心,能力。…----评《》说: 日企软件算法强么?机械强么?我该说都有一定基础但也都还不算世界第一,特别是软件几乎算是弱者!但是从后端的整体…----评《》说: 花了几个小时边学习边记录!总的感觉是:1,人只有一无所有时,才最有激情与潜能爆发的时候; 2,人的社会阅…----评《》
打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮
1.扫描左侧二维码
2.点击右上角的分享按钮
3.选择分享给朋友
最近更新元器件中文Datasheet文档下载热门厂商
汽车电子系统在现代的汽车中占有的比重越来越高,对产品设计的工程师来说,产品的设计和验证面临着很多的挑战。本期《汽车电子特刊》将会向您呈现ADI技术对于汽车电子行业的应用等,还有IIC汽车电子论坛的精彩回顾哦!
新版社区已上线,旧版论坛、博客将停用
1、为防数据丢失,旧版论坛、博客不再接受发帖;
2、老用户只需重设密码,即可直接登录新平台;
3、新版博客将于8月底完美归来,敬请期待;
4、全新论坛、问答,体验升级、手机阅读更方便。2015年11月 随笔档案 - cpsmile - 博客园
随笔 - 109
11 2015 档案
摘要: 来源从表格来看,骁龙820虽然不一定是性能最强的,但无论是CPU、GPU、ISP、基带还是CCI,都采用了自主研发设计,这在所有厂商中几乎是表现最好的。表现其次的是三星的Exynos 8890和A9,前者除了GPU是公版之外,其余均为自主研发设计,而苹果的GPU为PowerVR的产品,基带为高通的产...
摘要: 1.怎么在Ubuntu下安装flash插件 2.Ubuntu14.04安装wineqq国际版 安装包wine-qqintl下载 在/usr/share/applications/下可找到国际版qq的图标,双击即可运行; 或者运行/usr/bin/wine-qqintl。 3.在ubuntu 14.0
摘要: 来源 ARM公司处理器产品的主要系列 ARM推出的A系列处理器主要型号及规格big.LITTLE架构:解决处理器耗电与性能之间的矛盾。小核心主要有A7、A53、A35这三种,他们典型的特点是顺序执...
摘要: 来源问题1:该技术能够同时打开所有核心吗?在早期的big.LITTLE软件模型中(集群迁移和CPU迁移),软件在核心之间切换,不能同时打开所有核心。在更新的软件模型“全局任务调度”中,软件可以让所有核心同时处于活动状态,因为操作系统能够识别系统中的big和LITTLE核心,而且直接控制可用核心之间的...
摘要: 参考知乎:如何评价 ARM 的 big.LITTLE 大小核切换技术? 大小核白皮书翻译大小核模型的目的:官方称,可以大幅减少CPU的功耗,从而可以省电。PPA(power,performance,area)相互制约相互取舍,本质是牺牲芯片面积换取低功耗和高性能。该图存在的问题:未给出power...
摘要: 使用vim编辑代码:1 #!/usr/bin/python2.72 #-*-coding:utf-8-*-3 name = raw_input('请输入你的名字:')4 print 'Hello,',name直接运行hello.py:$chmod a+x hello.py./hello.py或者 p...当前位置: -> ->
MTK科普:什么是ARM big.LITTLE架构
日前有消息显示联发科技即将在今年第三季度推出采用big.LITTLE架构的双核Cortex-A15加双核Cortex-A7的四核心平板应用处理器,并且将同步展开big.LITTLE四核方案整合数据机(Modem)的系统单晶片
& 日前有消息显示技即将在今年第三季度推出采用big.LITTLE架构的双核Cortex-A15加双核Cortex-A7的四核心平板应用处理器,并且将同步展开big.LITTLE四核方案整合数据机(Modem)的系统单晶片(SoC)设计,意思就是除了平板可以使用之外,还可以运用于智能手机,那么什么是big.LITTLE架构,big.LITTLE技术的好处是什么,今天我们通过这篇文章来了解一下。
&& 英国ARM公司为削减智能手机及平板终端等CPU耗电量而推出了&big.LITTLE技术&。该技术可相应于终端的处理负荷,分别使用微架构各异的CPU内核群(群集),从而兼顾低耗电量和高性能。 本文来自MTK手机网
从原理上来说,只要是指令集架构相同的CPU内核均可适用big.LITTLE技术,目前可使用的是Cortex-A15和Cortex-A7的组 合。处理性能在必要时用高性能的Cortex-A15执行处理,在空闲时和负荷较低时则用电力效率较高的Cortex-A7(图1)。 本文来自MTK手机网
本文来自MTK手机网
图1:切换不同的内核 本文来自MTK手机网
本文来自MTK手机网
不同工作频率的利用时间示例 本文来自MTK手机网
据ARM介绍,当CPU的不同工作频率的利用状况为以下情况时,通过利用big.LITTLE技术,可将CPU的耗电量削减70%以上。此时,Cortex-A15的利用时间占12%,Cortex-A7为88%。 本文来自MTK手机网
目前以Task Migration型为主 本文来自MTK手机网
big.LITTLE技术的使用模式主要有两种:(1)相应于处理负荷切换使用大小内核的Task Migration型,(2)利用大小内核驱动单一OS作SMP运行的MP(multiprocessing)型。 本文来自MTK手机网
(1)的Task Migration型是开篇提到的利用方法,是以前就存在的DVFS的扩展方法。当处理负荷降低到一定水平时,就可切换为Cortex-A7。同时运行的只有Cortex-A15或Cortex-A7其中一方的群集。 本文来自MTK手机网
(2)的MP型会相应于每项任务的负荷,由OS调度器判断并决定是由Cortex-A15还是Cortex-A7来执行任务。如果没有需要高处理性能的任务,就会关闭未分配到任务的内核电源。 本文来自MTK手机网
ARM公司项目管理部处理器事业部董事John Goodacre表示,big.LITTLE技术目前主要以(1)的Task Migration型的利用模式为主。 本文来自MTK手机网
(2)的MP型需要大幅修正OS调度器等。这是因为,支持SMP的OS一般会均等利用多个内核,不具备电力效率各异的异构群集这一概念。因此先采用(1)。 本文来自MTK手机网
还将考虑采用第三种利用模式 本文来自MTK手机网
最初,(1)的Task Migration型为群集间的切换及内核间的硬件差异吸收,而采用了虚拟化技术,不过&只是在Task Migration型的原型中沿用了虚拟化技术。实际产品中虚拟化技术的采用不是必需的&(ARM公司的Goodacre)。 本文来自MTK手机网
另外,Goodacre还表示,big.LITTLE技术除了上述(1)和(2)之外,还在探讨可谓是二者混合版的以Linaro等为主的第三种利用模式。
转载MTK手机网原创文章请保留链接:
本文标签:
------分隔线----------------------------
评论列表(网友评论仅供网友表达个人看法,并不表明本站同意其观点或证实其描述)
哈哈,原来是这样, 学习了big.little
VIBE UI官方早先公布了 联想第一款支持Android 5.0的机型 ,该机便...
荣耀3C联通版最新乐蛙OS6开发版ROM下载,版本为14.11.14 (OS6.0)。...
乐蛙OS6第一批机型正式发布,荣耀3C移动2G版成为其中一员,成为...
谷歌于10月底正式发布了Android 5.0(Lollipop),对于喜欢折腾的刷...
乐蛙OS做为适配MTK平台机型最多的第三方ROM,自成立已来就与一...
今年1月份面世的 大神F1 在当时以888元的价格惊呆了不少小伙伴...手机芯片哪家强?高通、Exynos、联发科、华为 大PK!
手机芯片哪家强?高通、Exynos、联发科、华为 大PK!
前言:手机芯片,相信我们每天都在离不开,目前全球手机用户接近71亿人,覆盖全球95%以上的人口,说起手机当然离不开,手机的CPU,那么手机芯片哪家强?这次测试的是Snapdragon 821 , Exynos 8890 , MediaTek Helio X25 , Kirin 960这四家非常出名的厂家CPU。手机被认为最重要的组成部分就是CPU(中央处理器),主要连接其它必要的外围设备,包括例如GPU,内存,以及专门的视频或音频芯片,今天部分移动处理器把这些辅助的功能全部集成在一枚芯片来进行完成,例如将基带,视频或音频芯片,等集成在一起,也叫单芯片。单芯片将CPU和GPU集成为一体,更有复杂的芯片加上内存控制器,DSP,GSM,3G,4G等多种集成为一体,大幅度降低成本。当然有低就有高,这次对比的是Android手机SOC厂商的高端芯片手机芯片哪家强:821vs8890vsX25vs960核心数量去年和今年差距非常大,去年8核处理器的统治地位被打破,今年人们更理性,不在一味的追求超高的CPU,4核心,8核心,10核心处理器都有,这些处理器全部采用了异构多处理(HMP),异构多处理让手机具有高性能的同时更加高效,Snapdragon 821采用了2+2的配置,而联发科X25则采用了2+4+4的配置。GPU手机的GPU主要由ARM, Qualcomm 和 Imagination公司,ARM的GPU主要被称为Mali,主要型号为Mali-T880。Exynos 8890采用了Mali-T880。Kirin 960则采用了新的Mali-G71。Snapdragon 820/821 采用了 Adreno 530。不过PowerVR今年并没有特别突出的GPU。这些GPU都支持OpenGL ES 3.1和RenderScript。如果你要玩大型3D游戏的话你要好好考虑一下。Snapdragon 821高通821是高通公司的64位旗舰处理器,采用ARM公版内核,代号为KRYO的HMP构架系统。高通在Snapdragon 821使用了4个Cortex-A57核心+4个Cortex-A53核心处理器,采用ARM的big.LITTLE的大小核切换技术,支持LTE Cat12/Cat13网络的调制解调器。高通821相比高通820改进了功率,增加了性能,高通821和820大体性能相当。Exynos 8890三星的Galaxy S7 Edge和Galaxy S7还有魅族的旗舰机,都采用了这款最新的芯片,Exynos 8890,这款芯片采用了64位8核心设计,由四个Mongoose(猫鼬)架构的自主核心的处理器主频为主频为2.3最高为2.6。搭配四个Cortex A53核心的处理器主频为1.6。以及ARM Mali-T880 MP12的GPU。MediaTek Helio X25联发科在处理器里拥有最多的核心,联发科Helio X25拥有十个核心处理器,在传统的HMP异构多核心处理器里拥有一个高性能集群和高效率集群,联发科的Helio X25是世界上第一个拥有三集群的处理器,让三个处理器集群分别设计处理不同的工作类型,能够最佳化手机的性能和更有效的分配任务来延长电池寿命。联发科的X25采用了两个Cortex-A72+四个Cortex-A53 2.0GHz+四个Cortex-A53 1.55GHz,至于GPU采用了Mali-T880。Kirin 960Kirin 960华为出品的芯片,虽然华为的进步并不那么快不过却很踏实,今年华为推出了两款高端处理器,Kirin 955和Kirin 960,Kirin 960采用了Cortex-A73和新的Mali-G71 GPU。测试:进入测试使用这些不同芯片的手机为Snapdragon 821 – Googel PixelExynos 8890 – Samsung Galaxy S7MediaTek Helio X25 – Meizu Pro 6Kirin 960 – Huawei Mate 9当然也会使用不同的CPU。Snapdragon 820 – Samsung Galaxy S7 (Qualcomm variant)Snapdragon 810 – Nexus 6PExynos 7420 – Samsung Galaxy Note 5性能测试:测试的麻烦之处在于基准,你没办法让每一台手机保持在完全相同的状态下,当然甚至温度都有可能会改变测试结果,当然这里选用的是比较流行的测试软件和专门编写的测试程序。AnTuTu安兔兔是Android的测试标准之一,可以同时测试CPU和GPU,不过因为基准负载并不反应生活状态,不过我们还会列入考虑,首先今年所有的处理器都比去年提升明显,得分最低的为Helio X25Geekbench在单核跑分里,华为的Kirin 960和三星的Exynos 8890基本上吊打了所有的处理器。给我们同样惊喜的是,华为的Kirin 960和三星的Exynos 8890多核跑分依旧非常出色,不过让人失望的是虽然Helio X25采用了十核心,不过并没有给它带来多大的提升和改编。Basemark, Vellamo 和 Dhrystones这次测试采用的是Basemark OS II,Vellamo和Dhrystones可以测试CPU,GPU,存储器,网络性能,CPU整数性能。我们可以看到高通810的性能要比高通820更好,这次的赢家为Kirin 960和Exynos 8890。哈希,排序, 表格 和 素数这次的自定义测试让人看到了联发科芯片的强大,这次联发科的Helio X25得到了第二,虽然它只有两个Cortex-A72核心。Water simulation(水模拟)第二个自定义是使用2D物理引擎模拟被倒入容器中的水,大部分的找工作由CPU完成,不过因为复杂性,游戏被限制在每秒60帧运行,测试最终有多少水滴被处理过,有多少被错过,最高得分为10800。在这里Kirin 960以最高得分刷爆了这个游戏,Kirin 960包括4个Cortex-A72核心,主频2.3GHz,四个Cortex-A53核心,主频为1.8GHz,同时配置了ARM Mali T880 GPU直接获得了满分。Unity 3D benchmarks这个测试主要是测试GPU的最大值,这次高通821毫无疑问的得到了第一名,Adreno 530功不可没。NDK benchmarks这次测试的是一个自定义,文件用C语言编写,第一次反复计算SHA1,第二次反复计算100万的素数,第三次重复运行(乘法,除法,与整数,浮点数等)等大量数据的任意函数,在每种情况下,完成的结果。第一次高通820用非常小的差距获胜,接下来,第二次高通821和820的数据完全相同,最后依旧由高通821和820以非常小的差距获胜。与Apple A10一起测试当所有这些处理器都在一起时,到底是苹果高还是Android高,苹果A10为6核处理器采用了Imagination Technologies的PowerVR的GPU架构。用水模拟进行测试,苹果A10的处理器勉强击败高通821,不过三星Exynos 8890同样领先高通821.结语:马上到来的CES或者会带来更多的CPU,目前看来用户更加离职,并不会一味的追求高性能,更加追求实用性和节能,厂商也考虑在高性能模式下如何更加让效率均衡。如果你想进行选择的话,那么高通依旧是非常不错的选择,其次是Exynos和华为的麒麟。良好的GPU让高通的821和820表现非常良好,无论什么状态下几乎表现都非常不错。而Exynos和华为的麒麟的问题是,它们不那么普遍,你必须购买指定的机型才能获得,例如三星的手机或者华为的手机,当你并不是一个三星或者华为的手机爱好者时,搭配就成为了一件不可能的事情。联发科X25也较为不错,不过更为适合中期手机的顶端,并不适合旗舰手机,当然你也可以看完CES之后在做考虑。(来源于网络,侵权联系删除)
本文仅代表作者观点,不代表百度立场。系作者授权百家号发表,未经许可不得转载。
百家号 最近更新:
简介: 芯笔记,分享行业资料、资源的科技平台!
作者最新文章21ic官方微信 -->
您现在的位置是:&>&&>&
看懂芯片后端报告 这篇文章最实用
首先,我要强调,我不是做后端的,但是工作中经常遇到和做市场和芯片的同事讨论PPA。这时,后端会拿出这样一个表格:
上图是一个A53的后端实现结果,节点是TSMC16FFLL+,我们就此来解读下。
首先,我们需要知道,作为一个有理想的手机芯片公司,可以选择的工厂并不多,台积电(TSMC),联电(UMC),三星,Global Foundries(GF),中芯(SMIC)也勉强算一个。还有,今年开始Intel工厂(ICF)也会开放给ARM处理器。事实上有人已经开始做了,只不过用的不是第三方的物理库。通常新工艺会选TSMC,然后要降成本的时候会去UMC。GF一直比较另类,保险起见不敢选,而三星不太理别人所以也没人理他。至于SMIC,嘿嘿,那需要有很高的理想才能选。
16nm的含义我就不具体说了,网上很多解释。而TSMC的16nm又分为很多小节点,FFLL+,FFC等。他们之间的最高频率,漏电,成本等会有一些区别,适合不同的芯片,比如手机芯片喜欢漏电低,成本低的,服务器喜欢频率高的,不一而足。
接下来看表格第一排,Configuration。这个最容易理解,使用了四核A53,一级数据缓存32KB,二级1MB,打开了ECC和加解密引擎。这几个选项会对面积产生较大影响,对频率和功耗也有较小影响。
接下来是Performance target,目标频率。后端工程师把频率称作Performance,在做后端实现时,必须在频率,功耗,面积(PPA)里选定一个主参数来作为主要优化目标。这个表格是专门为高性能A53做的,频率越高,面积和漏电就会越大,这是没法避免的。稍后我再贴个低功耗小面积的报告做对比。
下面是Current Performance,也就是现在实现了的频率。里面的TT/0.9V/85C是什么意思?我们知道,在一个晶圆(Wafer)上,不可能每点的电子漂移速度都是一样的,而电压,温度不同,它们的特性也会不同,我们把它们分类,就有了PVT(Process,Voltage, Temperature),分别对应于TT/0.9V/85C。而Process又有很多Conner,类似正态分布,TT只是其中之一,按照电子漂移速度还可以有SS,S,TT,F,FF等等。通常后端结果需要一个Signoff条件(我们这通常是SSG),按照这个条件出去流片,作为筛选门槛,之下的芯片就会不合格,跑不到所需的频率。所以条件设的越低,良率(Yield)就会越高。但是条件也不能设的太低,不然后端很难做,或者干脆方程无解,跑不出结果。X86上有个词叫体质,就是这个PVT。
这一栏有四个频率,上下两组容易区分,就是不同的电压。在频率确定时,动态功耗是电压的2次方,这个大家都知道。而左右两组数字的区别就是Corner了,分别为TT和SSG。
下一行是Optimization PVT。大家都知道后端EDA工具其实就是解方程,需要给他一个优化目标,它会自动找出最优局部解。而1.0V和0.9V中必须选一个值,作为最常用的频率,功耗和面积的甜点(Sweet Spot)。这里是选了1.0V,它的SSG和目标要求更接近,那些达不到的Corner可以作为降频贱卖。
再下一行是漏电Leakage,就是静态功耗。CPU停在那啥都不跑也会有这个功耗,它包含了四个CPU中的逻辑和一级缓存的漏电。但是A53本身是不包含二级缓存的,其他的一些小逻辑,比如SCU(Snooping Control Unit)也在CPU核之外,这些被称作Non-CPU,包含在MP4中。我们待机的时候就是看的它,可以通过power gating关掉二三级缓存,但是通常来说,不会全关,或者没法关。
下面是Dynamic Power,动态功耗。基本上我见过的CPU在测量动态功耗的时候,都是跑的Dhrystone。Dhrystone是个非常古老的跑分程序,基本上就是在做字符串拷贝,非常容易被软件,编译器和硬件优化,作为性能指标基本上只有MCU在看了。但是它有个好处,就是程序很小,数据量也少,可以只运行在一级缓存(如果有的话),这样二级缓存和它之后的电路全都只有漏电。虽然访问二级三级缓存甚至DDR会比访问一级缓存耗费更多的能量,但是它们的延迟也大,此时CPU流水线很可能陷入停顿。这样的后果就是Dhrystone能最大程度的消耗CPU核心逻辑的功耗,比访问二级以上缓存的程序都要高。所以通常都拿Dhrystone来作为CPU最大功耗指标。实际上,是可以写出比Dhrystone更耗电的程序的,称作Max Power Vector,做SoC功耗估算的时候会用上。
动态功耗和电压强相关。公式里面本身就是2次方,然后频率变化也和电压相关,在跨电压的时候就是三次方的关系了。所以别看1.0V只比0.72V高了39%,最终动态功耗可能是3倍。而频率高的时候,动态功耗占了绝大部分,所以电压不可小觑。
此外,动态功耗和温度相关,SoC运行的时候不可能温度维持在0度,所以功耗通常会拿85度或者更高来计算,这个就不多说了。
下一行是Area,面积。面积是芯片公司的立足之本,和毛利率直接相关。所以在性能符合的情况下,越小越好,甚至可以牺牲功耗,不惜推高电压,所以有了OD(Over Drive)。有个数据,当前28nm上,每个平方毫米差不多是10美分的成本,一个超低端的手机芯片怎么也得30mm(200块钱那种手机用的,可能你都没见过,还是智能机),芯片面积成本就是3刀,这还不算封测,储存和运输。低端的也得是40mm(300块的手机)。我们常见的600-700块钱的手机,其中六分之一成本是手机芯片。当然,反过来,也有人不缺钱的,比如苹果,据说A10在16nm上做到了125mm,换算成这里的A53MP4,单看面积不考虑功耗,足足可以放120个A53,极其奢侈,这可是跑在2.8G的A53,如果是1.5G的,150个都可能做到。
那苹果这么大的面积到底是做什么了?首先,像GPU,Video,Display,基带,ISP这些模块,都是可以轻易的拿面积换性能的,因为可以并行处理。而且,功耗也可以拿面积换,一个最简单的方法就是降频,增加处理单元数。这样漏电虽然增加,但是电压下降,动态功耗可以减少很多。一个例外就是CPU的单核性能,为什么苹果可以做到Kirin960的1.8倍,散热还能接受?和物理库,后端,前端,软件都有关系。
首先,A10是6发射,同时代的A73只用了2发射。当然,由于受到了数据和指令相关性限制,性能不是三倍提升,而6发射的后果是面积和功耗非线性增加。作为一个比较,我看过ARM的6发射CPU模型,同工艺下,单核每赫兹性能是A73的1.8倍,动态功耗估算超过2倍,面积也接近2倍。当然,它的微结构和A73是有挺大区别的。这个单核芯片跑在16nm,2.5Ghz,单核功耗差不多是1W。而手机芯片的功耗可以维持在2.5W不降频,所以苹果的2.3Ghz的A10算下来还是可行的。
为了控制功耗,在做RTL的时候就需要插入额外晶体管,做Clock Gating,而且这还是分级的,RTL级,模块级,系统级,信号时钟上也有(我看到的SoC时钟通常占了整个逻辑电路功耗的三分之一)。这样一套搞下来,面积起码大1/3。然后就是Power Gating,也是分级的。最简单的是每块缓存给一个开关,模块也有一个开关。复杂的根据不同指令,可以计算出哪些Cache bank短时间内不用,直接给它关了。Power Gating需要的延时会比Clock Gating大,有的时候如果操作很频繁,Power Gating反而得不偿失,这需要仔细的考量。而且,设计的越复杂,验证也就越难写,这里面需要做一个均衡。除了时钟域,电源域,还有电压域,可以根据不同频率调电压。当然了,域越多,布线越难,面积越大。
再往上,可以定义出不同的power state,让上层软件也参与经来,形成电源管理和调度。我在这个回答里面写的更详细一些:如何评价 ARM 的 big.LITTLE 大小核切换技术?
再回到苹果A10,它还使用了6MB的缓存。这个在手机里面也算大的惊世骇俗。通常高端的A73加2MB,A53加1MB,已经很高大上了,低端的加起来也不超过1MB。我拿SPECINT2K在A53做过一些实验,二级缓存从128KB增加到1MB只会增加15%不到的性能,到6MB那性能/面积收益更不是线性的,这是赤裸裸的面积换性能。而且苹果宣扬的不是SPECINT,而是GeekBench4.0,我怀疑是不是这个跑分对缓存大小更敏感,有空可以做做实验。顺带提一句,安兔兔5.0和缓存大小没半毛钱关系,这让广大高端手机芯片公司情何以堪。到了6.0似乎改了,我还没仔细研究过。至于使用了大面积缓存引起的漏电,倒是有办法解决,那就是部分关闭缓存,用多少开多少,是个精细活,需要软硬件同时配合。
影响面积的因素还没完,上面只是前端,后端还有一堆考量呢。
首先就是表格下一排,Metal Stack。芯片制造的时候是一层层蚀刻的,而蚀刻的时候需要一层层打码,免得关键部分见光,简称Mask。这里的11m就表示有11层。晶体管本身是在最底层的,而走线就得从上面走,层数越多越容易,做板子布线的同学肯定一看就明白了。照理说这就该多放几层,但是工厂跟你算钱也是按照层数来的,越多越贵。层数少了不光走线难,总体面积的利用率也低,像A53,11层做到80%的利用率就挺好了。所以芯片上不是把每个小模块面积求和就是总体面积,还得考虑布局布线(PR,Placing&Routing),考虑面积利用率。
再看表格下两排,Logic Architecture和Memory。这个也容易理解,就是逻辑和内存,数字电路的两大模块分类。这个内存是片上静态内存,不是外面的DDR。uLVT是什么意思呢,Ultra Low Voltage Threshold,指的是标准逻辑单元(Standard Cell)用了超低电压门限。电压低对于动态功耗当然是个好事,但是这个标准单元的漏电也很高,和频率是对数关系,也就是说,漏电每增加10倍,最高频率才增加log10%。后端可以给EDA工具设一个限制条件,比如只有不超过1%的需要冲频率的关键路径逻辑电路使用uLVT,其余都使用LVT,SVT或者HVT(电压依次升高,漏电减小),来减小总体漏电。
对于动态功耗,后端还可以定制晶体管的源极和漏极的长度,越窄的电流越大,漏电越高,相应的,最高频率就可以冲的更高。所以我们有时候还能看到uLVT C16,LVT C24之类的参数,这里的C就是指Channel Length。
接下去就是Memory,又作Memory Instance,也有人把它称作FCI(Fast Cache Instance)。访问Memory有三个重要参数,read,write和setup。这三个参数可以是同样的时间,也可以不一样。对于一级缓存来说基本用的是同样的时间,并且是一个时钟周期,而且这当中没法流水化。从A73开始,我看到后端的关键路径都是卡在访问一级缓存上。也就是说,这段路径能做多快,CPU就能跑到多快的频率,而一级缓存的大小也决定了索引的大小,越大就越慢,频率越低,所以ARM的高端CPU一级缓存都没超过64KB,这和后端紧密相关。当然,一级缓存增大带来的收益本身也会非线性减小。之后的二三级缓存,可以使用多周期访问,也可以使用多bank交替访问,大小也因此可以放到几百KB/几MB。
逻辑和内存统称为Physical Library,物理库,它是根据工厂给的每个工艺节点的物理开发包(PDK)设计的,而Library是一个Fabless芯片公司能做到的最底层。能够定制自己的成熟物理库,是这家公司后端领先的标志之一。
最后一行,Margin。这是指的工厂在生产过程中,肯定会产生偏差,而这行指标定义了偏差的范围。如下图:
蓝色表示我们刚才说的一些Corner的分布,红色表示生产偏差Variation。必须做一些测试芯片来矫正这些偏差。SB-OCV表示stage-based on-chip variation,和其他的几个偏差加在一起,总共&7%,也就是说会有7%的芯片不在后端设计结束时确定的结果之内。
后面还有一些setup UC之类的,表示信号建立时间,保持时间的不确定性(Uncertainty),以及PLL的抖动范围。
至此,一张报告解读完毕,我们再看看对应的低功耗版实现版本:
这里频率降到1.5G左右,每Ghz动态功耗少了10%,但是静态降到了12.88mW,只有25%。我们可以看到,这里使用了LVT,没有uLVT,这就是静态能够做低的原因之一。由于面积不是优化目标,它基本没变,这个也是可以理解的,因为Channel宽度没变,逻辑的面积没法变小。
近日国内开发者和律师、法律专家团队召开发布会,认为苹果公司运营的应用商店App Store在长期运营中涉嫌违法、侵权并存在垄断行为,并计划在预计在近日,正式向两个反垄断的执法部门国家工商总局和国家发改委举报。
......关键字:
2017年7月,龙源电力完成发电量3,283,445兆瓦时,同比增加16.16%。其中,风电增加17.73%,其他可再生能源发电量增加5.90%。
......关键字:
Power Integrations公司与Casambi Technologies OY今日联合发布一款全新的参考设计(DER-612)。这是一款适用于智能照明应用的具备功率因数校正的恒压(CV)、恒流(CC) 12 W隔离反激式电源。该设......关键字:
Basler开始生产所有型号的新的ACE L产品线,这种扩展的ACE系列包括十二个新的摄像头与索尼最新一代高分辨率CMOS传感器。
......关键字:
今年新一代iPhone叫什么名字,也是大家比较关心的一个问题,估计苹果也是伤透了脑筋,容易记且不能让产品线过于分散,这必须要好好思量。据日本媒体MacOtakara报道称,苹果......关键字:
为了提高机器学习的效能,Goolge去(2016)年5月在Google I/O上宣布自行打造了机器学习处理器TPU(Tensor Processing Unit);而在美国时间9日的Google Cloud Next云端大会上,Google......关键字:
特斯拉的无钥匙驾驶功能允许车主使用智能手机应用来解锁和启动汽车。这项功能允许特斯拉车主无需随身携带实体钥匙。......关键字:
据报导,在几乎垄断 4G LTE 与 3G EV-DO 基频芯片市场的大厂高通(Qualcomm),过去所采用的 IP 授权手段,以限制其他竞争对手介入市场的手法,目前已开始遭到包括苹果(Apple)等厂商的反弹后,这也使得竞争对手包括英特......关键字:
无相关信息
该电路图展示了一个电容反射器式的电容近距离传感器的电场配置。它包括一个由交流电压……
一个运算放大电路(741)放大来自MIC1的声频信号,R12控制该电路的增益。音频信号是供给……
一个100k&O的电位计R4调节固体音调发生器的电流馈电。调节该电位器至音响能发出……}

我要回帖

更多关于 biginteger 大小 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信