返回首页

流水线处理(流水线处理器)

来源:www.haichao.net  时间:2023-01-19 18:55   点击:115  编辑:admin   手机版

1. 流水线处理器

(英文名:superpiplined)是指通过细化的流水,提高主频。使得机器在一个周期内完成一个甚至多个操作,其实质是用空间换取时间。

超主力生产线处理器是相对于基准处理器而言的,一般cpu的流水线是基本的指令预取,译码,执行和写回结果四级。

2. 流水线处理器中时钟周期如何确定

(1)时钟周期:1/时钟频率=1/100=0.01us 机器周期:n个时钟周期=2*0.01us=0.02us 指令周期:n个机器周期=2.5*0.02us=0.05us 平均指令执行速度=1/指令周期=1/0.05us=20MIPS (2)机器周期:n个时钟周期=4*0.01us=0.04us 指令周期:n个机器周期=5*0.04=0.2us 平均指令执行速度=1/指令周期=1/0.2us=5MIPS 结论:两个主频相同的机器,执行速度不一定一样。 手机CPU的主频与其运行速度并无直接的关系,CPU的主频表示在CPU内数字脉冲信号震荡的速度, 与CPU实际的运算能力并没有直接关系。由于主频并不直接代表运算速度,对于一台智能手机来说处理器达到400MHz以上再增加主频对系统日常操作的差别影响会非常小, 但高强度的多媒体和图形计算对处理能力的要求是远远无法靠多提升200-300MHz处理器主频所能够解决的,所以在一定情况下,很可能会出现主频较高的CPU实际运算速度较低的现象。

3. 流水线处理器的控制器实现方式

控制柜的主要作用,就是通过控制台按钮开关,对各种行业设备,实现近程或远程控制,主要是控制电动机等机械运动。工业控制柜有多种,不同场合有不同的功能,传统的都以各种接触器、电流保护器、继电器等为主,目前的设备,大概增加电路板等智能化的内容,甚至微处理器、程序控制器等,比如:数控设备、加工中心等,还有自动生产线控制器、机器手等,如汽车生产线。

4. 流水线处理器可以处理

流水线技术 是指在程序执行时多条指令重叠进行操作的一种准并行处理实现技术。

流水线是Intel首次在486芯片中开始使用的。

5. 流水线处理器的时钟周期怎么算

流水线(pipeline)是Intel首次在486芯片中开始使用的。流水线的工作方式就象工业生产上的装配流水线。在CPU中由5~6个不同功能的电路单元组成一条指令处理流水线,然后将一条X86指令分成5~6步后再由这些电路单元分别执行,这样就能实现在一个CPU时钟周期完成一条指令,因此提高了CPU的运算速度。

所谓满负荷不是最大负荷,而是额定负荷,所有的机械都差不多,机械运行需要设备运行,试想一下,一个人搬砖,本来能一次搬10块,10块砖一次就解决了,也不会觉得很累,如果要让他每次只搬一块,恐怕跑路比搬砖消耗的能量多多了.

6. 流水线处理器时钟周期

我们常用双精度浮点运算能力衡量一个处理器的科学计算的能力,就是处理64bit小数点浮动数据的能力

支持AVX2的处理器的单指令的长度是256bit,每个intel核心假设包含2个FMA,一个FMA一个时钟周期可以进行2次乘或者加的运算,那么这个处理器在1个核心1个时钟周期可以执行256bit*2FMA*2M/A/64=16次浮点运算,也称为16FLOPs,就是Floating Point Operations Per Second;

支持AVX512的处理器的单指令的长度是512Bit,每个intel核心假设包含2个FMA,一个FMA一个时钟周期可以进行2次乘或者加的运算,那么这个处理器在1个核心1个时钟周期可以执行512bit*2FMA*2M/A/64=32次浮点运算,也称为32FLOPs,

这就是说理论上后者的运算能力其实是前者的一倍,但是实际中不可能达到,因为进行更长的指令运算,流水线之间更加密集,但核心频率会降低;导致整个处理器的能力降低;

一个处理器的计算能力和核心的个数,核心的频率,核心单时钟周期的能力三个因素有关系

例如:现在intel purley platform的旗舰skylake 8180是28Core@2.5GHZ,支持AVX512,其理论双精度浮点性能是:28Core*2.5GHZ*32FLOPs/Cycle=2240GFLPs=2.24TFLOPs

例如:现在intel purley platform的旗舰cascade lake 8280是28Core@2.7GHZ,支持AVX512,其理论双精度浮点性能是:28Core*2.7GHZ*32FLOPs/Cycle=2419.2GFLPs=2.4192TFLOPs

但是还是要注意并不是所有的处理器都有支持AVX512的指令集,也并不是每个支持处理器都有2个FMA的运算单元。

GPU能做的CPU都能做,CPU能做的GPU却不一定能够做到,GPU一般一个时钟周期可以操作64bit的数据,1个核心实现1个FMA。

这个GPU的计算能力的单元是:64bit*1FMA*2M/A/64bit=2FLOPs/Cycle

GPU的计算能力也是一样和核心个数,核心频率,核心单时钟周期能力三个因素有关。

但是架不住GPU的核心的数量多呀

例如:对现在nvidia tesla class 的pascal旗舰 p100而言,是1792core@1.328GHZ,其理论的双精度浮点性能是:1792Core*1.328GHZ*2FLOPs/Cycle=4759.552GFLOPs=4.7TFLOPs

例如:对现在nvidia tesla class 的volta旗舰 v100而言,是2560Core@1.245GHX,其理论的双精度浮点性能是:2560Core*1.245GHZ*2FLOPs/Cycle=6374.4GFLOPs=6.3TFLOPs

现在ML繁荣的时代,对64bit长度的浮点运算需求不是那么的大,反而是32bit或者16bit的浮点运算的需求比较大。

因此nvidia 最新的tesla一直在强调单精度甚至半精度,turing就是这样的。

intel为了加速这些计算,也在其处理器中实现了一些加速低精度运算的指令。

7. 流水线处理器的控制器实现方式更类似于

凸轮控制器的工作原理:凸轮控制器的转轴上套着很多(一般为12片)凸轮片,当手轮经转轴带动转位时,使触点断开或闭合。例如:当凸轮处于一个位置时(滚子在凸轮的凹槽中),触点是闭合的;当凸轮转位而使滚子处于凸缘时,触点就断开。由于这些凸轮片的形状不相同,因此触点额闭合规律也不相同,因而实现了不同的控制要求。手轮在转动过程中共有11个档位,中间为零位,向左、向右都可以转动5档。凸轮控制器,亦称接触器式控制器。因为它的动、静触头的动作原理与接触器极其类似。至于二者的不同之处,仅仅有别于凸轮控制器是凭借人工操纵的,并且能换接较多数目的电器,而接触器系具有电磁吸引力实现驱动的远距离操作方式,触头数目较少。应用范围:应用于钢铁、冶金、机械、轻工、矿山等自动化设备及各种自动流水线上。调整凸轮张角及凸轮组的相对角度可以相应的改变其感应时间。基本元件由凸轮脉冲盘、刻度盘、角度调节盘、电子接近 开关构成,各部件之间用垫片隔开,并通过刻度盘键槽与刻度盘凸键相连,其中脉冲盘是由两个半径相差3mm半圆形盘组成,与角度调节盘固定连接,并用外壳罩住,具有结构紧凑、性能可靠、调整方便等特点。开关与凸轮片不接触,无火花、无压力,迅速地发出指令,动作灵敏可靠。使用保养方法:1、按照电器原理图的要求,分别遂档操作控制器,观察触头的分合是否与接线图中触头分合程序相符,如不符,应予以调整,所有导线由基座下端两接线孔引出。 2、通电前必须检查电动机和电阻器有关电气系统的接线是否正确,接地是否可靠。 3、通电后应按相应凸轮控制器细心检查电动机运转情况,若有异常,应立即切断电源,待查明原因后方可继续通电。 4、控制器应当按要求经常检修: a、所有螺钉联接部分必须紧固,特别是触头接线螺钉; b、摩擦部分应经常保持一定的润滑; c、触头表面应无明显熔斑,烧熔的部分用细锉刀精心修理,不可用砂纸打磨; d、损坏的零件要及时更换。

顶一下
(0)
0%
踩一下
(0)
0%