首页 > 代码库 > 扩充的热量管理
扩充的热量管理
发明领域
本发明通常涉及热量管理领域。更为具体地,本发明的实施例涉及基于系统中的器件之间的热量关系的热量管理。
背景技术
平台性能目标持续将通常在台式计算机系统的平台中所见的多个高功率器件引入到移动计算机系统的平台中。将相同的器件引入到台式和移动计算机系统的平台中具有一定的优点。然而,台式计算机系统和移动计算机系统的平台之间的散热能力的差异导致当在移动计算机系统的平台中实施某些高功率、高性能器件时会限制这些器件的性能。
详细说明
对于一个实施例,公开了用于计算机系统中的热量管理的方法和系统。可以存在多个散热区,每一个散热区具有两个或多个热可控器件。散热区中的热可控器件之间的热量关系可以用于改善散热区的热量管理。
传统的散热区
图1是示出具有单个散热区的现有技术系统的实例的图。通常,将散热区限定为平台实体并且在本文中其可以被称为传统的散热区。参考图1,传统的散热区100(在虚线内示出)可以包括处理器105。典型地,对于处理器105,描述了调速(throttling)和性能状态控制。传统的散热区100还可以包括其他器件110-140。处理器105可以包括嵌入式热传感器106。热传感器106可以用于监测处理器105和传统的散热区100的热状态。在传统的散热区100内的所有器件105-140当中,处理器105可以是包括嵌入式热传感器106的唯一器件。没有更多的对器件110-140的温度或热量控制的考虑。暗示着通过控制处理器105的性能状态,可以控制传统的散热区100的温度或热状态。多个散热区图2是示出根据一个实施例的包含多个散热区的系统的实例的图。可以将系统中的器件分组成两个或多个的散热区,例如在图2中虚线内示出的散热区201、202。
对于一个实施例,散热区201、202中的每一个可以分别具有其自己的热传感器206或207。对于另一实施例,散热区201、202中的每一个可以具有其自己的主动冷却器件(例如风扇)(未示出)。当不存在散热区专用主动冷却器件时,主动冷却器件245可以用于冷却散热区201、202中的器件205、210、……、235。将散热区中的器件耦合到专用主动冷却器件(未示出)是可能的。
热可控器件
对于一个实施例,散热区可以包括两个或多个热可控的器件。热可控器件能够提供关于其热状态的信息。对于一个实施例,热可控器件是与热传感器有关的器件。热传感器可以是嵌入式热传感器。该器件可以包括热接口(thermal?interface)以输出或提供关于其热限制(thermal?constraint)、其热状态等信息。
热状态可以包括当前的温度(例如,78摄氏度)。热状态还可以包括当前的热负载(CTL)(例如,4瓦特)。作为热可控器件,还可以包括具有提供关于其热限制的信息的能力的器件。热限制可以包括断点值(trip?point?value)、关于可能的(多个)性能状态(P状态)和/或可能的(多个)调速状态(T状态)的信息、等等。热限制可以包括当器件处于空闲时的负载信息和其最大负载信息,从而可以在给出当前负载的情况下推断出控制效果(例如,P状态或线性调速)。
断点值可以是这样的温度值:当热可控器件的当前温度越过或冲过该温度值时,由该器件产生信号。热可控器件可以具有一个或多个断点值。断点值可以是预设的并且可以通过软件进行动态调整。每一个断点值可以与不同的温度(例如,过热的、临界的、灾难性的、中间的等)有关,并且当被越过时,可能需要执行不同类型的冷却操作。
热可控器件的P状态和T状态可以与器件可以在其中工作的不同工作状态相对应。P状态可以提供更令人满意的功率与性能的折中(例如,减少20%的性能可以减少大约40%的平均功率)。T状态可以提供近似线性的功率与性能的折中(例如,减少50%的性能可以减少大约50%的平均功率)。P状态和T状态的概念对于本领域技术人员来说是公知的。
图3是示出根据一个实施例的由热可控器件提供的信息的实例的方框图。参考图3中的实例,由散热区300中的器件A(305)提供的信息可以包括其80摄氏度的当前温度、其82摄氏度的临界温度、其78摄氏度的第一断点值、以及其4瓦特的CTL。在该实例中还示出由器件B(310)和C(315)提供的信息。
不可控器件
根据一个实施例的散热区可以包括至少两个热可控器件和零个或多个的不可控器件。不可控器件是即使它可能具有一些散热但是也可能与热传感器无关的器件。不可控器件可能没有提供关于其热状态信息的热接口。不可控器件可能不能在不同的P状态或T状态下工作。参考图3中的实例,器件320被示为不可控器件。值得注意的是,不可控器件的温度会受到附近过热器件的温度的影响。同样地,热可控器件的冷却会间接地帮助冷却附近的不可控器件。可能有包括温度传感器但不包括P状态或T状态控制的器件,并且这些器件还会受到附近器件的过热温度的不良影响。
显著的和非显著的发热器件
散热区中的每一个热可控器件可以具有不同的热负载或负荷量。例如,参考图3,器件B(310)的CTL为15瓦特,而器件A(305)的CTL仅为4瓦特。在该实例中,将器件A(305)设置在接近于器件B(310)的位置,并且因此器件A(305)的热状态会显著地受到器件B(310)的热状态的冲击或影响。器件B(310)的热状态还会影响器件C(315)和不可控器件320的热状态。
当器件A(305)的当前温度越过其78摄氏度的第一断点值时,可以通过改变其P状态和/或T状态来降低器件A(305)的温度。对于一个实施例,还可以通过降低由另一器件(例如器件B(310))引起的热冲击或影响来降低一个器件(例如器件A(305))的温度。
对热敏感的器件
在散热区内,可以存在比其它器件对热更加敏感的器件。该器件可能不具有高的热负载并且可能具有很小的散热。例如,器件C(315)具有0.5瓦特的CTL。器件C(315)可以是无线局域网(WLAN)模块并且可以是热敏感的。同样地,仅通过依赖于其P状态和/或T状态,不足以控制对热敏感的器件C(315)的热状态。对于一个实施例,为了控制对热敏感的器件的热状态,可能需要减小由另一个具有较高热负载的热可控器件(例如,器件B(310))引起的热冲击或影响。值得注意的是,具有非常小的热负载的器件不太可能被热控制,除非当该器件自身处于超温状态下时。这是因为小热负载器件不会实质上影响同一散热区中的另一器件的热状态。同样地,具有高热负载的器件更有可能被热控制以帮助冷却同一散热区中的其它器件。
热量关系表(TRT)
器件的CTL可能会对另一器件的热状态以及散热区的热状态起作用。对于一个实施例,确立TRT以描述特定散热区内的器件之间的热量关系。同样地,散热区可以例如包括处理器、存储装置、存储器和作为数据输入的TRT,以及用于提供温度和断点值的器件接口。
图4示出根据一个实施例的TRT的实例。该实例中的TRT?400可以用于描述如图3所示的散热区300中的器件A(305)、B(310)和C(315)之间的各种热量关系。TRT?400可以被示为九项(3×3)的矩阵以容纳三个器件。每一项可以表示一个器件对另一器件的热影响。例如,项425表示器件A对器件B的热影响。
一个器件对另一器件的热影响不必是对称的。例如项425(A对B的热影响)和项435(B对A的热影响)可以不同。此外,在热量关系中一个器件的热负载完全盖过另一器件的热负载是可能的。TRT400还可以描述改变一个器件到多大程度才能使该改变影响另一器件、以及一个器件中的改变需要多长时间以影响另一器件(改变延迟时间)等等。
可以将热可控器件从平台上的一个位置重新设置到该平台上的另一位置。这种位置上的改变会影响器件之间的热量关系。这种改变可能发生在一个散热区内,或者其可能影响两个散热区(旧散热区和新散热区)。对于一个实施例,TRT?400可以是动态可更新的以便反映出器件之间的热量关系的改变。例如,当启动风扇时散热区中的气流会改变。这会导致热量关系的改变。对于一个实施例,在静态控制策略(一个不懂偏置/预算的策略)存在的情况下,可以更新TRT以影响该状态策略。
用户偏好设置
对于一个实施例,当控制散热区的热状态时,可以考虑用户偏好设置。用户接口可以用于指定用户偏好设置。用户偏好设置可以指向高性能或长电池寿命。高性能设置可以对应于高散热。长电池寿命设置可以对应于低散热和低性能。总的来说,被动冷却可以包括降低性能来冷却,而主动冷却可以包括使用能量来冷却或减少能量而不降低性能来冷却。对于一个实施例,当用户偏好设置指向性能时,可以在被动冷却技术之前使用主动冷却技术。对于另一实施例,当用户偏好设置指向低散热或节能(例如,长电池寿命)时,可以在主动冷却技术之前使用被动冷却技术。
对于一个实施例,用户偏好设置不仅可以指向性能或节能,还可以偏向于来自用户自身的特定优选或体验。例如,用户可以具有针对游戏体验的特定优选,这意味着处理器和图形控制器器件也许比网络器件获得更多的预算或资源分配。
策略管理器
策略管理器可以使用TRT来控制热可控器件或散热区的热状态。取决于实施,可以存在单个策略管理器,或者存在多个策略管理器实例,只要每一个散热区与热量管理器有联系以接收来自器件接口的信号并做出决定即可。策略管理器还可以采用用户偏好或操作系统(OS)需求作为输入。可以存在OS想要提供的最小性能目标。也存在具有最小性能目标的运行中的应用。同样地,这些潜在冲突的目标必须由策略管理器来调整以利用优先化方案决定做什么。策略管理器可以考虑的另一输入是涉及由许多系统共同使用的可能超出设备或机柜(rack)限制的能量的信息,并且策略管理器可以使用该信息作为最高优先级的输入。
当热可控器件的当前温度越过断点值时,该器件会产生超温信号并将其发送给策略管理器。策略管理器可以查询散热区中的每一个热可控器件来找出它们的热状态。这可以利用由器件提供的热接口来执行。策略管理器然后可以使用TRT来确定散热区中的哪一个器件对超温器件具有最高的热影响。策略管理器然后可以应用适当的主动或被动冷却操作。
策略管理器可能需要理解用户偏好设置以应用适当的主动或被动操作。对于一个实施例,当用户偏好设置指向性能时,策略管理器可以首先启动超温器件的专用主动冷却器件,如果有的话。当其不存在或者不足以冷却超温器件时,策略管理器则启动区专用主动冷却器件,如果有的话。当区专用主动冷却器件不存在或还不够时,策略管理器可以启动平台主动冷却器件以冷却超温器件。当还不够时,策略管理器则可以开始改变超温器件的P状态和/或T状态。
对于一个实施例,当应用被动冷却操作时,策略管理器可以限制对超温器件具有最高热影响的一个或多个器件以获得所希望的热状态。例如,策略管理器可以不将热可控器件指引到特定状态而是可以限制可用于该器件的(多个)顶端状态。(多个)顶端状态可以是较高的性能状态但也可能具有较高的散热。例如,假如一个器件具有五个P状态,则策略管理器可以将该器件限制到仅底端的三个P状态以便降低其散热。
策略管理器可以周期地查询超温器件以确保所执行的任何热量控制操作都是有效的。
策略管理器可以使用TRT来找出关于一个器件中的改变需要多长时间来影响超温器件的热状态的信息并使用该信息来确定何时进行对超温器件的下一次查询。
对于一个实施例,当策略管理器确定超温器件的热状态仍不可接受(例如,在断点处或之上)时,该策略管理器可以再次查询散热区中的每一个热可控器件,以找出它们的热状态并确定散热区中对超温器件具有最高热影响的下一器件。该下一器件可能与策略管理器在前一个查询后处理的器件相同。
对于一个实施例,策略管理器需要留意散热区中的哪些器件受到限制(例如,限制高性能状态),以便一旦超温器件的热状态得到缓解就尽可能地解除限制。如上所述,在散热区中可能存在一些不是热可控的、并且因此不能参与到TRT中或不能由策略管理器对其进行配置的器件。这些器件可以依赖于附近器件的热量管理以帮助控制它们的热状态。
对于一个实施例,当散热区的热状态超过区断点时,策略管理器也可以接收超温信号。一旦接收到该信号,策略管理器可以读取散热区中的所有器件的当前温度和断点。当一个器件的温度在断点之上时,则可以将P状态和/或T状态控制或主动冷却控制应用到该器件或散热区中引起超温状态的另一器件。
在连续的冷却操作之后,超温器件或超温散热区的热状态不能被缓解也是可能的。对于一个实施例,当不能修正热状态时,策略管理器可以关闭那些对系统操作不重要的器件。或者,策略管理器可以关闭整个系统。
处理过程图5是示出根据一个实施例的当接收到超温信号时由策略管理器执行的处理过程的实例的流程图。虽然可以从超温器件或从超温散热区接收超温信号,但是该实例是基于超温器件。在方框505,由策略管理器接收超温信号。在方框510,策略管理器可以读取散热区中的热可控器件的当前热负载。这可以使用热接口来进行。在方框515,策略管理器可以使用TRT来查找对超温器件具有最高热影响的器件。在方框520,从TRT中读取改变延迟。该改变延迟是对一个器件的热状态的改变对超温器件起作用所需要的时间。
在方框525,确定用户偏好设置。在方框530,根据用户偏好设置和来自TRT的信息来应用适当的冷却操作。在方框535,可以设置延迟定时器以等待冷却操作对超温器件起作用。在方框540,策略管理器可以调查或查询超温器件以确定其热状态。如果超温器件的热状态仍不可接受(例如,当前的温度超过断点),则该处理过程继续到方框510。否则,可以认为所执行的冷却操作是充分的。
图6是示出根据一个实施例的用于确定冷却操作的处理过程的实例的流程图。在方框605,执行测试以确定用户偏好设置是指向性能还是指向低散热或较长的电池寿命。如果其指向性能,则该处理过程继续到方框610,在此可以执行主动冷却操作。主动冷却操作可以包括启动器件专用主动冷却器件、散热区主动冷却器件和平台主动冷却器件中的一个或多个。该处理过程然后继续到方框620。
从方框605,如果用户偏好设置指向低散热(即,长电池寿命),则该处理过程继续到方框615,在此可以执行被动冷却操作。被动冷却操作可以包括将器件转变到不同的P状态和/或T状态。该器件可以是超温器件、或对超温器件具有高热量影响的器件、或者这两者。该处理过程然后继续到方框620。如上所述,策略管理器可以留意已被控制的器件以便当不利的情况得到改善时可以使这些器件恢复到其较高性能状态。
计算机系统图7示出根据一个实施例的计算机系统的实例。计算机系统700可以包括处理器705。处理器705可以是由英特尔公司(Santa?Clara,California)制造的奔腾处理器系列中的处理器。还可以使用其它的处理器。计算机系统700可以包括存储装置710和存储器715。存储器715可以是一个或多个静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、只读存储器(ROM)等的组合。
计算机系统700还可以包括策略管理器720、热量关系表(TRT)725和两个或多个散热区730-735。虽然未示出,但是散热区730可以包括两个或多个热可控器件。虽然未示出,但是计算机系统700还可以包括其它的器件以使得其能够执行各种功能。
SRC=https://www.google.com/patents/CN1957317A