在多任务(RTOS)环境中使用看门狗

xiaoxiao2021-02-28  10

        最近在SEGGER的博客上看到一篇有关在实时操作系统使用看门狗的文章。从一个失败的太空项目出发,分析了看门狗的作用及使用,自我感觉很有启发,特此翻译此文并推荐给各位同仁。为了阅读方便,有些航天领域名词本人添加了注释,读者也可自行搜索更详细的解释。当然限于个人水平,有不当之处恳请指正。大家也可以看原文:https://blog.segger.com/using-a-watchdog-in-a-multi-task-rtos-environment/。作者为Til Stork,其全文如下:

        Clementine是美国航空航天局在1994年1月25日发射的空间环境下测试传感器和航天器部件的卫星。由于缺乏几条看门狗程序,她的任务于1994年5月7日失效。

【注】Clementine是美国的一个航天器,官方称为深度空间计划科学实验,由NASA和导弹防御组织联合发射。

        Clementine在连续两个月进行了月球测绘后,离开月球轨道并连续前往她的下一个目标——近地球小行星Geographos。然而,Clementine所载电脑很快发生了故障,并切断了NASA对航天器的有效操作,并导致其中一个推进器不受控制。

【注】Geographos:1620号小行星颗阿波罗型小行星离地球近时400余万公里,其形状为极规则长条形,长宽比为4至5倍。

        NASA花了20分钟试图使系统得到恢复,但是无济于事。硬件复位命令终于使Clementine重新上线,但为时已晚。她已经耗尽了所有的燃料,而任务的延续必须被取消。

        在他们实施的软件超时明显失效时。负责Clementine软件的开发团队希望他们使用了硬件的看门狗定时器。

看门狗有什么作用?

        看门狗是一种直接集成到微控制器中或者外部连接到微控制器的硬件。其主要目的是在可以安全地假设系统已挂起或以其他方式执行不正确的情况下执行错误处理(通常为硬件复位)。

        看门狗的主要组件是一个计数器,最初被配置为一个特定的值,然后倒数为零。软件必须经常将该计数器重新设置为其初始值,以确保其不会达到零。否则,会出现故障,通常会重置CPU。这表明看门狗是最后的手段,只有当其他一切都失败时才采取这种选择。就像Clementine的情况一样。

如何喂狗

        然而,正确使用看门狗定时器并不像重新启动计数器那样简单(通常被称为喂狗或者踢狗)的过程。在其系统中运行看门狗定时器时,开发人员必须仔细选择看门狗的超时时间,以便看门狗在发生故障的系统可以执行任何不可逆转的恶意动作之前进行干预。

        在简单的应用中,特别是没有使用RTOS,开发人员通常会从主循环中提供看门狗。该方法仅需要配置适当的初始计数器值,它可以简单地选择任何超过整个主循环最坏的执行时间的值,至少有一个计时器周期。这通常是一个非常有效的方法,虽然有一些系统需要立即恢复,但更多系统只需要确保它们不会被无限期地挂起,这一方法能很好的实现之一目的。

在多任务(RTOS)环境中喂狗

        然而,在更复杂的系统中,特别是多任务系统,各种线程可能会因为各种原因潜在地挂起。一些线程可以长时间运行,例如线程等待潜在的网络通信。一个干净的方法可以定期喂养看门狗,同时确保每个不同的过程都处于健康状态,成为这些系统开发人员面临的主要挑战,例如需要关注的是:

操作系统是否正常执行高优先级任务是否耗尽CPU,完全阻止低优先级任务运行是否发生了阻止执行一个或多个任务的死锁任务程序是否正确执行

        开发人员还需要确保对其源代码执行的任何修改(无论是专用监视任务还是受监视任务的特定修改)都必须很小,并针对效率进行优化,以将侵扰性保持在最低限度。

RTOS增加看门狗支持

        因此,最先进的RTOS如SEGGER的embOS为客户提供综合的看门狗解决方案,以简化看门狗处理,从而减少任何开发过程的时间花费。

        这些解决方案应用的一般原则可能会因不同的RTOS而异。然而,在SEGGER,多功能性和易用性被认为是首要的,同时在内存使用和执行时间内将所需的占用空间最小化。因此,对于嵌入式专家来说,显然需要一套全面的API函数来实现:

单独注册任务,计时器,甚至带embOS看门狗模块的ISR。从任何所需的上下文灵活地测试预期看门狗状态的可能性。

        现在最终的实现只包括五个API函数,但功能足以满足任何预期的目的。

        使用这些API函数,一个任务可以简单地将其自身注册到embOS看门狗模块,并可以单独配置其超时时间。然后,任务可以通过调用一个简单的embOS API函数来定期发出正确的执行。所有被监视的任务是否在指定的超时时间内发出正确的执行信号,随后通过另一个单独的embOS API调用进行检查,该调用可以在专用看门狗任务内从OS_Idle()内执行,甚至从定期操作系统定时器中断服务程序或任何其他ISR。

        用户只需要提供和注册两个功能:第一个执行看门狗的硬件依赖的馈送,而另一个则在看门狗计数器达到零时指定进一步的动作。例如,这可以将日志文件存储到非易失性存储器中,在执行硬件复位或执行任何其他操作之前,包含有关系统状态的进一步信息。

结论

        当开始设计和开发具有看门狗的应用程序时,需要确保尽早决定如何使用它 。并考虑可以帮助您更快地实现的可用工具。至少,你不想被困在太空中,是吗?

欢迎关注:

转载请注明原文地址: https://www.6miu.com/read-1750133.html

最新回复(0)