Raspberry pi 4 et problèmes

Bonjour,

J’ai acheté une raspberry pi 4 il y a quelques temps pour y mettre un serveur domoticz. Sur ce dernier j’ai ajouté des modules z-wave, zigbee2mqtt, remonté téléinfo.

J’ai bien eu du mal à tout faire reconnaitre car les ports USB de la raspberry ne reconnaissaient pas les dongle USB2. J’ai dû acheter un hub USB 2 pour voir enfin apparaître les matériels sur le système.

J’ai également mis un ventilateur car elle chauffe énormément. Mais j’ai fini par y mettre un cure dent car le ventilo fait un bruit qui me gonfle. Malgré les dissipateurs thermique, elle tourne autour des 78°C actuellement !! Énorme par rapport à une pi3 juste à côté qui elle tourne autour des 40°C. J’ai lu pas mal de choses sur le net à ce sujet mais il semble que rien n’y fait sur mon matériel …

Bref J’y ai mis une raspbian buster lite et je suis en 4.19.105-v7l+. Depuis que je l’ai j’ai des soucis que je n’arrive pas à résoudre, et pour de la domotique c’est bien problématique:

  • Le système crash de manière aléatoire. Il peut fonctionner sans problème pendant 1 semaine, puis crasher 4 fois consécutif en l’espace de 2j.
  • Il y a des pertes de connexions réseau de manière aléatoire. Je n’utilise pas le wifi. Tout est filaire. Je m’en suis rendu compte car sur ma tablette qui gère la domotique j’ai un indicateur renvoyé par domoticz qui test l’accès à mon système domotique autonome de gestion de la piscine. Et par moment l’accès à l’API de la piscine ne se fait plus alors que depuis le PC aucun problème.

J’ai essayé de changer la carte SD pour une carte qui vient d’un raspberry pi 2 que je n’utilise plus (mon ancien kodi. Je l’ai remplacé par une android box). Même problème.

Pour le réseau j’ai essayé de le forcer en 100Mbits, même problème. ET je n’ai toujours pas résolu le problème de chauffe.

Voilà quelques logs du dmesg qui apparaissent de manière aléatoire. Ces logs datent de ce matin, mais je n’ai pas eu de crash encore.

Si vous avez une idée …

[Thu May  7 09:49:49 2020] rcu: INFO: rcu_sched detected stalls on CPUs/tasks:
[Thu May  7 09:49:49 2020] rcu: 	(detected by 3, t=2102 jiffies, g=4273381, q=89)
[Thu May  7 09:49:49 2020] rcu: All QSes seen, last rcu_sched kthread activity 2102 (12558007-12555905), jiffies_till_next_fqs=1, root ->qsmask 0x0
[Thu May  7 09:49:49 2020] luaThread       R  running task        0  9792      1 0x00000002
[Thu May  7 09:49:49 2020] [<c0212e04>] (unwind_backtrace) from [<c020d5e0>] (show_stack+0x20/0x24)
[Thu May  7 09:49:49 2020] [<c020d5e0>] (show_stack) from [<c024d974>] (sched_show_task.part.15+0xd0/0xfc)
[Thu May  7 09:49:49 2020] [<c024d974>] (sched_show_task.part.15) from [<c024d9c4>] (sched_show_task+0x24/0x28)
[Thu May  7 09:49:49 2020] [<c024d9c4>] (sched_show_task) from [<c0294ce4>] (rcu_check_callbacks+0x888/0x968)
[Thu May  7 09:49:49 2020] [<c0294ce4>] (rcu_check_callbacks) from [<c029d0a0>] (update_process_times+0x40/0x6c)
[Thu May  7 09:49:49 2020] [<c029d0a0>] (update_process_times) from [<c02af8a0>] (tick_sched_handle+0x64/0x70)
[Thu May  7 09:49:49 2020] [<c02af8a0>] (tick_sched_handle) from [<c02afb14>] (tick_sched_timer+0x5c/0xb8)
[Thu May  7 09:49:49 2020] [<c02afb14>] (tick_sched_timer) from [<c029dc28>] (__hrtimer_run_queues+0x164/0x320)
[Thu May  7 09:49:49 2020] [<c029dc28>] (__hrtimer_run_queues) from [<c029e848>] (hrtimer_interrupt+0x130/0x2a4)
[Thu May  7 09:49:49 2020] [<c029e848>] (hrtimer_interrupt) from [<c0846028>] (arch_timer_handler_phys+0x40/0x48)
[Thu May  7 09:49:49 2020] [<c0846028>] (arch_timer_handler_phys) from [<c0287614>] (handle_percpu_devid_irq+0x88/0x23c)
[Thu May  7 09:49:49 2020] [<c0287614>] (handle_percpu_devid_irq) from [<c0281700>] (generic_handle_irq+0x34/0x44)
[Thu May  7 09:49:49 2020] [<c0281700>] (generic_handle_irq) from [<c0281e50>] (__handle_domain_irq+0x6c/0xc4)
[Thu May  7 09:49:49 2020] [<c0281e50>] (__handle_domain_irq) from [<c0202244>] (gic_handle_irq+0x4c/0x88)
[Thu May  7 09:49:49 2020] [<c0202244>] (gic_handle_irq) from [<c02019bc>] (__irq_svc+0x5c/0x7c)
[Thu May  7 09:49:49 2020] Exception stack(0xdc5cbcd8 to 0xdc5cbd20)
[Thu May  7 09:49:49 2020] bcc0:                                                       c09d3bf4 00000000
[Thu May  7 09:49:49 2020] bce0: 40000093 40000093 80000013 80000013 00000598 deb86e78 dc5cbdc4 dc5cbdc8
[Thu May  7 09:49:49 2020] bd00: deb86e8c dc5cbd3c c10051c4 dc5cbd28 00000000 c09d3c08 40000013 ffffffff
[Thu May  7 09:49:49 2020] [<c02019bc>] (__irq_svc) from [<c09d3c08>] (_raw_spin_unlock_irqrestore+0x50/0x70)
[Thu May  7 09:49:49 2020] [<c09d3c08>] (_raw_spin_unlock_irqrestore) from [<c0398cf4>] (kmap_high_get+0x74/0x80)
[Thu May  7 09:49:49 2020] [<c0398cf4>] (kmap_high_get) from [<c021c4b0>] (kmap_atomic+0x5c/0x198)
[Thu May  7 09:49:49 2020] [<c021c4b0>] (kmap_atomic) from [<c06266d8>] (pin_page_for_write+0xe0/0x170)
[Thu May  7 09:49:49 2020] [<c06266d8>] (pin_page_for_write) from [<c06269ac>] (__copy_to_user_memcpy+0xac/0x1e8)
[Thu May  7 09:49:49 2020] [<c06269ac>] (__copy_to_user_memcpy) from [<c0626e10>] (arm_copy_to_user+0x50/0x5c)
[Thu May  7 09:49:49 2020] [<c0626e10>] (arm_copy_to_user) from [<c062c76c>] (copyout+0x38/0x44)
[Thu May  7 09:49:49 2020] [<c062c76c>] (copyout) from [<c06301c0>] (copy_page_to_iter+0x22c/0x4e0)
[Thu May  7 09:49:49 2020] [<c06301c0>] (copy_page_to_iter) from [<c03dec64>] (pipe_read+0xc4/0x2fc)
[Thu May  7 09:49:49 2020] [<c03dec64>] (pipe_read) from [<c03d528c>] (__vfs_read+0x10c/0x16c)
[Thu May  7 09:49:49 2020] [<c03d528c>] (__vfs_read) from [<c03d5388>] (vfs_read+0x9c/0x168)
[Thu May  7 09:49:49 2020] [<c03d5388>] (vfs_read) from [<c03d59d0>] (ksys_read+0x74/0xe8)
[Thu May  7 09:49:49 2020] [<c03d59d0>] (ksys_read) from [<c03d5a5c>] (sys_read+0x18/0x1c)
[Thu May  7 09:49:49 2020] [<c03d5a5c>] (sys_read) from [<c0201000>] (ret_fast_syscall+0x0/0x28)
[Thu May  7 09:49:49 2020] Exception stack(0xdc5cbfa8 to 0xdc5cbff0)
[Thu May  7 09:49:49 2020] bfa0:                   00001000 a80b32f0 0000002b a80b32f0 00001000 00000000
[Thu May  7 09:49:49 2020] bfc0: 00001000 a80b32f0 0000002b 00000003 000005e8 b24f413c 00000000 b24a3b58
[Thu May  7 09:49:49 2020] bfe0: 00000002 9fdfd458 00000000 b6a228bc
[Thu May  7 09:49:49 2020] rcu: rcu_sched kthread starved for 2102 jiffies! g4273381 f0x2 RCU_GP_WAIT_FQS(5) ->state=0x0 ->cpu=3
[Thu May  7 09:49:49 2020] rcu: RCU grace-period kthread stack dump:
[Thu May  7 09:49:49 2020] rcu_sched       R  running task        0    10      2 0x00000000
[Thu May  7 09:49:49 2020] [<c09cdd3c>] (__schedule) from [<c09ce3ac>] (schedule+0x50/0xa8)
[Thu May  7 09:49:49 2020] [<c09ce3ac>] (schedule) from [<c09d2364>] (schedule_timeout+0x1d0/0x428)
[Thu May  7 09:49:49 2020] [<c09d2364>] (schedule_timeout) from [<c02913b0>] (rcu_gp_kthread+0x4ac/0xa30)
[Thu May  7 09:49:49 2020] [<c02913b0>] (rcu_gp_kthread) from [<c024468c>] (kthread+0x138/0x168)
[Thu May  7 09:49:49 2020] [<c024468c>] (kthread) from [<c02010ac>] (ret_from_fork+0x14/0x28)
[Thu May  7 09:49:49 2020] Exception stack(0xef923fb0 to 0xef923ff8)
[Thu May  7 09:49:49 2020] 3fa0:                                     00000000 00000000 00000000 00000000
[Thu May  7 09:49:49 2020] 3fc0: 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000
[Thu May  7 09:49:49 2020] 3fe0: 00000000 00000000 00000000 00000000 00000013 00000000

Je peux pas te repondre pour tout, mais deja je trouve bizarre que l’usb2 ne soit pas detecté, j’ai moi ca amrche nickel, et pour les problemes de surchauffe ils ont deployé une MAJ y’a quelque temps pour amoindrir le probleme, donc si tu ne les as aps faites fonce !

Mais c’ets vrai que la temperature m’as l’air quand meme assez elevé ! Ton probleme pourrait peut etre venir de là… Ne le prive pas de ventil, il va fondre ! ^^

Pour des conseils plus approfondi je laisse les autres repondre (:

Le ventilo tourne et ça fait bien redescendre la température, mais ça ne l’empêche pas de planter.
Pour l’USB 2, c’étais la clé z-wave qui n’était pas reconnu du tout par le système. Je suis passé par un hub USB 2 sinon plus de volets roulants contrôlés chez moi …

J’ai l’impression que cette version n’est pas complètement sec. Je viens de faire une maj complète du système + du rpi (rpi-update). On verra si les problèmes continuent. Si c’est le cas, adieu la rpi 4. Elle servira de frisbee :grin:

@azer

Annonce: échange véritable freebee contre Raspberry PI4 ! :smiley:

A+

hahaha. Pour le moment pas de plantage alors je garde. Par contre je pourrais éventuellement faire un échange rpi 3 avec cette rpi 4 si au final ça ne fonctionne pas …

Je reviendrai poster le résultat des maj la semaine prochaine :slight_smile:

1 J'aime

Bon pour le moment la console a planté. Le clavier ne répond plus du tout. Sur l’écran je vois que le login est toujours affiché. Par contre le réseau et le ssh fonctionnent toujours … T° à 55 avec le ventilo activé. Je doute que les updates solvent mon problème …

C’est vraiment bizarre ton problème de température avec le ventilo.
Tu as juste enlevé le couvercle du boitier?
Le miens est nu comme un ver avec son ventilo avec le proc a 100% il depasse pas 45°

La carte est dans un boitier avec un ventilo dessus. Ceci explique la différence de T°. Ça s’est un peu rafraîchit en ce moment et du coup la T° est autour des 52°C.

Mais ça n’explique pas les plantage. J’ai une raspberry pi 3 dans le local piscine, en plein été elle monte à presque 80°C et elle ne plante pas. Ce n’est pas 60°C qui ferait planter la RPI 4…

J’ai pensé que le prob venait du teleinfo. Je l’ai donc débranché de manière temporaire, mais elle plante quand même. J’ai un plugin qui teste la présence des téléphones et si la TV est allumé. Ca donne droit à des message « promiscuous mode » dans le /var/log/messages. J’eai désactivé également ces checks. Même prob, la rpi plante quand même. J’ai déjà essayé de réinstaller le système intégralement, même soucis.

La seule chose que je n’ai pas encore fait est de réinstaller le système complètement sur une autre carte SD. Mais pour le moment les stack trace que je vois dans le dmesg et cités plus haut ne font pas références à un problème de carte SD.

1 J'aime

Sinon tu peux contacter le service client de l’endroit où tu l’as acheté

bonne idée. je vais essayer. Ça fait un moment que je l’ai acheté. Je vais essayé …

1 J'aime

Il est peu être encore sous garantie ?Chez Kubii par exemple la garantie dure 2 ans.

je ne sais plus où je l’ai commandé.

Bon ben voilà. Cela fait maintenant 15j que j’ai mis la carte sd dans une raspberry pi 3 et que ça tourne sans aucun plantage ! J’y ai même ajouté homebridge en plus de tout ce que j’avais mis, et j’ai pu retirer le hub USB 2 et brancher directement tout mon matériel sur la rpi.

La version 4 n’est pas à la hauteur de ses promesses.