Устанавливал в GKE (Google Kubernetes Engine) кластер Cilium с Istio в режиме ambient и столкнулся со случайными ошибками readiness/liveness проб. Версия GKE 1.34.3, Cilium 1.18.4 и Istio 1.26.3 - не самые свежайшие версии, но работают в других окружениях.
Факты таковы:
- из десятка подов которые разворачиваются в тестовом окружении один или несколько не проходит readiness/liveness пробу
- внутри пода и с соседнего пода можно запросить нужный URL который используют пробы
- если вручную удалить этот под, то он начинает работать нормально
- автоматический рестарт из-за liveness не исправляет ситуацию
Я уже сталкивался с "отвалившимися" пробами после включения Istio Ambient, но тогда пробы не работали в 100% случаев, а здесь это происходит случайным образом. Исправление удалением пода намекает на проблемы связанные с работой CNI.






