一千萬個為什麽

搜索

Docker管理員正在失去AWS的法定人數



我已經在AWS上部署了Docker EE,直接從AWS Marketplace中選擇了包:Docker EE for AWS(標準版/高級版) - BYOL。該集群已在AWS上成功啟動和部署。

在UCP上部署了幾個堆棧後,發生了一些非常奇怪的事情,管理員無法看到對方,他們正在丟失Swarm中的仲裁,而 docker info 命令表明他們已經脫離了Swarm 。

AWS的AutoScalling組開始在Swarm中啟動新的管理器,新推出的管理器在幾分鐘後終止,因為它們也不是Swarm的參與者。實際上,AutoScalling組通過啟動新管理器並終止舊管理器進入無限循環。

最糟糕的是我丟失了Docker Services中的數據,無法恢復。

有任何想法嗎?

轉載註明原文: Docker管理員正在失去AWS的法定人數

一共有 1 個回答:

這似乎是從AWS的自動縮放集團不與泊塢窗群的配置,並在自動縮放默認的超時同步在泊塢群管理者是不能接受的。

實際上,EE CloudFormation模板中的健康檢查默認配置不正確,即使管理器正在運行並且運行穩定,運行狀況檢查失敗並且AutoScalling組也嘗試啟動新管理器。新推出的管理員在運行狀態之後無法成為集群參與者。