1. 程式人生 > >重啟叢集之後,ambari與主機失去心跳無法恢復的解決辦法

重啟叢集之後,ambari與主機失去心跳無法恢復的解決辦法

啟動ambari服務表示已經存在:
ERROR: ambari-agent already running

異常:
the server has not received a heartbeat from this host for more than 3 minutes 3分鐘之後失去心跳了

**=========================stop 啟動 和restart 都不行,ambari仍然不能監控叢集**

檢視/var/log/ambari-agent/ambari-agent.log日誌列印:
日誌資訊:
ERROR 2018-11-12 05:48:14,443 NetUtil.py:96

- EOF occurred in violation of protocol (_ssl.c:579)
ERROR 2018-11-12 05:48:14,444 NetUtil.py:97 - SSLError: Failed to connect. Please check openssl library versions.
Refer to: https://bugzilla.redhat.com/show_bug.cgi?id=1022468 for more details.
WARNING 2018-11-12 05:48:14,444 NetUtil.py:124 - Server at https://master01:8440
is not reachable, sleeping for 10 seconds…
INFO 2018-11-12 05:48:24,444 NetUtil.py:70 - Connecting to https://master01:8440/ca

什麼是SSL ERROR:
SSL證書,也稱為伺服器SSL證書,是遵守SSL協議的一種數字證書,由全球信任的證書頒發機構(CA)驗證伺服器身份後頒發。將SSL證書安裝在網站伺服器上,可實現網站身份驗證和資料加密傳輸雙重功能,有效防止機密資料在傳輸過程中被竊取和纂改,有效防止釣魚網站渾水摸魚盜取使用者財產。

原因:可能是python升級或安裝了某些模組導致

檢視python版本的命令: python -V
檢視python的位置:which python

解決辦法:vim /etc/ambari-agent/conf/ambari-agent.ini

在[security] 新增如下一行
[security] 的節點下,加入:
force_https_protocol=PROTOCOL_TLSv1_2

重啟ambari-agent,# ambari-agent restart ============== 解決問題