一、問題概述
公司私有云平臺(tái)(基于阿里云)上的虛擬機(jī)存在ssh連接緩慢的問題。這些虛擬機(jī)通過VMware創(chuàng)建,再轉(zhuǎn)換為阿里云格式導(dǎo)入。部分虛擬機(jī)SSH連接時(shí)間長(zhǎng)達(dá)30秒以上,重啟主機(jī)后問題消失。已排除sshd_config文件中的UseDNS=no和GSSAPIAuthentication no配置問題。
二、問題診斷
1. 網(wǎng)絡(luò)排查:
內(nèi)網(wǎng)和本地環(huán)回測(cè)試(ssh 127.0.0.1)均出現(xiàn)連接緩慢。
2. SSH連接日志分析:
使用ssh -v命令查看詳細(xì)日志,發(fā)現(xiàn)僅認(rèn)證階段耗時(shí)過長(zhǎng),其他環(huán)節(jié)正常。
3. 系統(tǒng)日志分析:
/var/log/messages (SUSE) 或 /var/log/auth (Redhat) 日志顯示systemd-logind服務(wù)激活超時(shí):
... 2018-08-01T09:40:26.795639+08:00 www.361way.com cron[13491]: pam_systemd(crond:session): Failed to create session: Connection timed out 2018-08-01T09:40:26.796028+08:00 www.361way.com dbus[961]: [system] Failed to activate service 'org.freedesktop.login1': timed out 2018-08-01T09:40:26.796378+08:00 www.361way.com cron[13495]: pam_systemd(crond:session): Failed to create session: Activation of org.freedesktop.login1 timed out ...
排除圖形界面干擾后,問題依然存在。經(jīng)調(diào)查,此錯(cuò)誤提示指向systemd-logind服務(wù)問題。
三、解決方案
問題根源在于dbus服務(wù)重啟后,systemd-logind服務(wù)未同步重啟。 解決方法:重啟systemd-logind服務(wù)。
systemctl restart systemd-logind systemctl status systemd-logind
重啟后,SSH連接速度恢復(fù)正常(3秒以內(nèi))。