HFish/docs/debug.md
2021-06-11 11:12:36 +08:00

95 lines
3.1 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

### 常见问题排查
> 节点红色离线而蜜罐服务却是绿色的启用?
![](https://hfish.cn-bj.ufileos.com/images/WechatIMG3065.jpg)
解决办法:
1. 检查节点到管理端的网络连通情况,并等待……
```shell
节点每90秒连接server的4433端口一次180秒内连接不上即显示离线。
在刚刚完成部署,或网络不稳定的时候会出现这种情况。
这种时候等2~3分钟如果节点恢复绿色在线那通常过一会儿蜜罐服务也会从绿色的启用变成绿色的在线。
```
2. 检查管理端防火墙以及ACL策略是否放行了节点对server 4434端口访问的权限
```shell
#可以用wget进行测试
wget 127.0.0.1:4433
```
3. 如果确认网络访问正常节点在server那里始终离线需要检查节点上的进程运行情况。如果进程运行异常需要杀死全部关联进程后重启进程并记录错误日志。
```shell
#检查./client的进程是否运行正常
ps aux | grep client
#检查./service的进程是否运行正常
ps aux | grep service
```
> server部署完成后web页面始终无法打开
解决办法:
1. 确认server进程的运行情况和4433端口开放情况如果不正常需要重启server进程并记录错误日志
```shell
#检查./server的进程是否运行正常
ps aux | grep server
#检查端口是否正常开放
ss -ntpl
#节点端日志在安装目录下client/logs文件夹内,文件名称为
client.log
#蜜罐服务的日志在节点端安装目录下client/service/蜜罐id 文件夹,文件名称为
蜜罐id.log
```
2. 检查堡垒机是否开放了对server4433端口的访问
> 节点在线,部分蜜罐服务在线,部分蜜罐服务离线
解决办法:
1. 确认蜜罐服务进程是否还在运行?
```shell
#检查./service的进程是否运行正常
ps aux | grep service
#如果进程确实挂了,查看服务的日志
```
2. 确认是否端口冲突?
```shell
这个问题常见默认22端口的SSH服务刚启动client的时候服务在线过了一会儿后服务离线。
用ss -ntpl检查该蜜罐服务的端口是否被占用
如果被占用,建议修改该业务的默认端口。
如果在部署节点前先安装部署流程运行了node.sh脚本的话那么原则上22端口应该不会冲突。但是之前在hbyc的客户现场发现客户系统中默认的ssh端口不是由sshd.service监听的而是ssh.socket提供的。我的脚本就无效了。
```
> 变更服务模板后,蜜罐新服务访问不到
```shell
在OneFish当前的产品结构中管理端永远不会主动连接节点进行节点配置的变更。
而是在管理端上,生成一个配置,等待节点来拉取。
节点每90秒尝试连接管理端一次获取到变更数据后还需要从管理端上拉取新的服务解压服务包并运行。
运行服务的结果会在下一个90秒回连时上报到管理端。
这个流程最慢的话可能会有一个3分钟左右延时。
所以刚刚变更蜜罐服务后,请大家稍微等等。
```