部署好了无法访问?或部署不成功?或部署过程中有报错?
一、查看安装过程中的日志,检查是否出现下列关键报错信息
1、0.0.0.0:xxxx:bind:address already in use
该报错为端口冲突,主要看 xxxx 具体为什么端口。
解决方法:
3306 端口即 MySQL 端口冲突,MySQL 相关 - DataEase 文档
80 端口即 DataEase 服务端口冲突,安装配置相关 - DataEase 文档
2、The container name “/mysql” is already in use by container
该报错为容器名称报错,一般只会出现 mysql 容器名称冲突的问题。
解决方法:
修改 MySQL 容器名即可,MySQL 相关 - DataEase 文档
3、for doris-fe container “xxxx” is unhealthy
doris 有两个组件,doris-fe 和 doris-be,doris-fe 依赖于 doris-be,当我们在启动服务的时候,受限于服务器性能原因,doris-be 启动可能会比较慢,规定时间内未启动完成,doris-fe 就不会再启动了
解决方法:
可参考以下链接处理:安装启动相关 - DataEase 文档
4、Pool overlaps with other one on this address space
网段冲突问题导致的报错。
解决方法:
可以参考以下链接调整下运行环境的 docker 网段:安装配置相关 - DataEase 文档
二、安装部署日志已经被刷掉了,无法查看,或安装部署日志无以上对应的报错信息。
我们可以执行 dectl status 查看服务状态
1、 mysql 容器 exit 1
执行 docker logs -f mysql --tail=100 查看容器日志,如下图所示则为文件权限问题。
解决方法:
执行 umask 0022 && dectl uninstall && rm -rf /opt/dataease,再执行 sh install.sh 重新安装。
若返回信息如下图所示,则为用户权限问题。
解决方法:
使用 root 用户安装,或者命令前加上 sudo,sudo sh install.sh
2、dataease 容器 exit 1
执行 docker logs -f dataease --tail=100 查看容器日志
日志中有大量的数据库连接信息报错,则可参照如下方案解决
检查 /opt/dataease/conf/dataease.properties 及 /opt/dataease/.env 里的 MySQL 相关配置,修改完成确认无误后再执行 dectl reload 重新加载服务。
日志中出现如下字样:Schema dataease contains a failed migration to version xx !”
该问题一般有如下两种原因:
- 第一个是创建数据库的时候字符集等不符合官方要求。
- 第二个是异常停止再启动,原先的脚本没执行完,因此未记录在 dataease_version 表里,再次执行时报错。
解决方法:
建议删库,重建库,再重启服务,参考标准建库语句。离线安装 - DataEase 文档
标准建库语句:
CREATE DATABASEdataease
DEFAULT CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;
3、doris-fe 容器 unhealthy
-
考虑磁盘空间不足,执行 df -h 查看磁盘剩余空间,只剩2-4G一般都是无法启动的。
-
考虑内存不足,执行 free -h 查看机器剩余可用内存。
-
如果是 windows 部署,需要考虑行尾符问题,具体可参考如下链接:【常见问题】Windows 使用 docker-compose 部署 Kettle 及 Doris , doris-fe 无限重启问题 - FIT2CLOUD 知识库
4、所有容器状态均为 healthy ,(除 kettle ,kettle 未做健康检查)
- 在机器上执行 curl localhost:80,观察是否有如图所示的返回:
如果无返回,或者提示 Connection refused,则说明容器网络存在问题,可按照如下思路进行排查
1、排查网桥冲突问题,某些操作导致很多同网段的网桥冲突。ip a 查看 br- 开头的网桥,如果存在多个,按照如下方法进行操作:
service dataease stop && service docker stop ,删除仍然存在的网桥,再执行 service docker start && service dataease start 启动服务。
2、 防火墙问题:刚开始关闭防火墙,后来又开了,docker 没重启等。
service dataease stop && service docker restart && service dataease start
3、终极法则:重启大法好。
如果有返回,则说明服务正常启动,这时候就需要去排查安全组、网络策略等问题了。
一些页面报错问题
Communication link failed
非常常见的问题,之前在知识库上也整理过相应的文章,可以对照着场景去进行排查
【常见问题】Communication link failed 问题汇总 - FIT2CLOUD 知识库
xxxxx time out
前端请求超时,可在系统管理-系统参数对超时时间进行调整。
数据库相关的一些报错:
- SELECT list is not in GROUP BY clause
- ORDER BY clause is not in SELECT list
- Row xxx was cut by GROUP_CONCAT()
- V_AUTH_MODEL doesn’t exist
- QRTZ_xxxx doesn’t exist
等等,基本上都是 MySQL 的配置问题
参照官方文档调整 MySQL 相关配置即可解决:离线安装 - DataEase 文档