吐血整理 DataEase 部署运维常见的一些问题,欢迎来一起讨论。

部署好了无法访问?或部署不成功?或部署过程中有报错?

一、查看安装过程中的日志,检查是否出现下列关键报错信息

1、0.0.0.0:xxxx:bind:address already in use

该报错为端口冲突,主要看 xxxx 具体为什么端口。

解决方法:

3306 端口即 MySQL 端口冲突,MySQL 相关 - DataEase 文档
80 端口即 DataEase 服务端口冲突,安装配置相关 - DataEase 文档

2、The container name “/mysql” is already in use by container

该报错为容器名称报错,一般只会出现 mysql 容器名称冲突的问题。

解决方法:

修改 MySQL 容器名即可,MySQL 相关 - DataEase 文档

3、for doris-fe container “xxxx” is unhealthy

doris 有两个组件,doris-fe 和 doris-be,doris-fe 依赖于 doris-be,当我们在启动服务的时候,受限于服务器性能原因,doris-be 启动可能会比较慢,规定时间内未启动完成,doris-fe 就不会再启动了

解决方法:

可参考以下链接处理:安装启动相关 - DataEase 文档

4、Pool overlaps with other one on this address space

网段冲突问题导致的报错。

解决方法:

可以参考以下链接调整下运行环境的 docker 网段:安装配置相关 - DataEase 文档

二、安装部署日志已经被刷掉了,无法查看,或安装部署日志无以上对应的报错信息。

我们可以执行 dectl status 查看服务状态

1、 mysql 容器 exit 1

执行 docker logs -f mysql --tail=100 查看容器日志,如下图所示则为文件权限问题。

解决方法:

执行 umask 0022 && dectl uninstall && rm -rf /opt/dataease,再执行 sh install.sh 重新安装。

若返回信息如下图所示,则为用户权限问题。

解决方法:

使用 root 用户安装,或者命令前加上 sudo,sudo sh install.sh

2、dataease 容器 exit 1

执行 docker logs -f dataease --tail=100 查看容器日志

日志中有大量的数据库连接信息报错,则可参照如下方案解决

检查 /opt/dataease/conf/dataease.properties 及 /opt/dataease/.env 里的 MySQL 相关配置,修改完成确认无误后再执行 dectl reload 重新加载服务。

日志中出现如下字样:Schema dataease contains a failed migration to version xx !”

该问题一般有如下两种原因:

  • 第一个是创建数据库的时候字符集等不符合官方要求。
  • 第二个是异常停止再启动,原先的脚本没执行完,因此未记录在 dataease_version 表里,再次执行时报错。

解决方法:

建议删库,重建库,再重启服务,参考标准建库语句。离线安装 - DataEase 文档
标准建库语句:
CREATE DATABASE dataease DEFAULT CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;

3、doris-fe 容器 unhealthy

4、所有容器状态均为 healthy ,(除 kettle ,kettle 未做健康检查)

  • 在机器上执行 curl localhost:80,观察是否有如图所示的返回:

    如果无返回,或者提示 Connection refused,则说明容器网络存在问题,可按照如下思路进行排查

1、排查网桥冲突问题,某些操作导致很多同网段的网桥冲突。ip a 查看 br- 开头的网桥,如果存在多个,按照如下方法进行操作:
service dataease stop && service docker stop ,删除仍然存在的网桥,再执行 service docker start && service dataease start 启动服务。
2、 防火墙问题:刚开始关闭防火墙,后来又开了,docker 没重启等。
service dataease stop && service docker restart && service dataease start
3、终极法则:重启大法好。

如果有返回,则说明服务正常启动,这时候就需要去排查安全组、网络策略等问题了。

一些页面报错问题

Communication link failed

非常常见的问题,之前在知识库上也整理过相应的文章,可以对照着场景去进行排查
【常见问题】Communication link failed 问题汇总 - FIT2CLOUD 知识库

xxxxx time out

前端请求超时,可在系统管理-系统参数对超时时间进行调整。

数据库相关的一些报错:

  • SELECT list is not in GROUP BY clause
  • ORDER BY clause is not in SELECT list
  • Row xxx was cut by GROUP_CONCAT()
  • V_AUTH_MODEL doesn’t exist
  • QRTZ_xxxx doesn’t exist
    等等,基本上都是 MySQL 的配置问题

参照官方文档调整 MySQL 相关配置即可解决:离线安装 - DataEase 文档

1 个赞

大佬 666 :100:

https://kb.fit2cloud.com/archives/134
这个地址访问不了

已更新:【常见问题】Windows 使用 docker-compose 部署 Kettle 及 Doris , doris-fe 无限重启问题 - FIT2CLOUD 知识库

1 个赞