728x90
Impala 에서 쿼리를 돌리다가 중복 데이터가 나와서 중복데이터를 제거하기 위해 DISTINCT 를 사용했다.
쿼리를 다시 돌렸을 때, 해당 에러가 발생했다.
illegalstateexception Grouping expr NULL return type BOOLEAN but its output tuple slot has type NULL_TYPE
구글링을 했었을 때, 다행히도 해당 에러에 대해 아파치 이슈로 올라와 있었다.
https://issues.apache.org/jira/browse/IMPALA-4042
[IMPALA-4042] count(distinct NULL) fails on a view - ASF JIRA
Affects Version/s: Impala 2.7.0
issues.apache.org
해결방법은 간단하다.
DISTINCT 를 사용하여 나오는 결과값에 직접적으로 NULL이 있으면 해당 에러가 발생한다.
그래서 NULL 값을 CAST 를 이용하여 BOOLEAN으로 변경하면 해당 에러가 발생도 안하고 중복도 제거할 수 있다.
CAST( NULL AS BOOLEAN )
728x90
'HADOOP' 카테고리의 다른 글
[ Hadoop ] ACID SQL Update error (Map operator initialization failed) - HIVE (2) | 2022.07.25 |
---|---|
[ Impala ] ExecQueryFlnstances rpc query_id failed 에러 해결 (0) | 2022.03.07 |
[ Hadoop ] HDFS 에 파일 UPLOAD 하기 (0) | 2022.02.25 |