HADOOP

[ Impala ] illegalstateexception Grouping expr NULL return type BOOLEAN but its output tuple slot has type NULL_TYPE 에러 해결

Jerry_JH 2023. 8. 3. 23:39
728x90

 

Impala 에서 쿼리를 돌리다가 중복 데이터가 나와서 중복데이터를 제거하기 위해 DISTINCT 를 사용했다. 



쿼리를 다시 돌렸을 때, 해당 에러가 발생했다.

illegalstateexception Grouping expr NULL return type BOOLEAN but its output tuple slot has type NULL_TYPE

 

구글링을 했었을 때, 다행히도 해당 에러에 대해 아파치 이슈로 올라와 있었다. 

https://issues.apache.org/jira/browse/IMPALA-4042

 

[IMPALA-4042] count(distinct NULL) fails on a view - ASF JIRA

Affects Version/s: Impala 2.7.0

issues.apache.org

 

해결방법은 간단하다.

DISTINCT 를 사용하여 나오는 결과값에 직접적으로 NULL이 있으면 해당 에러가 발생한다.

 

그래서 NULL 값을 CAST 를 이용하여 BOOLEAN으로 변경하면 해당 에러가 발생도 안하고 중복도 제거할 수 있다.

CAST( NULL AS BOOLEAN )

 

 

728x90