실시간 스트림 데이터를 전처리할 때 달라지는 점
실시간 데이터 처리 환경을 구축한다고 해서 단순히 처리 속도만 빨라지는 것은 아니다. 배치 환경에서는 데이터를 충분히 모은 뒤 검증하고 처리할 수 있지만, 스트림 환경에서는 데이터가 들어오는 순간부터 검증과 변환이 동시에 이루어진다. 이 차이 때문에 기존 데이터 파이프라인 경험만으로는 스트림 데이터 처리 환경에 적응하기 어려운 경우가 많다. 특히 데이터 중복, 이벤트 순서 변경, 지연 시간 관리, … Read more