LiDAR기반 / RGB-D 기반 객체 검출은 다양한 분야에서 이용됨
Voxel 기반 3D CNN은 LiDAR point cloud 처리 시 좋음
⇒ inference 속도 느림 / 회전 추정 성능 떨어짐
sparse convolution ⇒ inference 속도 빠르게 함
angle loss regression ⇒ 회전 추정 성능 향상
새로운 데이터 증강 기법 ⇒ 수렴 속도, 성능 향상
이미지 기반 detection
⇒ LiDAR 바로 적용 불가능
LiDAR / RGB-D를 이용한 Point cloud 이용
이미지 + LiDAR과 같은 fusion 방식도 사용
VoxelNet에서는 raw point cloud를 적용하여 detection 수행
⇒ 연산량이 높아 실시간 사용 어려움
sparse conv + Rule을 이용하여 성능 향상 + 시간 단축
point cloud에 새로운 데이터 증강 기법
새로운 angle loss 도입하여 회전 잘 맞추도록 함
보조 direction classifier로 방향 맞추게 함
⇒ 실시간 가능하면서 SOTA 달성