feature Si를 가진 후, input image의 feature를 유지하기 위해 concatenate 매커니즘을 사용하여 융합
5.6. Similarity Matching Cascade for Target Tracking
ByteTrack의 algorithm을 따름
score가 높은 detection들, 즉 Dhigh에 대해 먼저 association 수행
assiciation되지 못한 detection들, 즉 Dlow에 대해 수행하는 과정을 이용
그러나, object들이 가까워질 때 association하는 과정에서 IoU diastance만 사용하므로 문제가 발생
문제의 해결을 위해 ByteTrack의 장점과 SLM을 통합
1st association
motion matrix Mm, Dhigh와 TL의 appearance similarity matrix Ma를 계산
Mm의 경우, Dhigh와 TL의 IoU distance
Ma는 SLM을 이용하여 계산
즉, feature similarity
아래의 수식을 이용하여 gate function으로 이용할 cost matrix Chigh를 만들고, hungarian algorithm에 이를 이용하여 matching 수행
Chigh=Mm(i,j)−(1−Ma(i,j))
i는 i번째 tracklet, j는 j번째 detection
2nd association
1st assiciation과 마찬가지로 Dlow와 TLremain에 대해 Mm을 계산
Ma의 경우, low score detection과 track 사이의 similarity를 학습하기 위해 multi-template-SLM 이용
low score detection d을 다루기 위해 마지막 frame의 feature를 similarity 계산에 직접적으로 이용하면 신뢰할수 없는 score가 생성되고, 이를 해결하기 위해 track의 다른 frame들에 있는 feature를 memory bank F에 저장하여 이용
Ma(i,j)=max{SLM(fi,dj)| for all fi∈Fi}
Mm과 Ma를 이용하여 1st association에서의 Chigh처럼 cost matrix Clow를 만들고, hungarian algorithm에 이를 이용하여 matching 수행
association 과정이 끝나고, Dlow에서 matching되지 않은 detection과 TLRemain에서 matching되지 않은 track은 DRRemain과 TLRRemain에 저장
새로운 track을 초기화 하기 위한 threshold값 H를 정하여, H보다 높은 점수를 가진 DRemain의 detection은 새로운 track의 초기화에 이용
TLRRemain의 matching되지 않은 track은 lost object list LL에 저장하고, DRRemain은 background로 간주하며, LL에 track이 30 frame 이상 존재하는 경우에 LL에서 track 삭제
6. Experiment
MOT dataset에서의 성능 비교
attention의 feature dimension 수에 따른 성능 변화
gate function과 multi-template-SLM의 사용 여부에 따른 성능 변화
association 과정의 각 stage에서 similarity matrix의 종류에 따른 성능 변화