9Tactical Rewind SelfCorrection via Backtracking in Visionand Language

[9]Tactical Rewind_ Self-Correction via Backtracking in Vision-and -Language Navigation

Contribution § 이전 연구 : 성능 향상을 위해 Beam Search사용 § SPL 성능이 낮고, 자원 낭비 심함 FAST(Frontier Aware Search with back. Tracking) Navigator 제안 § FAST Navigator § local, global info를 통해 부분 경로를 scoring, 비교하며 동작 결정 § 필요할 경우, backtracking을 수행

local, global information §

Framework §

에이전트의 동작 시퀀스 Q 1. Should we backtrack? Q 2. Where should we backtrack? Q 3. Which visited node is most likely to be the goal? Q 4. When to terminate the search? § Q 1 ) Backtracking여부 판단 § Explore, Exploit 전략 제안 § Explore : cost상관없이 현 상황에 가장 좋은 지점으로 backtracking § beam search 와 비슷하지만, 다음 partial trajectory로 간다 § Exploit : agent의 현 위치 기준으로 가장 최적의 action을 택함(다른 곳 Backtracking하지 x) § 일종의 greedy 방식과 비슷, 다만 완전히 이상한 장소에 도달했을 경우엔 Backtracking을 수행

에이전트의 동작 시퀀스 local info만 고려 local info, global info를 여러 방법으로 함께 고려 Scoring partial trajectory Scoring candidate trajectory

FAST framework algorithm §