→ LSTM과 GRU는 비슷한 성능을 보인다고 알려져있으나, GRU가 학습 속도가 더 빠름

(경험적으로 데이터 양이 적으면 parameter의 양이 적은 GRU가 좀 더 낫다는 평가도 있음)