로브로스성동구, 서울, South Korea

AI Research Scientist - Reinforcement Learning

Project-Based

Description

ROBROS는 Multimodal Robot Manipulation 모델에 강화학습 (Reinforcement Learning; RL)을 적용하여 실험실을 벗어나 실제 작업 환경에서도 안정적으로 동작하게 만들 인재를 찾고 있습니다.

본 포지션은 Multimodal Manipulation Model에 맞는 RL 알고리즘을 연구·개발하고, imitation learning만으로는 학습이 어려운 고난도 행동을 효율적, 효과적으로 학습시키는 것을 핵심 목표로 합니다.

• Diffusion / Flow-matching / Auto-regressive 기반의 Multimodal 모델에 강화학습을 효과적으로 적용하기 위한 알고리즘 연구 •Imitation learning만으로는 어려운 Robot behavior를 효과적으로 학습시키는 강화학습 방법 연구

Offline-to-online 강화학습을 통한 모델 개선 • 기존에 수집한 offline data를 최대한 활용하는 offline-to-online sample-efficient 알고리즘 연구 • offline-to-online 강화학습을 모델 개발에 효율적으로 적용하기 위한 파이프라인 개발

• Multimodal 데이터를 활용하며 복합적인 task를 성공적으로 풀기 위한 최적의 reward model 연구·개발

정책 학습/배포 및 성능 평가 • Robot Manipulation Task를 위한 강화학습 알고리즘 개발, 학습, 배포

연구 결과 검증 및 협업 • 학습 Model을 실제 로봇에 적용하기 위해 하드웨어/소프트웨어 팀과 협업 수행

AI, 로보틱스 등 관련 분야 석사/박사학위 소지자 또는 이에 준하는 경력

탄탄한 머신러닝/딥러닝 지식 • Neural Network, Transformers, Diffusion, Flow Matching 등 핵심 모델 구조에 대한 깊은 이해 및 실무 활용 능력

모방학습 (IL) 및 강화학습 (RL) 이해 및 적용 경험 • IL / RL 알고리즘(Q-learning, Policy Gradients 등) 적용 경험 • Online/Offline RL 알고리즘(PPO, SAC 등)에 대한 이해 및 활용 경험 • domain randomization, curriculum learning, reward shaping 등 일반적인 RL 기법에 대한 친숙함

시뮬레이션 또는 실제 환경에서의 정책 학습 경험 • 시뮬레이션 또는 실제 Robot 환경에서 정책을 학습·검증해 본 경험

프로그래밍 및 엔지니어링 역량 • Python, C++ 등을 활용한 로보틱스 AI 모델 개발 및 최적화 능력

깊은 수학적 기반 • 확률/통계 이론, 최적화 이론, 강화학습 등에 대한 탄탄한 수학적 기반

협업 및 커뮤니케이션 역량

지원자의 자격 요건은 논문 작성이나 풍부한 연구 경험으로 뒷받침될 수 있습니다.

로보틱스 또는 자율주행 프로젝트 경험 • ROS, 시뮬레이션 툴(MuJoCo, Gazebo 등)을 활용한 실제 로봇/가상 환경에서의 모델 통합 경험

데이터 파이프라인 및 MLOps 경험 • 데이터 관리, 모델 서빙, CI/CD 등 머신러닝 라이프사이클 자동화 경험

논문 작성 및 Conference 발표 경험 • ICLR, ICML, NeurIPS, ACL (ACL, EMNLP, NAACL), ICRA, IROS, IROS, RSS, CoRL 등 Top-tier ML, 로보틱스 Conference/Journal에 1저자 논문 게재 및 발표 경험

• 자기계발비(학회, 세미나, 워크샵 등) 지원

Skills

PythonC++cplusplusMLMachine LearningCI/CDGitAIcpp

Want AI to find more roles like this?

Upload your CV once. Get matched to relevant assignments automatically.

Try personalized matching