AI Research Engineer

ABOUT CLIENT

Our client is a leading research company specializing in technology innovation

JOB DESCRIPTION

Focus on improving model usability for users
Conduct training runs and AI experiments
Analyze results and make necessary changes
Collaborate with the product engineering team to implement improvements
Implement and improve upon recent RL techniques like GRPO, DPO, RePO, etc.
Create and manage adaptable, expandable training codebases
Establish and maintain efficient data pipelines, including both synthetic and real data
Ensure training jobs are capable of scaling across multiple GPUs and nodes, such as FSDP, DDP, NCCL
Maintain code health over the long term by writing clean, testable, and reproducible code
Contribute to the enhancement of open source dependencies
(Optional) Publish papers and present research findings

JOB REQUIREMENT

Comprehensive skills in Python and coding using frameworks like PyTorch, or similar
Demonstrated proficiency in training deep learning and reinforcement learning models in practical scenarios
Experience in handling and analyzing large datasets and intricate workflows
Adept understanding of training dynamics, identifying issues and troubleshooting them
Proficiency in job launchers, logging tools (such as Weights & Biases, TensorBoard), and checkpointing systems
An approach of applying engineering precision to research through writing clear code, meticulous design, and reproducible results
Knowledge of TorchScript, ONNX, or custom inference runtimes
Contribution to open-source projects related to PyTorch or machine learning tools
Background in working with transformer models, diffusion models, VLMs, or extensive vision/NLP tasks
Familiarity with batch schedulers (SLURM), cluster environments, and GPU resource management
Ability to collaborate closely with systems engineers or MLOps teams for seamless integration

WHAT'S ON OFFER

Join an exceptional research team to work on significant and impactful projects
Take charge of and influence the primary training code infrastructure utilized by the team
Engage with actual models, real data, and substantial scale challenges, not small-scale problems
Contribute to bridging the gap between research speed and engineering excellence
Enjoy a flexible work setting with a culture that treasures depth, transparency, and inquisitiveness

CONTACT

PEGASI – IT Recruitment Consultancy | Email: recruit@pegasi.com.vn | Tel: +84 28 3622 8666
We are PEGASI – IT Recruitment Consultancy in Vietnam. If you are looking for new opportunity for your career path, kindly visit our website www.pegasi.com.vn for your reference. Thank you!

Job Summary

Company Type:

Product

Technical Skills:

Machine Learning, Python, AI

Location:

Ho Chi Minh - Viet Nam

Working Policy:

Onsite

Salary:

Negotiation

Job ID:

J01951

Status:

Close

Related Job:

Chief Technology Officer

Ha Noi - Viet Nam


Product

  • Cloud
  • Backend

Định hướng & Thiết kế hệ thống kiến trúc tổng thể: Xây dựng bản đồ công nghệ (Technology Roadmap) cho hệ thống Game Server có khả năng chịu tải cực lớn (High Concurrency), đảm bảo độ trễ thấp (Low Latency) cho người chơi toàn cầu; Tối ưu hóa chi phí: Quyết định chiến lược sử dụng hạ tầng Cloud (AWS, GCP, Azure) hoặc Hybrid Cloud để cân bằng giữa hiệu suất và OpEx (chi phí vận hành); Tư vấn cấp cao: Tham gia cùng Ban điều hành để giải quyết mối quan hệ giữa tốc độ ra mắt tính năng (Time-to-market) và sự ổn định của hệ thống lõi; Lựa chọn Tech-stack: Đánh giá và chốt các ngôn ngữ lập trình (Go, C++, Java, Node.js...) và các mô hình xử lý (Microservices vs Monolith) phù hợp với logic phức tạp của Game; Giải pháp Scalability: Trực tiếp chỉ đạo xây dựng các cơ chế Auto-scaling, Load Balancing và quản lý State của người chơi trên các Cluster lớn; Quản lý dữ liệu: Thiết kế cấu trúc Database (SQL/NoSQL) và hệ thống Cache (Redis, Memcached) để xử lý hàng tỷ truy vấn mỗi ngày mà không gây nghẽn; Đảm bảo Uptime: Xây dựng hệ thống giám sát (Monitoring) và cảnh báo (Alerting) theo thời gian thực để duy trì chỉ số 99.99% Availability; An ninh mạng: Triển khai các giải pháp chống tấn công DDoS, gian lận trong game (Anti-cheat) và bảo mật dữ liệu người dùng toàn diện; Hạ tầng & CI/CD: Chuẩn hóa quy trình triển khai tự động nhằm đảm bảo việc cập nhật game (Hotfix/Update) không gây gián đoạn cho người chơi; Triển khai chiến lược & Tối ưu hóa: Xây dựng phương án tối ưu hóa chi phí Cloud Services (AWS/GCP/Azure). Đánh giá việc sử dụng Spot Instances, Reserved Instances hoặc giải pháp Private Cloud để tiết kiệm ngân sách vận hành. Đồng thời thiết lập hệ thống giám sát (Monitoring) và ứng phó sự cố (Incident Response) 24/7.

Negotiation

View details

Partner Implementation Engineer (Security & Digital Trust)

Ha Noi - Viet Nam


Outsource

Đóng vai trò là người thực hiện triển khai chủ chốt, chịu trách nhiệm triển khai, cấu hình và tích hợp các giải pháp Security & Digital Trust (PKI, Chữ ký số, Mã hóa, MFA) vào hệ thống thực tế của khách hàng, đảm bảo hệ thống vận hành ổn định, bảo mật và đúng thiết kế. Triển khai hệ thống (Implementation) Chuẩn bị môi trường: kiểm tra hạ tầng (Server, Hệ điều hành, Cơ sở dữ liệu, Mạng) Cài đặt & cấu hình giải pháp: PKI / CA / Chữ ký số / MFA / Mã hóa Thiết lập chính sách bảo mật, quy trình nghiệp vụ Kết nối với thiết bị bảo mật (HSM, Quản lý Khóa) Triển khai trên nền tảng Cloud / Container (nếu có) Triển khai hệ thống trên Kubernetes / OpenShift Cấu hình tài nguyên (YAML: Pod, Dịch vụ, Ingress, Bản đồ Cấu hình, Bí mật) Thiết lập lưu trữ (Khối Lưu trữ Không gian); mạng nội bộ Áp dụng các chính sách bảo mật cho container Tích hợp hệ thống (Integration) Hỗ trợ tích hợp với: Trang web/ Ứng dụng/ Giao diện lập trình ứng dụng và IAM / SSO / AD / LDAP Hướng dẫn sử dụng API/SDK Kiểm tra luồng dữ liệu & bảo mật giao tiếp Phối hợp với nhóm khách hàng (Phát triển / Cơ sở hạ tầng / Bảo mật) Kiểm thử & nghiệm thu (QA/UAT) Thực hiện kiểm thử kỹ thuật & kịch bản vận hành Hỗ trợ UAT với khách hàng Kiểm tra tính đúng đắn của: Chữ ký số; Chứng thư và Luồng xác thực Vận hành & hỗ trợ Giám sát hệ thống, phân tích log, xử lý sự cố Hỗ trợ sau triển khai (L2/L3) Đảm bảo hệ thống hoạt động ổn định & HA Tài liệu & chuyển giao Xây dựng tài liệu triển khai (cấu trúc, cấu hình) Hướng dẫn vận hành cho khách hàng Đào tạo kỹ thuật cơ bản

Negotiation

View details

AI Product Builder

Ha Noi - Viet Nam


Product

  • AI
  • Backend
  • Frontend
  • Devops
  • Java
  • Golang
  • Product Management

Collaborate with domain experts to develop business requirements and constraints for designing prompt AI-assisted workflows and system specifications. Utilize AI tools, no-code/low-code, and coding to rapidly prototype UI/UX mockups and foundational implementations. Test prototypes through hypothesis validation cycles and provide detailed handovers to engineering teams. Decode legacy specifications and enhance existing products with AI-assisted analysis and implementation. Constantly enhance the product team's building-tooling, templates, and practices to adapt to changes in models and platforms.

Negotiation

View details