Machine Learning Engineer
JOB DESCRIPTION
JOB REQUIREMENT
WHAT'S ON OFFER
CONTACT
Job Summary
Company Type:
Product, AI Application Platform
Technical Skills:
Machine Learning, Python
Location:
Ho Chi Minh - Viet Nam
Working Policy:
Salary:
Negotiation
Job ID:
J01397
Status:
Close
Related Job:
Chief Technology Officer
Ha Noi - Viet Nam
Product
- Cloud
- Backend
Planning & designing overall system architecture: Creating a Technology Roadmap for a Game Server system with high concurrency and low latency for global players. Cost optimization: Deciding on the strategy for using Cloud infrastructure (AWS, GCP, Azure) or Hybrid Cloud to balance performance and operational expenses. High-level consultation: Participating in the Executive Board to address the relationship between speed-to-market of features and system stability. Tech-stack selection: Evaluating and finalizing programming languages (Go, C++, Java, Node.js) and processing models (Microservices vs Monolith) suitable for the complex logic of the game. Scalability solution: Directing the development of Auto-scaling, Load Balancing mechanisms, and managing Player State on large clusters. Data management: Designing Database structure (SQL/NoSQL) and Cache system (Redis, Memcached) to handle billions of queries daily without congestion. Ensuring Uptime: Building real-time monitoring and alerting systems to maintain 99.99% Availability. Network security: Implementing solutions to combat DDoS attacks, game fraud (Anti-cheat), and comprehensive user data security. Infrastructure & CI/CD: Standardizing automatic deployment processes to ensure game updates (Hotfix/Update) do not disrupt players. Deployment strategy & Optimization: Developing plans to optimize Cloud Services costs (AWS/GCP/Azure), evaluating the use of Spot Instances, Reserved Instances, or Private Cloud solutions to save operational budget. Meanwhile, establishing 24/7 monitoring and incident response systems.
Negotiation
View detailsPartner Implementation Engineer (Security & Digital Trust)
Ha Noi - Viet Nam
Outsource
- System
Đóng vai trò là người thực hiện triển khai chủ chốt, chịu trách nhiệm triển khai, cấu hình và tích hợp các giải pháp Security & Digital Trust (PKI, Chữ ký số, Mã hóa, MFA) vào hệ thống thực tế của khách hàng, đảm bảo hệ thống vận hành ổn định, bảo mật và đúng thiết kế. Triển khai hệ thống (Implementation) Chuẩn bị môi trường: kiểm tra hạ tầng (Server, Hệ điều hành, Cơ sở dữ liệu, Mạng) Cài đặt & cấu hình giải pháp: PKI / CA / Chữ ký số / MFA / Mã hóa Thiết lập chính sách bảo mật, quy trình nghiệp vụ Kết nối với thiết bị bảo mật (HSM, Quản lý Khóa) Triển khai trên nền tảng Cloud / Container (nếu có) Triển khai hệ thống trên Kubernetes / OpenShift Cấu hình tài nguyên (YAML: Pod, Dịch vụ, Ingress, Bản đồ Cấu hình, Bí mật) Thiết lập lưu trữ (Khối Lưu trữ Không gian); mạng nội bộ Áp dụng các chính sách bảo mật cho container Tích hợp hệ thống (Integration) Hỗ trợ tích hợp với: Trang web/ Ứng dụng/ Giao diện lập trình ứng dụng và IAM / SSO / AD / LDAP Hướng dẫn sử dụng API/SDK Kiểm tra luồng dữ liệu & bảo mật giao tiếp Phối hợp với nhóm khách hàng (Phát triển / Cơ sở hạ tầng / Bảo mật) Kiểm thử & nghiệm thu (QA/UAT) Thực hiện kiểm thử kỹ thuật & kịch bản vận hành Hỗ trợ UAT với khách hàng Kiểm tra tính đúng đắn của: Chữ ký số; Chứng thư và Luồng xác thực Vận hành & hỗ trợ Giám sát hệ thống, phân tích log, xử lý sự cố Hỗ trợ sau triển khai (L2/L3) Đảm bảo hệ thống hoạt động ổn định & HA Tài liệu & chuyển giao Xây dựng tài liệu triển khai (cấu trúc, cấu hình) Hướng dẫn vận hành cho khách hàng Đào tạo kỹ thuật cơ bản
Negotiation
View detailsDevOps Engineer
Others - Viet Nam
Product
- Devops
- Kubernetes
- Network
Managing and developing our Kubernetes platform across multiple clusters and environments including production, development, on-premises and public cloud. Designing and overseeing hybrid cloud infrastructure across on-premises and public clouds (such as GCP, AWS), including workload placement, cross-cloud networking, and unified resource management. Taking responsibility for the end-to-end CI/CD and GitOps process, including container build pipelines, image optimization, and progressive delivery using tools like ArgoCD/FluxCD. Taking charge of the observability stack to provide a comprehensive view across all clusters using tools like Grafana, Mimir, Tempo, Loki, Pyroscope, OnCall, Prometheus, and supporting agent-assisted SRE workflows. Managing and enhancing our inference platform, including vLLM serving and AIBrix for multi-model orchestration and autoscaling with a fleet of NVIDIA GPUs. Operating platform services such as Kafka, Redis, PostgreSQL, OpenSearch. Managing identity and access management with Keycloak integrated with Google Workspace, strengthening SSO, RBAC, and secrets management across the platform. Strengthening network security across private load balancers, firewalls, and VPC segmentation and designing and maintaining hub-and-spoke/multi-AZ topologies. Supporting training infrastructure with self-service VM provisioning, RunPod burst capacity, and Weights and Biases integration. Driving infrastructure reliability, cost efficiency, and capacity planning as the platform scales.