Head Of System Infrastructure

JOB DESCRIPTION

1. Storage: vận hành hệ thống high availability master-slave multipath redundant storage server với filesystem ZFS.
Đảm bảo thời gian gián đoạn dịch vụ ngoài mong muốn ở mức thấp nhất do cơ chế auto failover.
Định kì kiểm tra khả năng auto failover.
Định kì vá các lỗi phát sinh và cập nhật các cải tiến tốc độ.
Đảm bảo vận hành tốc độ và ổn định như giới hạn phần cứng (băng thông 1.5-2 GByte/s và >200.000 IOPS) 
Tư vấn khi cần mở rộng hoặc thay thế thiết bị
Giải quyết các sự cố storage server: hardware failure (L1), system crash (L1), performance (L2)
Chạy incremental instant backup và full backup định kỳ tuỳ mức độ quan trọng của các volume dữ liệu.
 
2. Server và docker swarm: đa phần các app của fahasa chạy trên môi trường docker swarm.
Quản lý lượng tải vả tài nguyên server
Hỗ trợ cài đặt khi có phát sinh thay thế, thêm mới server mới.
Tư vấn cấu hình, phối hợp nhà cung cấp
Giải quyết các sự cố server và docker
Tư vấn lộ trình nâng cấp OS khi hết vòng đời OS.
 
3. Xây Dựng và Bảo trì hệ thống: Linux OS và các phần mềm quan trọng sau: nginx (web server), php, mariadb, magento và salt. 
Cần có kiến thức chuyên sau về việc setup các hệ thống có chịu tải lớn sử dụng: Nginx, Redis và Docker Swarm, Mariadb, Php và phpfpm …
Có kiến thức về xây dựng hệ thống sử dụng Kubernetes.
Một số phần mềm fahasa sử dụng đã hết được hỗ trợ chính thức từ nhà phát triển phần mềm. Các lỗi security cần được tự sửa hoặc lấy từ các bản vá lỗi ở các phiên bản mới hơn. Đây là những phần mềm trọng yếu, lỗi security sẽ gây ra tổn thất rất lớn. (L2)
Đảm bảo tương thích giữa hệ thống phần mềm hiện tại với các phần cứng POS server mới.
 
4. Troubleshoot các vấn đề gây gián đoạn dịch vụ hệ thống: hệ thống hoặc lỗi performance và security của web, idempiere và POS server
Nền tảng TMĐT chịu 1 lượng traffic rất lớn tại các kỳ Flashsale, cần các kiến thức chuyên sâu về performance, load balancing và scalability để hỗ trợ, troubleshoot và đưa ra hướng giải quyết cho vấn đề.
Phản ứng nhanh, xử lý các lỗi xảy ra bất ngờ này. Hỗ trợ xác định nguyên nhân và tư vấn giải pháp. L1 cho web và idempiere. L2 cho POS server nhà sách. Riêng pos server nhà sách chỉ xử lý các vấn đề mà phòng IT chưa được hướng dẫn xử lý.
Cung cấp giải pháp load balancing và chống DOS

JOB REQUIREMENT

Tốt nghiệp Đại học hoặc sau Đại học chuyên ngành Công nghệ thông tin
Có kỹ năng quản lý đội nhóm, phản ứng nhanh với sự cố của hệ thống
Tư duy tốt trong làm việc độc lập lẫn làm việc nhóm
Có kinh nghiệm trong lĩnh vực Thương Mại Điện Tử
Kinh nghiệm làm việc ở vị trí tương tự: 3 – 7 năm
Ngoại ngữ: tiếng Anh
Năng động, nhạy bén, có tinh thần trách nhiệm cao

WHAT'S ON OFFER

Chế độ bảo hiểm y tế, bảo hiểm xã hội
Lương thưởng theo quy định nhà nước
Chăm sóc sức khỏe hàng năm
Du lịch mỗi năm 1 lần
Môi trường làm việc trẻ trung, thân thiện

CONTACT

PEGASI – IT Recruitment Consultancy | Email: recruit@pegasi.com.vn | Tel: +84 28 3622 8666
We are PEGASI – IT Recruitment Consultancy in Vietnam. If you are looking for new opportunity for your career path, kindly visit our website www.pegasi.com.vn for your reference. Thank you!

Job Summary

Company Type:

Product, Book

Technical Skills:

Devops, System

Location:

Ho Chi Minh - Viet Nam

Working Policy:

Salary:

$ 3,000 - $ 5,000

Job ID:

J00820

Status:

Close

Related Job:

Platform Reliability Engineer

Ho Chi Minh - Viet Nam


Outsource

  • Devops

Maintain production reliability of the Linux-based research and trading platform within a globally distributed engineering team. Respond quickly to production infrastructure issues. Comprehend internal client needs and effectively communicate them to regional and global leadership. Identify risks, develop contingency plans, and implement solutions to mitigate them. Enhance the observability platform to monitor the performance and health of critical computing environments. Take part in occasional on-call rotations and support on-call staff during their shifts. Contribute to organizational knowledge through documentation, education, and writing maintainable code.

Negotiation

View details

Storage System Engineer (Linux)

Ho Chi Minh - Viet Nam


Outsource

Monitoring storage performance, capacity, and availability for optimal performance and reliability. Troubleshooting storage-related issues and providing timely resolutions to users. Developing and maintaining scripts and automation tools for storage administration tasks. Performing regular data backup and recovery procedures to ensure data availability.

Negotiation

View details

Director Engineering – Software Engineering and AI Inferencing Platforms

Ho Chi Minh, Ha Noi - Viet Nam


Product

  • Management
  • Backend
  • Devops
  • Data Engineering
  • Cloud
  • AI

Lead and expand engineering teams in Vietnam across system software, data science, and AI platforms. Drive the creation, structure, and delivery of high-performance system software platforms that support AI products and services. Collaborate with global teams across Machine Learning, Inference Services, and Hardware/Software integration to guarantee performance, reliability, and scalability. Oversee the development and optimization of AI delivery platforms in Vietnam, including NIMs, Blueprints, and other flagship services. Collaborate with open-source and enterprise data and workflow ecosystems to advance accelerated AI factory, data science, and data engineering workloads. Promote continuous integration, continuous delivery, and engineering best practices across multi-site R&D Centers. Work with product management and other stakeholders to ensure enterprise readiness and customer impact. Establish and implement standard processes for large-scale, distributed system testing including stress, scale, failover, and resiliency testing. Ensure security and compliance testing aligns with industry standards for cloud and data center products. Mentor and develop talent within the organization, fostering a culture of quality and continuous improvement.

Negotiation

View details