Head Of System Infrastructure

JOB DESCRIPTION

1. Storage: vận hành hệ thống high availability master-slave multipath redundant storage server với filesystem ZFS.
Đảm bảo thời gian gián đoạn dịch vụ ngoài mong muốn ở mức thấp nhất do cơ chế auto failover.
Định kì kiểm tra khả năng auto failover.
Định kì vá các lỗi phát sinh và cập nhật các cải tiến tốc độ.
Đảm bảo vận hành tốc độ và ổn định như giới hạn phần cứng (băng thông 1.5-2 GByte/s và >200.000 IOPS) 
Tư vấn khi cần mở rộng hoặc thay thế thiết bị
Giải quyết các sự cố storage server: hardware failure (L1), system crash (L1), performance (L2)
Chạy incremental instant backup và full backup định kỳ tuỳ mức độ quan trọng của các volume dữ liệu.
 
2. Server và docker swarm: đa phần các app của fahasa chạy trên môi trường docker swarm.
Quản lý lượng tải vả tài nguyên server
Hỗ trợ cài đặt khi có phát sinh thay thế, thêm mới server mới.
Tư vấn cấu hình, phối hợp nhà cung cấp
Giải quyết các sự cố server và docker
Tư vấn lộ trình nâng cấp OS khi hết vòng đời OS.
 
3. Xây Dựng và Bảo trì hệ thống: Linux OS và các phần mềm quan trọng sau: nginx (web server), php, mariadb, magento và salt. 
Cần có kiến thức chuyên sau về việc setup các hệ thống có chịu tải lớn sử dụng: Nginx, Redis và Docker Swarm, Mariadb, Php và phpfpm …
Có kiến thức về xây dựng hệ thống sử dụng Kubernetes.
Một số phần mềm fahasa sử dụng đã hết được hỗ trợ chính thức từ nhà phát triển phần mềm. Các lỗi security cần được tự sửa hoặc lấy từ các bản vá lỗi ở các phiên bản mới hơn. Đây là những phần mềm trọng yếu, lỗi security sẽ gây ra tổn thất rất lớn. (L2)
Đảm bảo tương thích giữa hệ thống phần mềm hiện tại với các phần cứng POS server mới.
 
4. Troubleshoot các vấn đề gây gián đoạn dịch vụ hệ thống: hệ thống hoặc lỗi performance và security của web, idempiere và POS server
Nền tảng TMĐT chịu 1 lượng traffic rất lớn tại các kỳ Flashsale, cần các kiến thức chuyên sâu về performance, load balancing và scalability để hỗ trợ, troubleshoot và đưa ra hướng giải quyết cho vấn đề.
Phản ứng nhanh, xử lý các lỗi xảy ra bất ngờ này. Hỗ trợ xác định nguyên nhân và tư vấn giải pháp. L1 cho web và idempiere. L2 cho POS server nhà sách. Riêng pos server nhà sách chỉ xử lý các vấn đề mà phòng IT chưa được hướng dẫn xử lý.
Cung cấp giải pháp load balancing và chống DOS

JOB REQUIREMENT

Tốt nghiệp Đại học hoặc sau Đại học chuyên ngành Công nghệ thông tin
Có kỹ năng quản lý đội nhóm, phản ứng nhanh với sự cố của hệ thống
Tư duy tốt trong làm việc độc lập lẫn làm việc nhóm
Có kinh nghiệm trong lĩnh vực Thương Mại Điện Tử
Kinh nghiệm làm việc ở vị trí tương tự: 3 – 7 năm
Ngoại ngữ: tiếng Anh
Năng động, nhạy bén, có tinh thần trách nhiệm cao

WHAT'S ON OFFER

Chế độ bảo hiểm y tế, bảo hiểm xã hội
Lương thưởng theo quy định nhà nước
Chăm sóc sức khỏe hàng năm
Du lịch mỗi năm 1 lần
Môi trường làm việc trẻ trung, thân thiện

CONTACT

PEGASI – IT Recruitment Consultancy | Email: recruit@pegasi.com.vn | Tel: +84 28 3622 8666
We are PEGASI – IT Recruitment Consultancy in Vietnam. If you are looking for new opportunity for your career path, kindly visit our website www.pegasi.com.vn for your reference. Thank you!

Job Summary

Company Type:

Product, Book

Technical Skills:

Devops, System

Location:

Ho Chi Minh - Viet Nam

Working Policy:

Salary:

$ 3,000 - $ 5,000

Job ID:

J00820

Status:

Close

Related Job:

Head of Human Resources

Ho Chi Minh - Viet Nam


Product

  • HR
  • Management

Workforce Strategy: Design and implement workforce strategies aligned with the product roadmap and business P&L priorities. Organizational Design: Lead initiatives to support scaling, restructuring, and portfolio expansion. Talent Planning: Drive long-term talent density and succession planning for critical roles. Capability Frameworks: Build capability models directly linked to business outcomes. Executive Partnership: Act as a strategic advisor to senior leadership on people-related decisions. Business Translation: Translate business strategy into talent and capability requirements. Data Insights: Provide workforce analytics to guide growth and investment decisions. Leadership Development: Strengthen leadership pipelines and organizational resilience. Hiring Standards: Elevate recruitment standards and evaluation logic to ensure long-term talent quality. High-Performance Culture: Establish a culture anchored in accountability and clarity. Leadership Programs: Build leadership development initiatives tied to strategic priorities. Performance Management: Align performance systems with measurable business impact. AI Integration: Embed AI-driven tools into recruitment, workforce planning, and performance management. Predictive Analytics: Develop predictive talent models to anticipate capability gaps. Automation: Leverage automation to improve efficiency and decision quality. AI Governance: Promote responsible AI practices in people-related processes. HR Dashboards: Build dashboards connecting people metrics to business KPIs, operationalizing AI at scale. Cultural Alignment: Strengthen organizational culture focused on innovation, speed, and ownership. Behavioral Reinforcement: Ensure hiring and leadership behaviors reflect cultural direction. Agility & Governance: Balance agility with governance in a dynamic digital environment.

Negotiation

View details

Platform Lead

Others - Singapore


Product

  • Backend
  • Devops
  • Data Engineering

Develop and expand distributed systems to handle large volumes of sensory, telemetry, and control data across cloud and edge environments, facilitating real-time connections for fleets of robots. Create the API Platform with a focus on high reliability, exceptional developer experience, and robust multimodal AI capabilities accessible through user-friendly APIs and SDKs. Establish extensive training and inference platforms for foundation models used in robot autonomy, teleoperation, and developer integrations. Devise data ingestion and streaming pipelines for real-time connectivity of robot fleets to the cloud, covering various data inputs such as video, LiDAR, joint states, and audio. Oversee and advance a modern cloud native infrastructure stack employing Kubernetes, Docker, and infrastructure as code tools. Ensure platform reliability through telemetry, monitoring, alerting, autoscaling, failover, and disaster recovery measures. Make infrastructure decisions pertaining to distributed storage, consensus protocols, GPU orchestration, network reliability, and API security. Foster collaboration across ML, robotics, and product teams to facilitate hardware in the loop simulation, policy rollout, continuous learning, and CI/CD workflows. Implement secure APIs featuring fine-grained access control, usage metering, rate limiting, and billing integration to accommodate a growing user base.

Negotiation

View details

Senior System Software Engineer - AI Data Platform - Inference Factory

Ho Chi Minh - Viet Nam


Product

  • Devops
  • C/C++
  • Python
  • Golang

Create infrastructure and tools to automate complex software processes effectively. Improve performance: Deploy advanced test harnesses, benchmarking frameworks, and analytical tools to thoroughly evaluate and enhance the performance and efficiency of software and hardware platforms. Utilize expertise in operating systems, kernel internals, device drivers, memory management, storage, networking, and high-speed interconnects to construct and troubleshoot high-performance systems. Collaborate with engineering teams to comprehend requirements and deliver efficient solutions. Establish performance objectives, assess feedback, analyze data, and continually enhance system reliability. Shape technical strategies: Contribute to developing technical strategies and roadmaps for platform automation initiatives to ensure they are in line with company goals and industry best practices.

Negotiation

View details