CHI TIẾT CÔNG VIỆC
- Triển khai, cấu hình và vận hành hệ thống hạ tầng phục vụ các sản phẩm AI trên môi trường on-premise và cloud (AWS, GCP, OpenStack...).
- Thiết lập và tối ưu các thành phần cốt lõi như: Kubernetes (K8s), Rancher, Kong, MetalLB, HAProxy, đảm bảo khả năng mở rộng, hiệu năng và tính sẵn sàng cao.
- Thiết kế, triển khai và giám sát hệ thống quan sát toàn diện bằng các công cụ: Prometheus, OpenTelemetry, ELK Stack, phục vụ việc theo dõi hiệu suất và xử lý sự cố.
- Xây dựng quy trình CI/CD tích hợp các mô hình AI vào pipeline LLMOps, phục vụ cả quá trình huấn luyện, fine-tuning và inferencing.
- Hợp tác chặt chẽ với các nhóm kỹ thuật (AI/ML, Backend, Security) để đảm bảo hạ tầng đáp ứng tốt các yêu cầu chuyên biệt của hệ thống sử dụng mô hình ngôn ngữ lớn (LLM, RAG, multimodal...).
- Nghiên cứu, đánh giá và đề xuất các công nghệ hạ tầng mới phù hợp với định hướng kỹ thuật và tăng trưởng của doanh nghiệp.
YÊU CẦU CÔNG VIỆC
- Tốt nghiệp Đại học chính quy, chuyên ngành Công nghệ thông tin, Khoa học máy tính, Kỹ thuật máy tính, Hệ thống thông tin, hoặc các ngành kỹ thuật liên quan.
- Từ 2 năm kinh nghiệm ở vị trí DevOps Engineer hoặc System Engineer, ưu tiên ứng viên từng triển khai hạ tầng cho các sản phẩm AI/ML trong môi trường thực tế. (Middle) - cần phần mềm, ko cần nettwork hạ tầng.
- Hiểu biết sâu về hệ điều hành Linux, scripting (Bash), containerization (Docker), orchestration (Kubernetes), cùng các công cụ như Helm, ArgoCD, Terraform.
- Kinh nghiệm triển khai và vận hành hệ thống Kubernetes với Rancher, kết hợp các thành phần mạng như Kong, MetalLB, HAProxy, và hạ tầng private cloud như OpenStack.
- Thành thạo thiết lập và duy trì các hệ thống monitoring, logging và tracing sử dụng Prometheus, OpenTelemetry, ELK Stack.
- Nắm vững kiến thức về CI/CD pipelines, bảo mật hạ tầng, kiến trúc microservices và hệ thống phân tán.
- Ưu tiên ứng viên có kinh nghiệm với các nền tảng hỗ trợ vận hành mô hình AI như MLflow, vLLM, Ray, hoặc hệ thống LLMOps pipeline.
- Có khả năng sử dụng các công cụ AI để tăng hiệu quả vận hành và khắc phục sự cố, ví dụ: Copilot CLI, ChatGPT, K9s AI Assist, Prometheus AI Insight, Terraform AI Docs, hoặc các tool phân tích log tự động bằng AI.
- Tư duy hệ thống sắc bén, chủ động đề xuất giải pháp, có khả năng ra quyết định kỹ thuật độc lập và chịu trách nhiệm toàn diện cho chất lượng hệ thống.
- Tác phong chuyên nghiệp, tinh thần học hỏi cao, cầu tiến, kiên định với độ tin cậy và bảo mật trong từng chi tiết công việc.
QUYỀN LỢI
- Gói thu nhập hấp dẫn theo năng lực (Thưởng lương tháng 13, tiền du lịch nghỉ mát, tiền mừng tuổi...).
- Đầy đủ các chế độ theo luật lao động hiện hành.
- Chính sách phúc lợi theo quy định của Công ty đa dạng: Chăm sóc sức khỏe định kì hàng năm; Gói bảo hiểm sức khỏe chuyên biệt (FPT Care – Khám chữa bệnh miễn phí tại tất cả các bệnh viện); Các hoạt động tri ân, chăm lo đời sống tinh thần CBNV và Thân nhân...
- Môi trường làm việc thân thiện, cởi mở.
- Cơ sở vật chất và công cụ làm việc hiện đại, tiện nghi.
- Nhiều cơ hội phát triển và thăng tiến.
- Văn hóa Doanh nghiệp đặc sắc, sinh động bậc nhất với nhiều các hoạt động hấp dẫn: tân binh, 72 giờ trải nghiệm, teambuilding, thi trạng, hội làng, hội diễn Sao Chổi, sinh nhật FPT, ngày 08/03, ngày 11/11,...
- Hưởng các gói ưu đãi cước khi sử dụng dịch vụ của FPT Telecom.
- Hỗ trợ chi phí thi các chứng chỉ quốc tế.
- Hoạt động xếp hạng và quy hoạch Cán bộ công nghệ cấp Tập đoàn FPT.
- Tưởng thưởng cho 50 cá nhân xuất sắc nhất, tôn vinh và trao giải tại nước ngoài.
THÔNG TIN THAM KHẢO
NƠI LÀM VIỆC
- Tầng 19, FPT Tower, Số 10 Phạm Văn Bạch, Yên Hoà, Cầu Giấy, Hà Nội.