NHIỆM VỤ CHÍNH
Dẫn dắt chiến lược
& lộ trình Data Engineering
- Xây dựng và dẫn dắt lộ trình phát triển Data Engineering, chuyển hóa
mục tiêu kinh doanh thành kế hoạch kỹ thuật, các sáng kiến ưu tiên và kết
quả có thể đo lường (OKRs/KPIs).
- Đóng vai trò đầu mối kỹ thuật chính trong các quyết định kiến trúc
dữ liệu quan trọng, đảm bảo tính nhất quán với chiến lược dữ liệu tổng
thể.
- Chủ động nhận diện và quản lý rủi ro kỹ thuật, đảm bảo tiến độ, chất
lượng và tính bền vững của nền tảng dữ liệu trong dài hạn.
Kiến trúc &
nền tảng dữ liệu
- Dẫn dắt thiết kế và triển khai kiến trúc Data Lakehouse trên
Azure, bao gồm lựa chọn và tối ưu các công nghệ:
- Azure Data Lake Storage Gen2
- Delta Lake
- Azure Synapse Analytics / Azure Databricks
- Thiết kế kiến trúc dữ liệu có khả năng mở rộng cao, tối ưu cho cả
batch processing và streaming.
- Tiên phong triển khai các chiến lược tối ưu lưu trữ và truy vấn dữ
liệu lớn, cân bằng hiệu năng, khả năng mở rộng và chi phí vận hành.
Phát triển &
vận hành pipeline dữ liệu
- Thiết kế, phát triển và tối ưu các pipeline ETL/ELT hiệu năng cao từ
nhiều nguồn dữ liệu: on-premises, cloud, streaming, API, file system.
- Đảm bảo pipeline có khả năng chịu lỗi, tự phục hồi, giám sát tốt và
đáp ứng yêu cầu SLA trong môi trường production.
- Xây dựng pipeline realtime/near-realtime phục vụ trực tiếp cho các
hệ thống AI/ML và phân tích nâng cao.
Tích hợp &
phối hợp liên nhóm
- Đóng vai trò cầu nối kỹ thuật giữa Data Engineering với các nhóm
AI/ML, BI, DevOps và Product.
- Hỗ trợ tích hợp dữ liệu vào:
- Mô hình Machine Learning trong môi trường production
- Hệ thống BI, dashboard và phân tích dự báo
- Các ứng dụng dữ liệu phức tạp
- Phối hợp với đội hạ tầng và an ninh để thiết kế và vận hành hệ thống
dữ liệu an toàn, tuân thủ các tiêu chuẩn bảo mật và quy định nội bộ.
Quản trị dữ liệu
& tiêu chuẩn kỹ thuật
- Thiết lập và thực thi các chuẩn mực về quản trị dữ liệu, bao gồm:
- Data Quality Framework
- Metadata Management tập trung
- Data Lineage và Data Observability tự động
- Đảm bảo tuân thủ best practices về thiết kế dữ liệu, coding
standards và documentation.
Dẫn dắt đội ngũ
& chia sẻ tri thức
- Huấn luyện, mentoring và phát triển năng lực kỹ thuật cho các Data
Engineer.
- Thực hiện review code, review thiết kế kiến trúc và tài liệu kỹ
thuật.
- Xây dựng hệ thống tài liệu kỹ thuật chất lượng cao, phục vụ chia sẻ
tri thức và vận hành hiệu quả giữa các đội.
YÊU CẦU CÔNG VIỆC
- Tốt nghiệp Đại học hoặc Thạc sĩ các chuyên ngành: Công nghệ Thông
tin, Khoa học Dữ liệu, Hệ thống Thông tin hoặc tương đương.
- Tối thiểu 8+ năm kinh nghiệm trong lĩnh vực Data Engineering,
trong đó có 2–3 năm ở vai trò Technical Lead/Team Lead.
- Có kinh nghiệm thiết kế và triển khai các giải pháp dữ liệu end-to-end
ở quy mô lớn, môi trường production.
- Kinh nghiệm chuyên sâu và thực tế trong triển khai, vận hành hạ tầng
dữ liệu trên Azure Cloud, bao gồm:
- Azure Data Lake Storage Gen2
- Azure Synapse Analytics, Azure Data Factory, Azure
Databricks
- Hệ thống streaming: Azure Event Hub, Azure Stream
Analytics hoặc Apache Kafka
- Thành thạo SQL và ít nhất một ngôn ngữ lập trình như Python
hoặc PySpark.
- Hiểu biết vững chắc về các nguyên lý tính toán phân tán và xử
lý dữ liệu lớn.
- Kinh nghiệm sâu trong thiết kế mô hình dữ liệu nâng cao (Star
Schema, Snowflake Schema), làm chủ kiến trúc Lakehouse và best
practices của Delta Lake.
- Bắt buộc có kinh nghiệm vận hành hệ thống dữ liệu production quy mô
lớn, pipeline realtime ổn định và tích hợp trực tiếp với tầng AI/ML.
- Tinh thần làm chủ công việc cao, tư duy hệ thống, tiếp cận vấn đề có
cấu trúc.
- Kỹ năng giao tiếp và phối hợp liên phòng ban xuất sắc với các nhóm
AI, DevOps, Product và các bên liên quan kỹ thuật.
- Tư duy phân tích và giải quyết vấn đề mạnh; tự tin ra quyết định
trong bối cảnh phức tạp và nhiều yếu tố chưa rõ ràng.
- Growth mindset, tinh thần học hỏi liên tục, linh hoạt và sẵn sàng
thử nghiệm công nghệ mới.
CHẾ ĐỘ VÀ PHÚC LỢI