Một ví dụ thực tế
- Hệ thống nhận file CSV import danh sách đơn hàng
- Logic xử lý ổn, UI đẹp, message đầy đủ
- Nhưng khi chạy thử file thật → lỗi hàng loạt:
- Dữ liệu thiếu cột
- Có ký tự đặc biệt
- Format ngày không đồng nhất
👉 Tất cả do… BrSE không confirm rõ cấu trúc & đặc điểm dữ liệu đầu vào
Dữ liệu đầu vào quan trọng thế nào?
- Nó quyết định logic xử lý có áp dụng được không
- Nó ảnh hưởng đến test case, error handling, import/export, mapping
- Dữ liệu thực tế luôn bẩn hơn tưởng tượng – nếu không kiểm tra trước, hệ thống dễ hỏng khi live
Cần làm gì khi phân tích dữ liệu đầu vào?
1. Xác nhận nguồn dữ liệu
“File này do ai tạo?” – “Có quy chuẩn không?” – “Có thay đổi theo thời gian không?”
2. Yêu cầu file mẫu thật sự (nếu có)
Không dùng file giả định → lấy luôn 1-2 file thật để test format, encoding, ký tự đặc biệt
3. Phân tích định dạng, độ dài, kiểu dữ liệu từng trường
Dùng bảng mô tả input như:
Field Kiểu Bắt buộc Ghi chú order_date yyyy/mm/dd Có Có thể null nếu chưa xác nhận
BrSE cần làm rõ điều gì trước khi xử lý?
- Dữ liệu có thể bị thiếu không?
- Có giá trị nào cần chuẩn hóa không? (ví dụ: YES/NO, 1/0, TRUE/FALSE…)
- Có giá trị nào cần validate chéo với DB không?
Kết luận
BrSE không cần xử lý dữ liệu – nhưng phải hiểu và mô tả đúng dữ liệu đầu vào.
Bỏ qua phần này là gốc rễ của nhiều bug khó chịu và lỗi khó debug sau này.
📌 Hãy luôn nhớ: Logic tốt không cứu được dữ liệu xấu.
🎯 Đây là bài cuối cùng trong series Kỹ năng phân tích dành cho BrSE.
Cảm ơn bạn đã đọc – và hy vọng bạn sẽ áp dụng những điều này vào công việc thật sự của mình.