tailieunhanh - Giáo Trình Phân Tích Và Thiết Kế Hệ Thống phần 4

Phân tích dữ liệu là để : Thanh lọc các dữ liệu đồng nghĩa và nhiều nghĩa từ danh sách dữ liệu “thô” thu nhập qua các buổi phỏng vấn Xây dựng từ điển dữ liệu (Data Dictionary) là tập hợp từ vựng chính xác mà mọi người tham gia dự án đều đồng ý. | tích dữ liệu Phân tích dữ liệu là để Thanh lọc các dữ liệu đồng nghĩa và nhiều nghĩa từ danh sách dữ liệu thô thu nhập qua các buổi phỏng vấn Xây dựng từ điển dữ liệu Data Dictionary là tập hợp từ vựng chính xác mà mọi người tham gia dự án đều đồng ý. Các bước phân tích dữ liệu được cho ở . niệm về dữ liệu sơ cấp Một dữ liệu được xem là sơ cấp khi toàn bộ các ký tự tạo nên dữ liệu luôn luôn được sử dụng một cách có hệ thống. Xét 2 ví dụ sau Ví dụ Giả sử dữ liệu mã sản phẩm có tên MãHàng có giá trị H025 có mặt trong cơ sở dữ liệu là do hai dữ liệu ghép lại chữ H có ý nghĩa rằng sản phẩm thuộc về một loại đặc biệt nào đó và 025 là số của sản phẩm. Như vậy Loại sản phẩm có giá trị thay đổi là một chữ cái từ A đến Z. Số của sản phẩm có giá trị thay đổi từ 0 đến 999. Nếu như khái niệm về loại sản phẩm không có mặt trong ứng dụng đang xét ta có thể xem rằng MãHàng là sơ cấp. Dữ liệu thô ỵTừ điển dữ liệu Ị Các công thức tính toán Hình Phân tích dữ liệu Ví dụ Dữ liệu địa chỉ khách hàng ĐịaChỉKH được xem là dữ liệu sơ cấp nếu được dùng làm địa chỉ thư tín công văn. 50 Trái lại nếu cần lập danh sách khách hàng của một thành phố hoặc của một tỉnh thì bản thân ĐịaChỉKH là dữ liệu hỗn hợp và phải được phân chia thành các dữ liệu sơ cấp. Ta có thể phân chia như sau SốNhàKH Số nhà của khách hàng. Ví dụ 17. PhốKH Tên phố hoặc tên đường hẻm. khách hàng lưu trú. Ví dụ Lê Duẩn. MãBĐ Mã bưu điện của khách hàng Việt nam chưa có . TPKH Tên thành phố nơi khách hàng lưu trú. Ví dụ Đà Nằng. QuốcGia Tên nước nếu có . Ví dụ Việt nam. Ta thấy rằng mà bưu điện MãBĐ nếu có là dữ liệu hỗn hợp do mã tỉnh và mã huyện ghép lại. . Thanh lọc dữ liệu Khi xây dựng một từ điển dữ liệu cần phải phân tích dữ liệu thành các dữ liệu sơ cấp theo quan hệ dữ liệu - tên gọi dữ liệu. Sự không phù hợp của dữ liệu thể hiện ở hai dạng cần xử lý các dữ liệu đồng nghĩa và các dữ liệu nhiều nghĩa a Dữ liệu đồng nghĩa Dữ liệu đồng nghĩa là tên gọi khác để chỉ cùng một loại dữ liệu