วันจันทร์ที่ 24 มกราคม พ.ศ. 2554

Lecture 8 : Data management

Data Management

Data Management

Data เป็นสิ่งสำคัญของ IT application ดังนั้น การจัดการข้อมูลจึงเป็นสิ่งสำคัญ จะต้องมี Quality control ที่ครบถ้วน และจะต้องคำนึงถึง Security, quality และ Integrity ของข้อมูล เพื่อให้ข้อมูลนั้นสามารถนำไปใช้ให้เกิดประโยชน์ได้อย่างมีประสิทธิภาพสูงสุด โดย Data ถือเป็น Infrastructure อย่างหนึ่ง เป็น Frim’s Resource ที่แต่ละคนมีสิทธิเข้าถึงข้อมูลต่างกัน

การสร้างคุณภาพให้กับข้อมูล มี 4 ขั้นตอน ดังนี้

1.       Data profiling : เป็นการทำความเข้าใจ Data ก่อน
2.       Data quality management : สร้างคุณภาพให้กับdata
3.       Data integration : จัดกลุ่มข้อมูลเพื่อให้สะดวกต่อการเรียกใช้งาน หรือ เปิดให้มีการใช้ข้อมูลจากหลายแหล่ง
4.       Data augmentation : เพิ่มมูลค่าให้กับข้อมูล อาจจะด้วยการวิเคราะห์

Data Life Cycle Process

1.       Data sources and databases
·         Internal Data : Transaction processing system
·         External Data : ซื้อข้อมูล
·         Personal Data : ข้อมูลที่พนักงานใช้ เป็นความรู้ของแต่ละบุคคล ที่องค์กรจากจะ Manage (Knowledge management)
2.       Data Storage
หลังจากเก็บข้อมูลไว้ใน databases ชั่วคราวจึงทำการประมวลและจัดทำให้อยู่ในรูปที่เหมาะสมแล้วจึงนำเก็บใน Data warehouse หรือ Metadata
3.       Data Analysis
User สามารถเข้าไปที่ Data warehouse หรือ data mart เพื่อดึง copy ข้อมูลไปวิเคราะห์ ด้วยการใช้ Analysis tools ซึ่งมี 2 อย่างคือ Data analysis tools และ Data mining tools
4.       Results
5.       Solution
พวก SCM, CRM, EC, Strategy และอื่นๆ

Data Processing

แบ่งเป็น

1.     Transactional

ได้แก่ database ซึ่งเป็นเพียง operational system เก็บข้อมูลชั่วคราวจาก transaction processing systems

2.     Analytical

ได้แก่ Data warehouse ซึ่งเป็น Analytical processing เราสามารถ Extract ส่วนที่เราจะใช้วิเคราะห์ออกมาได้
การจะเลือกระบบที่เหมาะต้องดูว่าองค์กรเรามีความจำเป็นต้องใช้แบบไหน องค์กรที่ต้องตัดสินใจจากข้อมูลที่ผ่านการวิเคราะห์ก่อนก็ควรใช้ Analytical processing

Characteristics of Data Warehouses

1.       Organization สามารถจัดโดยใช้รายละเอียดของข้อมูลให้อยู่ในที่ที่เหมาะสมได้
2.       Consistency จะถูกกำหนด code เหมือนกันหมด เป็น default
3.       Time variant เก็บข้อมูลนานเพื่อที่สามารถใช้เปรียบเทียบระหว่างช่วงระยะเวลาได้
4.       Non-volatile เมื่อถูกเก็บแล้วข้อมูลจะไม่อัพเดทจากระบบ
5.       Relational ใช้รูปแบบที่ Relational
6.       Client/server ใช้เซิฟเวอร์ในการทำให้ผู้ใช้เข้าใช้ฐานข้อมูลได้ง่าย
พินทิรา ซิมะลาวงค์
5202113030

ไม่มีความคิดเห็น:

แสดงความคิดเห็น