วันจันทร์ที่ 24 มกราคม พ.ศ. 2554

Lecture 9 : Datamangement and Business intelligence

Data Management (ต่อจากคาบที่แล้ว)
Data Warehouses Suitability 
เหมาะสำหรับ องค์กรที่มีข้อมูลและผู้เข้าใช้งานจำนวนมาก เนื่องจากจะช่วยให้ผู้ใช้สามารถ Drill Down ได้มองเจาะลงไป สามารถเรียกใช้ข้อมูลได้ตามที่จำเป็น สะดวกรวดเร็ว เช่น อธิการ จะดูภาพรวมของทั้งมหาวิทยาลัยก่อน จากนั้นจึงเจาะลงไปแต่ละคณะฯ เป็นการดึงข้อมูลมาจาก Data Base เฉพาะหัวข้อที่เกี่ยวข้อง เพื่อนำมาใช้ในการวิเคราะห์ข้อมูล

Data Warehouse Process
แบ่งเป็นขั้นตอน ดังนี้
1.       รวบรวมข้อมูล 
ซึ่งเก็บข้อมูลทั้งหมดจากภายในองค์กร(Operational Data) และ ภายนอกองค์กร(External Data) เช่นข้อมูลคู่แข่ง
2.       Meta Data 
เป็นข้อมูลของข้อมูลซึ่งเกิดจากการที่นำข้อมูลที่ได้มาทั้งหมดมารวบรวม และสร้างเป็น Meta Data ซึ่งใช้สำหรับอธิบายข้อมูลต่างๆใน ware house
3.       Data Staging 
จัดระบบข้อมูล และสร้างเป็น Data Cube โดยเริ่มจากคัดแยกข้อมูล(Extract) จากนั้น clean เพื่อลดความซ้ำซ้อนของข้อมูล แล้วจึงแปลงสภาพข้อมูล(Transform) ท้ายสุดเก็บใน data cube (Load) ทั้งหมดอาจเรียก ETL
4.       Data Warehouse 
นำข้อมูลมาสร้าง Data Warehouse โดยยึดตามวัตถุประสงค์ของธุรกิจเป็นหลัก
5.       สร้าง Business View 
นำเสนอข้อมูลสำหรับผู้บริหาร ในรูปแบบของ Dash Board เพื่อให้ผู้บริหารสามารถนำไปใช้ได้อย่างสะดวก

Metadata
เป็นข้อมูลที่เกี่ยวกับข้อมูลที่อยู่ใน Warehouse เช่น พวก guide ในการย้ายdata หรือ พวก business term used ที่ใช้อธิบายข้อมูล

Data Mart
Data Mart เปรียบเสมือน Data Warehouse ขนาดย่อม ซึ่งหมายถึงการแบ่งข้อมูลเฉพาะที่ใช้งาน ไม่ใช่การย่อขนาดของข้อมูลลง ผู้ใช้งานจะคัดลอกข้อมูลในส่วนที่เกี่ยวข้องและมีความเหมาะสมของแต่ละแผนกให้เป็น Data Mart ของแต่ละแผนกเอง ทำให้การทำงานสามารถตอบสนองการใช้งานได้เร็วขึ้นดังนั้นจึงเหมาะสำหรับองค์กรขนาดใหญ่ที่มีแผนกย่อยจำนวนมาก ซึ่ง Data Mart แบ่งออกเป็น ประเภท คือ
1.       Replicated (Dependent) Data Marts
เป็นการคัดลอกข้อมูลบางส่วนที่จำเป็นต้องใช้เพื่อสร้างเป็น Data Mart ใหม่ให้มีขนาดเล็กลง
2.       Stand-alone Data Mart 
เป็นการสร้าง Data Mart เฉพาะฝ่ายขึ้นมาก่อน เนื่องจากองค์กรยังไม่มีความพร้อม เมื่อทำครบทุกฝ่ายแล้วจึงนำมารวมกันเป็น Enterprise  แต่กรณีนี้เป็นไปได้ยากมาก

Data Cube
คือ ฐานข้อมูลที่มีหลายมิติ (Multidimensional Databases) จับหลายมุมมองมารวมกัน เพื่อให้สามารถมองภาพของข้อมูลนั้นได้หลายมิติมากขึ้น โดยมีจุดเด่น คือ สามารถตัดข้อมูลเป็นแต่ละส่วนเพื่อเลือกส่วนของข้อมูลที่ต้องการวิเคราะห์ได้ ซึ่งสามารถ Slice และ Dice ออกมาได้ มีลักษณะคล้ายรูบิค คือพิจารณาได้ทั้งแนวตั้งและแนวนอน ขึ้นกับว่าผู้บริหารกำหนด Dimension เพื่อการนำไปใช้อย่างไร

Business Intelligence
เป็นการรวมกันของโครงสร้างระบบ เครื่องมือต่างๆ รวมถึงระบบฐานข้อมูล เป็นการเตรียมข้อมูลให้พร้อม เพื่อช่วยในการวิเคราะห์ข้อมูลได้ทันที ประกอบไปด้วย กลุ่ม ดังนี้
1.       Reporting and Analysis (รายงาน+นำเสนอ) ได้แก่
Enterprise Reporting System 
จัดทำรายงานทั้งในรูปแบบปกติ และรูปแบบที่สามารถปรับแก้เองได้ตามต้องการ ทำให้รายงานมีมาตรฐาน ลดข้อมูลแฝง และลดเวลาในการเก็บข้อมูล ซึ่งรายงานเหล่านี้จะเป็นข้อมูลที่เตรียมให้สำหรับผู้บริหารนำไปใช้ในการวิเคราะห์ต่างๆได้อย่างรวดเร็ว
Dashboards
การนำเสนอข้อมูลออกมาเป็นรูปภาพ โดยแบ่งเป็นการแสดงรายงานของบุคลากรทั้ง ระดับ ได้แก่ Operation Dashboard, Tactical Dashboard และ Strategic Dashboard 
Scorecard 
เป็นรายงานสำหรับผู้บริหาร ผู้จัดการในระดับกลยุทธ์ ซึ่งเป็นเครื่องมือสำหรับการตรวจสอบและควบคุม โดยนำหลักมาจาก Balance Scorecard ที่แบ่งมิติสำหรับการตรวจสอบออกเป็น มิติ ด้วยกันนอกจากนี้ยังมีการกำหนด KPIs ที่ใช้สำหรับการตรวจสอบและประเมินผลการทำงานอีกด้วย
Visualization tools 
เป็นเครื่องมือยอดนิยมมากที่สุด เนื่องจากช่วยทำให้เห็นภาพ และเข้าใจได้ง่าย
2.       Analytics (วิเคราะห์ข้อมูล)
วิเคราะห์ข้อมูลจากเครื่องมือต่างๆ ได้แก่ Predictive analysis, Data,text and web mining Business และ Online Analytical Processing (OLTP) ซึ่งเป็น software ที่ช่วยให้ผู้บริหารเข้าถึงข้อมูลได้อย่างรวดเร็ว, consistency และ interactive
3.       Data Integration (เตรียมข้อมูลให้พร้อมในการวิเคราะห์)
ประกอบด้วย ETL(extract,transform,load) และ EII (Enterprise information integration) 


Data Mining 
เป็นการค้นหาข้อมูลที่เป็นประโยชน์ซึ่งไม่เคยรู้มาก่อน และแยกข้อมูลออกมาเพื่อพยากรณ์แนวโน้มที่อาจจะเกิดขึ้น โดย Data Mining จะต้องทำกับบริษัทที่มี Database ขนาดใหญ่ที่มีข้อมูลจำนวนมาก เพื่อให้เกิดประโยชน์ในการค้นหา ซึ่งจะก่อให้เกิดประโยชน์อย่างมากเมื่อสามารถตีความหรือเข้าใจในผลลัพธ์และนำไปใช้ได้อย่างถูกต้อง โดย Data mining มีรูปแบบดังนี้
·        Clustering – plot ข้อมูล และนำเสนอข้อมูลที่มีความสัมพันธ์กันเอง ให้ดูง่ายขึ้นเห็น Trend
·        Classification – แบ่งตามคุณลักษณะต่างๆและทดสอบว่าสมมติฐานนั้น
·        Association – วิเคราะห์ผลสืบเนื่อง
·        Sequence discovery – ผลที่เกิดตามหลังมา
·        Prediction - นำเสนอผลที่ใช้สำหรับการคาดการณ์ในอนาคต
พินทิรา ซิมะลาวงค์ 
5202113030

ไม่มีความคิดเห็น:

แสดงความคิดเห็น