วันพฤหัสบดีที่ 20 มกราคม พ.ศ. 2554

Lecture9 (19/01/2011)

Data Management

Data warehouse process

1.       External Data and Operational Data – เก็บข้อมูลจากการดำเนินงานภายในจากแผนกต่าง ๆ ขององค์กร  และข้อมูลภายนอก เช่นข้อมูลคู่แข่ง โดยรวมถึง Atom data เช่น ราคาขายของคู่แข่ง จุดแข็งจุดอ่อนของคู่แข่ง
2.       Metadata -- extract ข้อมูลที่ต้องการจาก database มายัง Meta data โดยผ่านหลายส่วน เช่น Administration, Authorization, Resource, Business views, Automation Process, System Monitoring
3.       Data Staging – การทำ ETL (Extract Clean Transform Load) เลือกattribute เฉพาะรูปแบบที่เป็นประโยชน์ และโหลดลง Data cube
4.       Data Warehouse Business Subject – นำข้อมูลมาแปลงเป็น Data Warehouse โดยยึดมุมมองของแต่ละ subject
5.       Business View – ผู้บริหารจะใช้งาน Data Warehouse โดยผ่าน Dashboard เพื่อการวิเคราะห์และตัดสินใจ
6.       Information Catalog & Business Information – ข้อมูลที่ได้จะต้องใช้ได้จริง

·         Metadata คือ data ของ data บอกข้อมูลเกี่ยวกับส่วนประกอบของ Data Warehouse และบอกแนวทางของข้อมูล

·         The data mart คือ Data Warehouse ที่มีขนาดเล็ก สำหรับ SBU (Strategic business unit) มีข้อมูลและความเร็วในการตอบสนองน้อยกว่า data warehouse ซึ่งแบ่งออกเป็น 2 ประเภท คือ Replicated (dependent) data mart และ stand-alone data mart

·         The data cube คือ multidimensional database บางครั้งอาจเรียกว่า OLAP ทำหน้าที่เก็บข้อมูลที่ Transform และ Load เพื่อให้สามารถมองภาพของข้อมูลนั้นได้หลายมิติมากขึ้น จุดเด่นของ Data Cube คือ สามารถตัดแบ่งส่วนเพื่อเลือกข้อมูลที่ต้องการวิเคราะห์ได้ ทำให้สามารถวิเคราะห์ข้อมูลที่มีได้ในหลายมิติ บอกความสัมพันธ์ของข้อมูลแต่ละมิติ สามารถมองจากภาพละเอียดเป็นภาพรวม และ จากภาพรวมเป็นภาพละเอียด

Business intelligence

คือ เป็นการรวมกันของ การออกแบบโครงสร้างระบบ เครื่องมือต่างๆ รวมถึงฐานข้อมูล Application และ Methodologies ทำโดยการเปลี่ยน data ให้เป็น information แล้วเปลี่ยนเป็น decision ตามด้วย action โดย BIประกอบไปด้วย 
1.       Reporting and analysis -- เป็นส่วนออกรายงานให้แก่ผู้ใช้
-          Enterprise Reporting System
-          Enterprise search  
-          Dashboards
-          Scorecard
-          Visualization tools
2.       Analytics – เครื่องมือในการวิเคราะห์ เช่น  Predictive analysis, Data, text, and Web mining, OLAP
3.       data integration – การเตรียมข้อมูลให้พร้อมวิเคราะห์ เช่น ETL และ EII

Online Analytical Processing (OLTP)
เป็นเครื่องมือเริ่มต้นของผู้บริหารที่จะใช้สารสนเทศช่วยในการวิเคราะห์ ทำได้เพียงระบุปัญหาและวิเคราะห์ในระดับพื้นฐานเท่านั้น ไม่สามารถตอบคำถามเชิงธุรกิจได้ การวิเคราะห์ข้อมูลด้วยเครื่องมือนี้จะทำให้ได้ insight ของข้อมูล โดยจะ Fast, consistent, interactive

Data Mining
เป็นกระบวนการค้นหา Previously unknown, comprehensible, and actionable จาก database ที่มีขนาดใหญ่ กระบวนการ mining เริ่มจากการรวบรวมข้อมูลทั้งจาก Warehouse และแหล่งอื่น ผ่านการทำ ECTL แล้วจึงวิเคราะห์และประมวลผลข้อมูล และ การแปรผลข้อมูลซึ่งสำคัญที่สุด ถือเป็น output ที่แท้จริง
รูปแบบของ Data Mining มี 5 รูปแบบ ดังนี้
1.       Clustering – การจัดกลุ่ม จากความสัมพันธ์ของข้อมูล
2.       Classification – การจัดกลุ่ม จากสมมติฐานที่ตั้งไว้ แล้วทำการพิสูจน์
3.       Association – นำเสนอผลสืบเนื่อง
4.       Sequence discovery – ผลที่เกิดขึ้นตามหลัง
5.       Prediction – พยากรณ์สิ่งที่จะเกิดขึ้น

Text Mining
เป็นการทำ data mining กับข้อมูลที่ไม่มีรูปแบบ unstructured Data or less structured text files จะช่วยในการหา hidden content จากข้อมูลที่ไม่มีรูปแบบ และจับกลุ่มข้อมูลที่มีลักษณะเดียวกันเข้าด้วยกัน

ไม่มีความคิดเห็น:

แสดงความคิดเห็น