วันพุธที่ 19 มกราคม พ.ศ. 2554

ฺclass#9 : data management II and business intelligence

data warehouse process
  • collecting data from external and operational data
  • ทำMeta Data
  • ทำ Data Staging 
  • สร้าง Data Warehouse 
  • สร้าง Business View 
Metadata  : provides information about the content of warehouse
The data mart
เป็น data warehouse ของ strategic business unit หรือ ของแต่ละแผนก ซึ่งจะมีจ้อมูลและความเร็วในการตอบสนองน้อยกว่า data warehouse ซึ่งdata mart มีอยู่2ประเภท คือ
  1. Replicated(dependent) data mart
  2. stand-alone data mart
The data cube 
   เป็น multidimentional database ที่เอาไว้เก็บข้อมูลที่ Transform แล้วจึงมา Load ลงที่นี่ เพื่อให้สามารถมองภาพของข้อมูลนั้นได้หลายมิติมากขึ้น จุดเด่นของ Data Cube คือ สามารถตัดแบ่งส่วนเพื่อเลือกข้อมูลที่ต้องการวิเคราะห์ได้ ทำให้สามารถวิเคราะห์ข้อมูลที่มีได้ในหลายมิติ หลายมุมมอง ทำให้เห็นปัญหาที่ชัดเจนขึ้น

Business intelligence
    Business intelligence process transforms จาก data --> information --> decision --> action  โดย BI functions and features ประกอบไปด้วย 
1.Reporting and analysis

    • Dashboards  มักใช้ในการแสดงผลของ operation or tactical โดยแบ่งได้เป็น3ระดับคือ
      • operational dashboards ซึ่งถูกใช้โดย front lines worker,supervisor
      • tactical dashboards ซึ่งถูกใช้โดย manager and analysts
      • strategic dashboard ซึ่งถูกใช้โดย ผู้บริหาร
    • Scorecards ใช้เพื่อประเมินผลและตืดตามผลการดำเนินงาน 
2.analytics
      3.data integration
    โดย Business intelligence  ส่วนใหญ่บริษัทมักจะไม่ได้ทำการพัฒนาจากภายใน แต่่จะซื้อมาจากภายนอก
    • Business performance management  ต้องการวิธีการที่ง่ายและรวดเร็วในการ สร้างระบบวัดผลให้สอดคล้องกับ goal objective and alignment strategies  โดย Business performance management  จะทำได้ดีแค่ไหนขึ้นอยู่กับ  business intelligence analysis reporting 
    • online analytical processing ช่วยให้ผู้บริหารสามารถระบุปัญหาได้
    data mining เป็นการแยกข้อมูลออกมาเพื่อพยากรณ์แนวโน้มที่อาจจะเกิดขึ้น โดยมีลักษณะดังนี้
    1. large database
    2. ข้อมูลอาจจะทำการเก็บไว้ใน data warehouse or internet and intranet server
    3. client-server architecture or web-based
    4. paeallel processing 
    5. data mining yields 5 type of information
      • clustering
      • classification จัดกลุ่มภายใต้สมมติฐาน
      • association เป้นผลสืบเนื่องจากการวิเคราะห์ 
      • sequence discovery
      • prediction
    Text Mining - เป็นการจัดกระทำกับข้อมูลที่ไม่มีรูปแบบ (Unstructured Data)

    วันพุธที่ 12 มกราคม พ.ศ. 2554

    class#8 12/1/2011

    ระบบ(system)
        ระบบมีกระบวนการทำงานคือ input  ผ่าน processออกมาเป็น output 

    • ต้องมีการกำหนดวัตถุประสงค์เพื่อระบบ output ที่ต้องการ 
    • outputที่่ต่างกันส่งผลให้มี inputและ processที่ต่างกัน
    Date VS Information
         information ต่างจากdataคือ information เป็นข้อมูลที่ผู้รับข้อมูลจะมีส่วนได้ส่วนเสีย หรือไ้ด้รับประโยชน์จากข้อมูลนั้น  โดยข้อมูลนั้นจะมีผลต่อพฤติกรรมและการตัดสินใจของผู้รับข้อมูล  ในขณะที่data ไม่ส่งผลอะไร



    ระบบสารสนเทศ(Information system)
    ระบบสารสนเทศ คือ ระบบที่ผลิตสารสนเทศ ซึ่งแตกต่างกันไปตามวัตถุประสงค์ โดยระบบสารสนเทสนั้นทำหน้าที่ในการรวบรวมข้อมูลจากแหล่งต่างๆและนำข้อมูลไปประมวลผลหรือวิเคราะห์ เพื่อให้ได้สารสนเทศตามวัตถุประสงค์และนำเสนอแก่ผู้ที่ต้องการ  และทำการจัดเก็บบันทึกข้อมูลไว้เพื่อใช้ในอนาคตต่อไป
    องค์ประกอยของสารสนเทศ 
    • Hardware
    • software
    • data
    • network
    • procedures
    • people
    Data management
         การจัดเก็บข้อมูลนั้นทำได้ยากเนื่องจาก
    • ข้อมูลนั้นมีเป็นจำนวนมาก และมีการเพิ่มจำนวนขึ้นอย่างรวดเร็ว 
    • บางครั้งข้อมูลมีความซ้ำซ้อน 
    • ข้อมุลบางอย่างต้องเก็บจากภายนอก
    • เรื่องความปลอดภัย คุณภาพ ความสมบูรณ์ของข้อมูลเป็นเรื่องที่สำคัญ
    • การเลือกเครื่องมือในการจัดการข้อมูล
    data management ประกอบไปด้วย4อย่าง
    • data profiling
    • data quality
    • data integration
    • data augmentation

    data life cycle
    • collect new data
    • จัดเก็บข้อมูลชั่วคราวใน database และทำการ preprocessed เพื่อจัดเก็บช้อมูลลงใน warehouse 
    • ทำการ copy ข้อมูลที่ต้องการวิเคราะห์จาก warehouse
    • ทำการวิเคราะห์ข้อมูล
    Data source
    • organization data
    • End user data
    • External data
    ประโยชน์ของ data warehouse
    • สามารถเข้าถึงข้อมูลได้เร็ว
    • สามารถเข้าถึงข้อมูลได้ง่าย และบ่อย
    คุณลักษณะของ data warehouse
    1. organization ทำการจัดหมวดหมู่ข้อมูล
    2. consistency
    3. time variant
    4. non-volatile
    5. relational
    6. client/server