Prelude to Data Analysis 2018


  • Home

  • About

  • Tags

  • Categories

  • Archives

Preda Project

Posted on 2018-12-10
Words count in article: 496 | Reading time ≈ 1

Storytelling

期末報告

  • 資料書推。推資料書。。。:選書/報告(report , thesis or paper)原則
  • 一人15 8 分鐘(可組2-3人小隊,但每人報告時間不變,須整合)。 Oral presentation
  • 書面報告,類似期中報告形式,但內容為推介本次報告之主題

重要日期

  • 12/17 繳交報告構想大綱
  • 12/24 開始報告 (報告日期:12/24(5x2), 12/27(5); 1/4(5), 1/7(5x2))
  • 01/12 2019 01/12 23:59 書面報告繳交

Presentation

12/24 (Mon)

  1. 吳汶津: 肥胖與你
  2. 孫國豪: Magic the gathering
  3. 鄒采晏: 被誤解的犯罪學
  4. 陳姵諭: Dark Web
  5. 莫承衡: 金字塔底層大商機
  6. 蘇羿豪: How to lie with statistics
  7. 陳毓晴: Awards and the Longevity of Musicals
  8. 彭長元: 統計的迷思–會騙人的數字
  9. 蘇尉嘉: 斜槓青年
  10. 楊冠彥: 縣道漸寬終不悔?–以花蓮縣道193拓寬案為例

12/27 (Thr)

  1. 簡如均: 鄉民公審/社會正義
  2. 吳家萱: 脫北者(一)
  3. 宋宸耘: 脫北者(二)
  4. 賴雅璇: 文學大數據(一)
  5. 陳婧: 文學大數據(二)

01/03 (Thr)

  1. 吳明哲: 吃遍世界看經濟
  2. 侯冠均: Cooking for Geeks
  3. 張維凱: Factfulness
  4. 陳心如: 富爸爸,窮爸爸
  5. 鍾婕歆: 自殺的迷思

01/07 (Mon)

  1. 賴以婷: 與成功有約
  2. 陳柏任: 超自然心理學
  3. 王星宇: 巷口社會學
  4. 黃子娟: Bilibili
  5. 江孟芸: 說話的藝術
  6. 李采晏: 小心!魔鬼就在你身邊!
  7. 蔡明錡: Big Data
  8. 李冠霈: ????

說明

  • 報告構想大綱
    • 這本書/論文主要關心的問題
    • 我想聚焦的問題/圖表/統計數字
    • 針對聚焦問題的初步心得,文獻資訊探索
    • 參考資料與延伸閱讀
  • 書面報告內容與結構建議
    • 摘要: 總結本報告內容
    • 介紹: 為何這本書/論文的內容為何重要/為何是你該知道的?它會對你有何幫助/成長?
    • 主要內容
    • 結論
    • 參考資料/延伸閱讀

Week 14. Hello R! Hello DS!

Posted on 2018-12-10
Words count in article: 77 | Reading time ≈ 1

R 是一個開源自由統計軟體/系統. 加上 Rstudio, 他們合體成一個強大而方便的資料分析,資料視覺化,甚至是撰寫報告,寫作書籍的一個方便環境。
From Zero

從零開始

  • R for Data Science
  • R Games
  • You Can Be A Data Analyst Without Doing Heavy Math

Week 13. Preda Project. I

Posted on 2018-12-05
Words count in article: 164 | Reading time ≈ 1

這個課程報告將作為接下來幾周的主軸,大家可以以個人或小組為單位,選擇主題、研究主題、準備報告內容、準備口頭報告以及最後撰寫書面報告。歡迎隨時和我討論。

資料與資訊很多,提醒各位我們的 buffet analogy :)

選擇主題

尋找適合、有趣、自己有興趣的,與資料、圖表有關的書籍或文獻。

研究

準備報告內容

準備口頭報告

書面報告

蹺課 + 溫暖冬陽+ 蒜味蜂蜜蛋糕條

Links

  • Weapons of Math Destruction by Cathy O’Neil’s
    • TED (13 min)
    • Google (58:21), Ford Foundation(64:27)

Week 12.2. Storytelling-structured Presentation

Posted on 2018-11-29
Words count in article: 28 | Reading time ≈ 1

芥川龍之介

  • Structure Your Presentation Like a Story by Nancy Duarte
  • The Secret structure of great talks
  • Duarte Tips, Five rules for presentation@youtube
  • Classic storytelling techniques for engaging presentations

Week 12. Report and Presentation

Posted on 2018-11-26
Words count in article: 385 | Reading time ≈ 1

坐在幕前可以看/聽到許多,但走到幕後可以了解更多—不是幕後花絮,而是(部份)知曉一個表演如何拆解、組裝,又完美而即時地統合在一起。再回到幕前,你會更清楚而且更享受這個表演。

Katsune Mihu

Katsune Mih

期末報告 (beta)

  • 資料書推。推資料書。。。:選書/報告(report , thesis or paper)原則
  • 一人15 分鐘(可組2-3人小隊,但每人報告時間不變,須整合)presentation
  • 書面報告,類似期中報告形式,但內容為推資料書

Written Report and Presentation

在學校、社會或網路世界,我們需要與別人溝通:傳達我們知道的,探究我們不知道的,讓別人知道我們的想法與感受。要達成這樣的溝通,書面報告與口頭簡報是相當常用而有強大力量的方式。多數的人都需要有這樣的能力,特別是在生涯、進入社會的起步階段。好好花點時間學習,把握機會練習,會讓你接觸更大的天空。

  • Report writing
    • How to write a college report @wikiHow
    • How to write outstanding college-level book reports, JBirdwellBranson
    • A guide to write sucessful reports @ DERDW ETH
  • 簡報與投影片準備 Presentation & Slides:
    • Robin William’s *RAP, Basic of Design (The Non-Designer’s Design Book);
    • Presentation Zen: Examples at Six Minute, in words, more
    • Technical Presentation:
      WikiHow, A Guide to Technical Presentations;
    • How to give great presentations-4 tips during presentation @Soft Skills – Ask a Wharton MBA
      Giving Presentation Feedback @ Lara Hogan
    • NTU: 丙紳隨筆, 台大簡報課
  • Links, Tools & Apps
    • 東華圖書館
    • Diigo

Week 11. Data Visualization of Grades

Posted on 2018-11-19
Words count in article: 204 | Reading time ≈ 1

以大家所熟悉/關切的考試資料來引介資料分析的面向。幾個關注的問題:

  • 資料之外的資訊來源 vs. 資料之中的資訊
  • 我考得如何?

    • 老師的類型?
    • 全班考得如何?所謂的如何是什麼?
  • 我會拿高分嗎?會被當嗎?

    • 考試成績代表什麼?已知與未知?預測?
    • 老師如何打分數

實例

  • 動機問題:如何理解(老師/助教)公佈的成績資料?如何利用部份訊息來大致推估整體狀況? 參考資料:2016 統計學課網
  • (Continued) 更細部的分析/圖表
    (資料均已匿名化,僅供教學示範)
  • 現在狀況:(可能)可以做的事,可能要小心的事。

Data Science is OSEMN

  • A Taxonomy of Data Science
  • Data Science is OSEMN

Week 10. Data Visualization- Principles

Posted on 2018-11-12
Words count in article: 181 | Reading time ≈ 1

Data Visualization

拜大數據、AI 風潮,Data Visualization 現在是一個熱門詞。但如同AI 一樣,它並不是一個新詞。從某個意義來說,Altamira Cave painting 也有 inforgraph 或 data vis 的成份在其中。越是熱門的詞句,越多濫用與誤用,這門課也許沒有時間詳細討論 BI (Business Intelligence), BA (Business Analytics),或是 R, Python,SAS, Splus 等統計分析軟體與作圖。但希望藉由一些範例的介紹與討論,來了解一下DV的原則 (Principles) 與該注意的一些提醒。

  • Data Visualization keynote with Alberto Cairo @ Microsoft Power BI; 分段表
  • 資料視覺化的基本原則 蔡天怡 數位人文概論國立臺灣大學圖書資訊學系

Week 9.2. Data Visualization 0.0

Posted on 2018-11-08
Words count in article: 58 | Reading time ≈ 1

What you see is what you get?

Data science process

  • Data Vis? How does it relate to Data Analysis?
  • You cannot see it until you “see” it
    • Exploratory data analysis
    • Data/Graphical communication
  • Examples
    • One variable: say midterm scores, income, salary
    • Two or more variables: (midterm, final), (income, age, gender, education, area); (salary, profession, age, gender, education, area)

Week 9.1. **有意**的資料收集

Posted on 2018-11-05
Words count in article: 101 | Reading time ≈ 1

沿著假設檢定的介紹,我們來談一下它的上源,資料。

  • 無心的資料收集
  • 有心的資料收集: 好心 與 不好心/壞心;
    • Sampling/Reasoning towards a foregone solution
    • Multiplicity problem
  • 有(好)心資料資料收集: Basics of sampling survey
    • Simple random sampling: the measurements in the population are homogeneous
    • Stratified random sampling: Homogeneous within stratum, heterogeneous between strata
    • Cluster sampling: Heterogeneous within cluster (as heterg. as the population itself)
      and homogeneous among clusters.
      Keyword: Homogeneous, heterogeneous

Week 8.2. H_0 vs. H_1

Posted on 2018-11-05
Words count in article: 224 | Reading time ≈ 1

假設檢定 Hypothesis Testing

  • 問問題的模式,影響它被回答的方式,間接地影響到結果,結論以及延伸的詮釋。
  • 法庭審查:無罪推定/Presumtion of innnocence
    $$ H_0: \text{A 無罪}. \quad vs. H_1: \text{A 無罪}$$
    勿枉勿縱是理想,但實際上無法做到。退而求其次,不冤優先,次而不縱。
  • 統計假設檢定:H_0_ 推定。當證據不足/不夠強時,就回到 H_0_
    這其實也是一個實務的作法,並無法保證 H_0_是對的。
  • 在許多報告/報導/廣告中,常可見到假設檢定的身影。要注意
    • H_0_, H_1_ 是怎麼放的?合理嗎?
    • 報導的是證據不足不棄卻 H_0_ 還是棄卻 H_0_ 支持 H_1 的結果。一般來說,如僅是前者,基本上只是沿用過去,或相信的作法,並沒有什麼資料證據可言。
12
Kno Tsao

Kno Tsao

Course Web Preda 2018

19 posts
2 categories
3 tags
RSS
© 2018 Kno Tsao | Site words total count: 3.6k
Powered by Hexo
|
Theme — NexT.Pisces v5.1.4