- Exploratory Data Analysis
- Crash course for R
謝舒凱 Graduate Institute of Linguistics, NTU
前處理完之後才開始進入分析工作。
資料探索分析 (exploratory data analysis) 是資料科學分析歷程很重要的一環,目的是適當的來來回回檢視資料以取得合理的假說。
這個過程涉及到 資料操控 (data manipulation)、資料視覺化 (data visualization) 技巧與統計分析 (statistics)。
numeric.EDA:下次介紹
給定文本資料,除了轉成 數據資料
(結構性資料) 之外,我們還想要知道如何從文本中挖掘出語意。
文本語意可以用來幫助回答各種不同的 (text analytics) 問題,如作者(群)的
文本分析+社群網路分析+各式感測器 = 無所遁逃於天地之間。(嘆/氣的同時可看到新的可能,e.g., 鴨鴨走
,質子信
)
具體來說,「語言/文本分析」和「語言處理」可以提供什麼角度?
文本中的溝通系統日趨多元複雜 (multimodality)
ha ha
ha ha ha
he he he
heh heh
hee hee hee ha ha ha hoooooo hoo
http://grammar.about.com/od/tz/g/Text-Linguistics.htm
以下是 Obama "YES, WE CAN" 演說中顯著的語言特徵 (Carter and Goddard, 2016),你看出什麼端倪嗎?
想要多瞭解
語言/文本分析
, 圖片搜尋how to analyse texts linguistically
這次你們自己選文本,自己找梗發揮。BTW, 可以參考 RMarkdown cheatsheet