数据科学导论(第1部分)
该存储库包含罗萨里奥大学于2018年6月提供的数据科学入门课程第一部分的材料。课程的这一部分涵盖了数据科学基础,文本分析以及使用社交媒体数据的简介。和一些无人监督的模型。 大多数部分都包含该主题的理论概述和R中的编码示例。
有关该课程的后勤信息,可以在这里找到:
本课程的大部分内容是我过去曾帮助教授的课程的组合; 这里的所有材料都是免费的,任何人都可以使用。 我要特别感谢Pablo Barbera,Ken Benoit和Matt Salganik分享了他们的课程材料或将其公开发布。
指导老师:Kevin Munger
1.数据科学导论
2. R简介
3.使用文本作为数据的简介
文字为资料3(R)
文字为资料4(R)
4.无监督模型
无监督模型(幻灯片)
文本无监督模型(R)
5.文本作为数据应用程序
狄更斯·奥斯丁PCA示例(R)
6.社交网络分析