Insight数据工程编码挑战
我的解决方案
###解决方案
工作计数
为了实现编码挑战的第一个功能,我在/src目录下创建了一个名为WordCount.java的文件。 它以字符串流的形式读取/tweet_input目录中的所有文件,然后解析它们,计算其中的所有单词频率,然后将结果作为txt文件输出到/tweet_output/ft1.txt中。
更详细地讲,我将所有文件作为字符串流读取,然后使用TreeMap集合存储唯一键值对,并使用Treeset集合使结果保持排序。
在算法渐近分析方面,查找的时间复杂度为O(logN) ,其中N为单词数,空间复杂度为O(N) 。
得到中位数
我在/src目录下创建了一个名为GetMedian.java的文件。 它动态读取/tweet_input目录中的所有文件,将唯一的单词放入自定义的MedianHeap类中,并将当前的运行中位数作为txt文件输
评论0
最新资源