作业网址: :
#PART 1:如何运行代码
问题 4:Shell 脚本:q4.sh 运行大约需要 20 秒
给定从训练数据产生计数的代码 python count_cfg_freq.py parse_train.dat > cfg.counts --> 生成计数文件
用稀有替换单词并用稀有生成新的训练数据 python add_rare.py cfg.counts parse_train.dat > parse_train_rare.dat --> 将带有稀有的新源文件输出到 parse_train_rare.dat
生成稀有训练数据的计数 python count_cfg_freq.py parse_train_rare.dat > cfg_rare.counts --> 生成新的计数文件
问题 5:Shell 脚本:q5.sh 耗时不到 2 分钟
appllies cky_a