用Hadoop编程完成wordcount单词统计程序-南华大学
2022-09-23 11:04:50 706KB
1
数据结构相关的课程设计,实现了基于顺序表、链表、二叉树、哈希表的词频统计与检索,仅供参考!
一个基于Hadoop平台进行的单词统计系统,其中包含了伪分布架构,并且包含HDFS数据存储,结合Java后台利用Mapreduce架包进行单词的统计与分析。包含了完整的实践过程,内涵源代码,以及实验命令,内容丰富,实验过程完整。指令明确,图文并茂,且配有对于每一个关键步骤的详细解释,对于新手及其友好。并且对于搭建过程中所会产生的问题,进行了详细的解释。内附Madreduce和程序整体的运行流程,过程清晰明了。
1
单词处理 ~~~~~~~~~~~ 对读入的某个文本文件input.txt中,拆出英文单词,输出一个按字典顺序排列的单词表,结果输出在文本文件output.txt中,每个单词一行,并在单词后输出该单词出现的个数,两个字段之间用逗号分隔。约定单词仅由英文字母组成,单词间由非英文字母分隔,相同单词只输出一个,大小写不区分。 例如文本文件input.txt为: Hello world. Hello every one. Let us go. 则输出文本文件output.txt为: every,1 go,1 hello,2 let,1 one,1 us,1 world,1 试编一个完整的程序完成该功能。 提示:重点了解一下与字符串处理相关的库函数,并使用list.h中结构来组织数据
2022-05-04 17:40:47 4KB 单词个数 不区分大小写 排序
1
第一次实现hadoop上的程序,内含jar包和用例,算迈出大数据的第一步吧。。
2022-03-30 22:25:39 4KB 简单单词统计 hadoop
1
JAVA写的一个单词统计程序,可统计任意文件的单词出现频率并绘制图表。
2022-03-18 11:37:48 9KB JAVA 单词统计 图表
1
统计文章中不重复的单词数
2022-02-18 15:58:52 11KB 单词 统计
1
段落单词统计C++(实验报告+源程序) 段落单词统计C++(实验报告+源程序) 段落单词统计C++(实验报告+源程序)
2021-12-21 15:31:56 217KB 段落单词统计 C++
1
大数据实验报告Hadoop编程实现wordcount单词统计程序附源码.doc
英语单词频数统计软件,个人自制
2021-12-04 23:19:03 20.89MB 英语单词频数
1