大数据学习03 Spark入门项目 wordCount 不同的实现 | 于淼的个人博客

大数据学习

🗒️大数据学习03 Spark入门项目 wordCount 不同的实现

字数 315阅读时长≈ 1 分钟

2025-2-26

type

status

date

slug

summary

tags

category

icon

password

comments

1.建立与Spark框架的连接

2.按行读取文件目录

3.扁平化操作，将一行数据拆分形成一个一个的单词

4.单词分组

一、聚合

第一种方法使用.size没有体现聚合的过程本方法则是聚合的过程

二、代码实现

第二种方式实现wordCount代码

代码如下（示例）：

💡

因为笔者才开始接触这方面的技术，没有大数据相关的基础，所以还有许多不理解的地方，接下来会先进性scala和lambda的学习

大数据学习02 Spark入门项目快速上手

大数据学习04 Scala的学习

大数据学习04 Scala的学习

作者:于淼
链接:https://yumiao1.com/article/bigData03
声明:本文采用 CC BY-NC-SA 4.0 许可协议，转载请注明出处。

相关文章

关于SoftMax的理解

Lazy loaded image

大模型入门01：karpathy讲tokenizer

Lazy loaded image

MCP、A2A和Google ADK

Lazy loaded image

Lazy loaded image

读论文的一些碎碎念

Lazy loaded image

Transformer的理解，参考《Attention is all you need》

Lazy loaded image

评论

Loading...

目录

你好！我是

于淼

🎉 个人博客已发布🎉

-- 感谢您的支持 ---

👏会为大家带来更优秀的作品👏