大模型入门01：karpathy讲tokenizer | 于淼的个人博客

llm实践

🗒️大模型入门01：karpathy讲tokenizer

字数 81阅读时长≈ 1 分钟

2026-1-22

type

Post

status

Published

date

Sep 6, 2025

slug

summary

tags

实用教程

热门文章

必看精选

category

llm实践

icon

password

comments

😀

大模型入门tokenizer

大型语言模型在处理的时候会遇到很多问题，大多数是由于分词问题

MEGABYTE：Predicting Million-byte Sequences with Multiscale Transformers

提出分层式的Transformer，可能允许直接输入原始字节

💡

欢迎您在底部评论区留言，一起交流~

笨比勇闯HuggingFace

MCP、A2A和Google ADK

MCP、A2A和Google ADK

作者:于淼
链接:https://yumiao1.com/article/26669159-6c5f-805f-bbd2-c775a12de4bd
声明:本文采用 CC BY-NC-SA 4.0 许可协议，转载请注明出处。

相关文章

langchain入门

Lazy loaded image

关于SoftMax的理解

Lazy loaded image

MCP、A2A和Google ADK

Lazy loaded image

Lazy loaded image

读论文的一些碎碎念

Lazy loaded image

Transformer的理解，参考《Attention is all you need》

Lazy loaded image

评论

Loading...

你好！我是

于淼

🎉 个人博客已发布🎉

-- 感谢您的支持 ---

👏会为大家带来更优秀的作品👏

交流频道

如果有什么想分享的

请您联系我

最新发布

Lazy loaded image

Lazy loaded image

Lazy loaded image

Lazy loaded image

Lazy loaded image

Lazy loaded image

³¹

³⁰

¹⁹

¹²

¹¹

⁹

⁴

³

³

中外小说名著

¹

¹

56

1734 天