Lazy loaded image
🗒️大模型入门01:karpathy讲tokenizer
字数 81阅读时长 1 分钟
2025-9-6
2025-9-6
type
status
date
slug
summary
tags
category
icon
password
comments
😀
大模型入门tokenizer
大型语言模型在处理的时候会遇到很多问题,大多数是由于分词问题
MEGABYTE:Predicting Million-byte Sequences with Multiscale Transformers
提出分层式的Transformer,可能允许直接输入原始字节
 
💡
欢迎您在底部评论区留言,一起交流~
上一篇
笨比勇闯HuggingFace
下一篇
MCP、A2A和Google ADK

评论
Loading...