typestatusdateslugsummarytagscategoryiconpasswordcomments😀SoftMax1.手撕softmax1. 基础实现(简单但可能有数值溢出) 2. 数值稳定版本(推荐使用)当输入向量中的元素很大时,np.exp(z)可能导致数值溢出(结果为inf)。解决方法是减去输入向量中的最大值(不改变最终结果,数学上等价): 3.使用示例输出结果说明2.理解 💡欢迎您在底部评论区留言,一起交流~上一篇网络安全学习Day1环境配置下一篇笨比勇闯HuggingFace下一篇笨比勇闯HuggingFace作者:于淼链接:https://yumiao1.com/article/29169159-6c5f-80d8-9df1-dcff0d6c6b9d声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。相关文章大模型入门01:karpathy讲tokenizerMCP、A2A和Google ADK基础学习读论文的一些碎碎念Transformer的理解,参考《Attention is all you need》如何读一篇论文