2025-07-01

    项目代码:LSTM

    1 LSTM 原理

    长短期记忆网络(Long Short-Term Memory, LSTM)是一种特殊的循环神经网络(RNN),专门...

    Read More
    2025-07-01

    项目代码:GRU

    1 GRU——门控循环单元

    传统的循环神经网络(RNN)在处理长序列数据时常常遇到梯度消失或梯度爆炸的问题,这限制了它们捕捉长期依赖关...

    Read More
    2025-06-30

    Qwen2 modeling 源码

    Qwen的整体架构与Llama2类似:

    alt text

    2025-06-30

    项目代码:build_and_train_rnn

    1 循环神经网络模型 RNN

    循环神经网络(RNN)是一种神经网络类型,其神经元的输出在下一个时...

    Read More
    2025-06-23

    guessing game

    通过一个经典的新手编程问题,猜数字游戏来熟悉letmatch、方法、...

    Read More