transformer(7)_fast_tokenizer

    2024-04-14

    快速分词器

    1 快速分词器

    Hugging Face 共提供了两种分分词器:

    • 慢速分词器:Transformers 库自带,使用 Python 编写;
    • 快速分词器:Tokenizers 库提供,使用 Rust 编写。
    Read More

    transformer(5)_necessary_pytorch_basic

    2024-04-14

    必要的 Pytorch 知识

    Transformers 库建立在 Pytorch 框架之上(Tensorflow 的版本功能并不完善),虽然官方宣称使用 Transformers 库并不需要掌握 Pytorch 知识,但是实际上我们还是需要通过 Pytorch 的 DataLoader 类来加载数据、使用 Pytorch 的优...

    Read More

    transformer(2)_pipeline

    2024-04-08

    开箱即用的 pipelines

    1 开箱即用的 pipelines

    Transformers 库将目前的 NLP 任务归纳为几下几类:

    • 文本分类:例如情感分析、句子对关系判断等;
    • 对文本中的词语进行分类:例...
    Read More

    personal_mini_server

    2024-04-06

    个人迷你服务器

    0 需求说明

    考虑自己工作之余会写一些有趣的代码,这些代码需要托管在一个服务器上;在开发过程中,会使用到多种不同的平台(Windows,Linux,Android),在这多种平台之间经常需要进行大量的数据共享;另外还经常有许多的资料/数据需要通过百度网盘/夸克网盘等网盘,或者是其他...

    Read More
    View: User: