torch._dynamo 理解
0 概述
TorchDynamo 是一个 Python 级别的即时 (JIT) 编译器,旨在让未修改的 PyTorch 程序运行得更快。它通过 Python Frame Evaluation Hooks(Python 框架评估钩子)来实现这一目标,以便在...
iree 编译流程(2)——buildGlobalOptimizationPassPipeline
IREE::Util::createSimpli...
IREE 编译流程(1)
IREE 目前支持将 MHLO 或 XLA、Torch Tensor 和 TOSA 作为输入,经过一系列 passes 编译生成 IREE 定义的 VM bytecode 中间产物,其中硬件相关代码会编译成相应的 Executable,保存在 VM bytecode 中供 host 进行调用。例如 CUDA ...
0 概述
FX 是一个供开发者用来转换 nn.Module 实例的工具包。FX 包含三个主要组件:符号跟踪器(symbolic_traced)、中间表示(intermediate representation,IR)和Python 代码生成(Code genera...
奇异值分解(SVD)时间复杂度分析与优化
奇异值分解是一种矩阵分解的方法,大学线性代数里面也讲过奇异值分解的方法,因此这是一个为大家所熟知的算法。
1 SVD 时间复杂度分析
给定一个 $m \times n$ 的矩阵 $\boldsymbol{...
奇异值分解(SVD)原理
0 引子
奇异值分解(singular value decomposition,SVD)是一种矩阵因子分解方法,是线性代数的概念。在机器学习中,矩阵分解是常用的手段,作为矩阵分解的经典方法SVD,不仅是经典的数学问题,在工程应用中许多地...
Python如何优雅地在Terminal打印下标
在 Python 中想要再terminal窗口打印下表,可以使用Unicode
方法将下标打印到 terminal 窗口也可以使用
Read More