深入理解Alpaca 的优化、训练及应用

一、从 LLaMA 到 Alpaca：大模型的小训练

1.1 LLaMA 概要与实践

LLaMA(Large Language Model Meta AI) 是由 Meta AI 发布了一款全新的大型语言模型，共有7B、13B、33B、65B 四种版本，其模型参数如下表所示：

与原始的 transformer Decoder 相比，LLaMA主要有以下改进：

预归一化(Pre-normalization)[GPT3]

为了提高训练的稳定性，LLaMA对每个transformer子层的输入进行归一化，而不是对输出进行归一化。同时使用RMSNorm归一化函数。

SwiGLU激活函数[PaLM]

LLaMA用SwiGLU激活函数取代ReLU非线性，以提高性能。SwiGLU激活函数的实现如下：

其中，，具体实现参考这里[1]。

旋转嵌入(Rotary pos)[GPTNeo]

LLaMA删除了绝对位置嵌入，取而代之的是在网络的每一层添加旋转位置嵌入（RoPE），RoPE的实现参见这里[2]。当前 HuggingFace 已经实现了 LLaMA 模型代码，可通过以下方式直接调用：

from transformers import LlamaForCausalLM
USE_8BIT = True # use 8-bit quantization; otherwise, use fp16
model = LlamaForCausalLM.from_pretrained(
            "pretrained/path",
            load_in_8bit=USE_8BIT,
            torch_dtype=torch.float16,
            device_map="auto",
        )
if not USE_8BIT:
    model.half()  # use fp16
model.eval()

1.2 Alpaca 如何使用小成本训练大模型

如下图所示，Stanford的研究者使用 52K 个 intruction-following examples 来微调 LLaMA 7B 模型，从而生成了 Alpaca[3] 7B。

Alpaca 团队使用 self-instruct[4] 提供的 175 个 prompts，调用 OpenAI 的text-davinci-003模型，利用 OpenAI 的模型来产生有价值的 instructions 。

将 OpenAI 性能完备的模型作为 Teacher，来指导参数更少的 Alpaca 模型进行训练，大幅降低了训练成本。其中调用 OpenAI API 的成本不到 500 美元，另外微调 7B 参数的 LLaMA 模型，使用云服务商提供的 8 块 80GB A100 显卡，训练 3 小时，消费不到 100 美元，因此整体成本是小于 600 美元。

二、Alpaca 的优化、训练及应用

2.1 alpaca-lora 的优化

alpace-lora[5] 是在alpaca的基础上把训练方式改成用lora训练，仅需要在消费级的GPU上经过数小时的训练，就可以达到和alpaca差不多的效果。

LoRA(Low-Rank Adaptation) 技术

LoRA 的思想很简单，即在原始 Pretrained Weights 旁边增加一个旁路，做一个降维再升维的操作，来vwin 所谓的 intrinsic rank 。训练的时候固定 Pretrained Weights 的参数，只训练降维矩阵与升维矩阵。而模型的输入输出维度不变，输出时将与 Pretrained Weights 的参数叠加。用随机高斯分布初始化，用0矩阵初始化，保证训练的开始此旁路矩阵依然是 0 矩阵。

具体来看，假设预训练的矩阵为,它的更新可表示为：

其中秩。

LoRA与Transformer的结合也很简单，仅在QKV attention的计算中增加一个旁路，而不动MLP模块。基于大模型的内在低秩特性，增加旁路矩阵来模拟全模型参数微调，LoRA通过简单有效的方案来达成轻量微调的目的，可以将现在的各种大模型通过轻量微调变成各个不同领域的专业模型。

2.2 PEFT(Parameter-Efficient Fine-Tuning) 方法

随着模型变得越来越大，在消费级硬件上对模型进行全部参数的微调变得不可行。此外，为每个下游任务独立存储和部署微调模型变得非常昂贵，因为微调模型与原始预训练模型的大小相同。PEFT 方法旨在解决这两个问题，PEFT 方法仅微调少量 (额外) 模型参数，同时冻结预训练 LLM 的大部分参数，从而大大降低了计算和存储成本。

HuggingFace 开源的一个高效微调大模型的 PEFT 库，目前包含LoRA，Prefix Tuning，Prompt Tuning，P-Tuning 四种算法，下面简要介绍后三种：

Prefix Tuning
Prefix Tuning 算法是根据下游任务 "前缀指令文本" 的所有层的embeding表示，学习到的前缀指令文本向量可以挖掘大模型的潜力去引导模型完成特定任务。

P-Tuning
P-Tuning 算法和 Prefix Tuning 的想法很相似，想通过微调"指令文本",让指令文本去挖掘大模型的潜力去完成特定的任务。但是 P-Tuning 只学习 "指令文本" 输入层embeding的的表示。为了增强 "指令文本"的连续性，采用了一个 MLP(LSTM) 的结果去encoding "指令文本"。从微调参数量来看只有 0.65% 比 Prefix Tuning 和 LoRA 这些在所有层都增加参数的方法要少。

Prompt Tuning
Prompt Tuning 算法和 P-Tuning 很像，且更简单，就是是根据下游任务 "指令文本" 输入层embeding的的表示。Prompt Tuning 没有增加任何的层，直接使用微调指令文本(prompt) 的embeding向量。

2.3 使用 PEFT 训练 alpaca-lora

以下仅说明过程，完整代码见这里[6]。

step 1. 模块的加载及初始化

import torch
import transformers
from datasets import load_dataset
from peft import LoraConfig, get_peft_model, get_peft_model_state_dict, prepare_model_for_int8_training, set_peft_model_state_dict,
from transformers import LlamaForCausalLM, LlamaTokenizer 

model = LlamaForCausalLM.from_pretrained(base_model, load_in_8bit=True, torch_dtype=torch.float16, device_map=device_map,)
tokenizer = LlamaTokenizer.from_pretrained(base_model)
model = prepare_model_for_int8_training(model)

config = LoraConfig(
    r=lora_r,
    lora_alpha=lora_alpha,
    target_modules=lora_target_modules,
    lora_dropout=lora_dropout,
    bias="none",
    task_type="CAUSAL_LM",
)
model = get_peft_model(model, config)

step 2. 准备data 和 trainer 并进行训练

data = load_dataset(data_path)
trainer = transformers.Trainer(
    model=model,
    train_dataset=train_data,
    eval_dataset=val_data,
    args=transformers.TrainingArguments(
        per_device_train_batch_size=micro_batch_size,
        gradient_accumulation_steps=gradient_accumulation_steps,
        warmup_steps=100,
        num_train_epochs=num_epochs,
        learning_rate=learning_rate,
        fp16=True,
        logging_steps=10,
        optim="adamw_torch",
        evaluation_strategy="steps" if val_set_size > 0 else "no",
        save_strategy="steps",
        eval_steps=200 if val_set_size > 0 else None,
        save_steps=200,
        output_dir=output_dir,
        save_total_limit=3,
        load_best_model_at_end=True if val_set_size > 0 else False,
        ddp_find_unused_parameters=False if ddp else None,
        group_by_length=group_by_length,
        report_to="wandb" if use_wandb else None,
        run_name=wandb_run_name if use_wandb else None,
    ),
    data_collator=transformers.DataCollatorForSeq2Seq(
        tokenizer, pad_to_multiple_of=8, return_tensors="pt", padding=True
    ),
)

trainer.train(resume_from_checkpoint=resume_from_checkpoint)

2.4 更多类似模型

Baize (白泽)

论文：https://arxiv.org/pdf/2304.01196.pdf

demo: Baize Lora 7B - a Hugging Face Space by project-baize

repo: https://github.com/project-baize/baize

Luotuo (骆驼，Chinese)

repo: https://github.com/LC1332/Luotuo-Chinese-LLM

Koala (考拉)

blog: Koala: A Dialogue Model for Academic Research

demo: FastChat

repo: https://github.com/young-geng/EasyLM

三、ColossalChat：深入体验 RLHF 在大模型中的功能

ColossalChat[7] 是第一个基于LLaMA预训练模型开源完整RLHF pipline实现，包括有监督数据收集、有监督微调、奖励模型训练和强化学习微调。只需要不到100亿个参数，就可以在大型语言模型的基础上通过RLHF微调达到中英文双语水平，达到与ChatGPT和GPT-3.5相当的效果，并可以进行Demo测试。关于RLHF的原理，可参考

https://zhuanlan.zhihu.com/p/613315873

ColossalChat使用InstructionWild[8]双语数据集，包含约52K的英语和52K的汉语问答，数据集通过OpenAI API接口获得。该数据集适用于微调和RLHF训练。通过提供高质量的数据，ColossalChat可以实现更好的对话互动，也可以支持中文。

数据集的获取过程

3.1 监督指令微调

使用前面提到的数据集执行有监督指令微调，以微调模型。运行examples/train_sft.sh来启动有监督的指令微调。

torchrun --standalone --nproc_per_node=4 train_sft.py 
    --pretrain "/path/to/LLaMa-7B/" 
    --model 'llama' 
    --strategy colossalai_zero2 
    --log_interval 10 
    --save_path  /path/to/Coati-7B 
    --dataset /path/to/data.json 
    --batch_size 4 
    --accimulation_steps 8 
    --lr 2e-5 
    --max_datasets_size 512 
    --max_epochs 1

3.2 训练奖励模型

训练奖励模型，通过手动对同一提示的不同输出进行排序来分配相应的分数，然后有监督奖励模型的训练。

运行examples/train_rm.sh开始奖励模型训练。

torchrun --standalone --nproc_per_node=4 train_reward_model.py
    --pretrain "/path/to/LLaMa-7B/" 
    --model 'llama' 
    --strategy colossalai_zero2 
    --loss_fn 'log_exp'
    --save_path 'rmstatic.pt'

3.3 人类反馈强化学习

在第一阶段的监督微调模型和第二阶段的奖励模型的基础上，使用强化学习算法进一步训练大型语言模型。该阶段是RLHF训练的核心部分，在强化学习中使用近端策略优化（PPO）算法来引入奖励信号，并生成更符合人类偏好的内容。

运行examples/train_prompts.sh，开始使用人类反馈训练PPO。

torchrun --standalone --nproc_per_node=4 train_prompts.py

         --pretrain "/path/to/LLaMa-7B/" 
         --model 'llama' 
         --strategy colossalai_zero2 
         --prompt_path /path/to/your/prompt_dataset 
         --pretrain_dataset /path/to/your/pretrain_dataset 
         --rm_pretrain /your/pretrain/rm/defination 
         --rm_path /your/rm/model/path

编辑：黄飞

阅读全文

AI(263628) AI(263628)
LoRa(230001) LoRa(230001)
ChatGPT(3870) ChatGPT(3870)

从接口定义和实现两个方面，深入理解AWbus-lite

在使用AWBus-lite对设备进行管理时，无论设备处于 AWBus-lite拓扑结构中的哪个位置，只要其能够提供某种标准服务，就可以使用相应的通用接口对其进行操作。本文将从接口的定义和实现两个方面，深入理解AWbus-lite工作的原理。

2018-07-23 09:08:31

8015

深入理解运放的工作原理（空气净化器系统案例）

重点讲解了运放的内部电路结构，帮助深入理解运放的工作原理。运放是设计使用非常频繁且非常重要器件，通常在信号放大，电流采样电路里常见，对于初学者经常感到困惑，所以掌握好能够帮助你很好的分析电路。

2019-04-19 09:10:58

5920

深入理解运放的工作原理内部电路结构

重点讲解了运放的内部电路结构，帮助深入理解运放的工作原理。运放是设计使用非常频繁且非常重要器件，通常在信号放大，电流采样电路里常见。

2019-04-22 16:02:10

16703

深入理解FPGA Verilog HDL语法(二)

今天给大侠带来的是一周掌握FPGA Verilog HDL 语法，今天开启第二天。上一篇提到了整数型以及参数型，此篇我们继续来看变量以及后续其他内容，结合实例理解理论语法，会让你理解运用的更加透彻。下面咱们废话就不多说了，一起来看看吧。

2022-07-18 09:52:36

1262

51单片机C语言讲义（谭浩强）以及深入理解C指针

本帖最后由发烧友之麒麟于 2014-10-6 09:19 编辑 C语言讲义（谭浩强）及深入理解C指针，自己在用的资料，觉得写得挺好的就拿出来分享，需要的请回[attach]214757[/attac]

2014-10-02 17:05:11

优化神经网络训练方法有哪些？

2022-09-06 09:52:36

深入理解Android

深入理解Android

2012-08-20 15:30:08

深入理解Android：WiFi模块 NFC和GPS卷

本帖最后由 lee_st 于 2018-2-26 00:21 编辑 深入理解Android：WiFi模块 NFC和GPS卷

2018-02-25 22:26:16

深入理解C指针(带书签完整版)

本帖最后由 lee_st 于 2018-2-25 22:24 编辑 深入理解C指针(带书签完整版)

2018-02-25 22:23:30

深入理解C语言比较有用的几个资料

这里有三个对深入理解C语言的资料，觉得不错，分享一下

2014-08-07 21:37:55

深入理解Linux内核中文版+英文原版

深入理解Linux内核中文版+英文原版经典之作

2016-05-17 08:18:47

深入理解SD卡原理和其内部结构总结

深入理解SD卡原理和其内部结构总结

2012-08-18 11:11:00

深入理解SQLite3之sqlite3_exec及回调函数sqlite3

深入理解SQLite3之sqlite3_exec及回调函数sqlite3：深入理解sqlite3_stmt 机制sqlite3: sqlite3_step 函数sqlite3

2021-11-04 07:11:56

深入理解STM32

时钟系统是处理器的核心，所以在学习STM32所有外设之前，认真学习时钟系统是必要的,有助于深入理解STM32。下面是从网上找的一个STM32时钟框图，比《STM32中文参考手册》里面的是中途看起来清晰一些：重要的时钟：PLLCLK,SYSCLK,HCKL,PCLK1,...

2021-08-12 07:46:20

深入理解flutter的编译原理与优化

将以一个简单的hello_flutter为例，介绍下Flutter相关原理及定制与优化。Flutter简介Flutter的架构主要分成三层:Framework，Engine和Embedder

2018-07-02 17:47:53

深入理解lte-a

深入理解LTE-A

2019-02-26 10:21:51

深入理解光耦模拟隔离放大电路的技术奥秘

深入理解光耦模拟隔离放大电路的技术奥秘编辑 ▲ 图1 仿真原理图二、原理分析之所以这个电路图看起来容易让人感到困惑，实际上就是这个仿真电路中，错误的使用了这样的光电三极管来表示HCNR201

2024-01-10 10:12:39

深入理解和实现RTOS_连载

和trcohili的帖子。深入理解和实现RTOS_连载1_RTOS的前生今世今天发布的是第一篇，"RTOS的前生今世"。通过软件系统结构的比对简要的介绍rtos为何而生。如果读者对RTOS

2014-05-29 11:20:54

深入理解和实现RTOS_连载

和trcohili的帖子。trochili rtos完全是作者兴趣所在，且行且坚持，比没有duo。深入理解和实现RTOS_连载1_RTOS的前生今世今天发布的是第一篇，"RTOS的前生今世"

2014-05-30 01:02:26

深入理解指针函数

1.指针函数的定义顾名思义，指针函数即返回指针的函数。其一般定义形式如下：类型名 *函数名(函数参数表列); 其中，后缀运算符括号“()”表示这是一个函数，其前缀运算符星号“*”表示此函数为指针型函数，其函数值为指针，即它带回来的值的类型为指针，当调用这个函数后，将得到一个“指向返回值为…的指针（地址），“类型名”表示函数返回的指针指向的类型”。 “(函数参数表列)”中的括号为函数调用运算符，在调用语句中，即使函数不带参数，其参数表的一对括号也不能省略。其示例如下： int *pfun(int, int); 由于“*”的优先级低于“()”的优先级，因而pfun首先和后面的“()”结合，也就意味着，pfun是一个函数。即： int *(pfun(int, int)); 接着再和前面的“*”结合，说明这个函数的返回值是一个指针。由于前面还有一个int，也就是说，pfun是一个返回值为整型指针的函数。我们不妨来再看一看，指针函数与函数指针有什么区别？ int (*pfun)(int, int); 通过括号强行将pfun首先与“*”结合，也就意味着，pfun是一个指针，接着与后面的“()”结合，说明该指针指向的是一个函数，然后再与前面的int结合，也就是说，该函数的返回值是int。由此可见，pfun是一个指向返回值为int的函数的指针。虽然它们只有一个括号的差别，但是表示的意义却截然不同。函数指针的本身是一个指针，指针指向的是一个函数。指针函数的本身是一个函数，其函数的返回值是一个指针。2. 用函数指针作为函数的返回值在上面提到的指针函数里面，有这样一类函数，它们也返回指针型数据（地址），但是这个指针不是指向int、char之类的基本类型，而是指向函数。对于初学者，别说写出这样的函数声明，就是看到这样的写法也是一头雾水。比如,下面的语句： int (*ff(int))(int *, int);我们用上面介绍的方法分析一下，ff首先与后面的“()”结合，即： int (*(ff(int)))(int *, int); // 用括号将ff(int)再括起来也就意味着，ff是一个函数。接着与前面的“*”结合，说明ff函数的返回值是一个指针。然后再与后面的“()”结合，也就是说，该指针指向的是一个函数。这种写法确实让人非常难懂，以至于一些初学者产生误解，认为写出别人看不懂的代码才能显示自己水平高。而事实上恰好相反，能否写出通俗易懂的代码是衡量程序员是否优秀的标准。一般来说，用typedef关键字会使该声明更简单易懂。在前面我们已经见过： int (*PF)(int *, int);也就是说，PF是一个函数指针“变量”。当使用typedef声明后，则PF就成为了一个函数指针“类型”，即： typedef int (*PF)(int *, int);这样就定义了返回值的类型。然后，再用PF作为返回值来声明函数: PF ff(int);下面将以程序清单1为例，说明用函数指针作为函数的返回值的用法。当程序接收用户输入时，如果用户输入d，则求数组的最大值，如果输入x，则求数组的最小值，如果输入p，则求数组的平均值。程序清单 1求最值与平均值示例1 #include2 #include 3 double GetMin(double *dbData, int iSize)// 求最小值4 {5double dbMin;6int i;78assert(iSize>0);9dbMin=dbData[0];10 for (i=1; idbData) {12dbMin=dbData;13 }14 }15 return dbMin;16}1718double GetMax(double *dbData, int iSize)// 求最大值19{20double dbMax;21int i;2223assert(iSize>0);24dbMax=dbData[0];25for (i=1; i0);39for (i=0; i

2019-01-23 06:35:17

深入理解无线充电原理

的无线收发、同时尽量减小对外的辐射量，需要进行正确地设计。因此需要进一步理解和确定正确的电极尺寸、它们的设计、工作电压、功率值、最佳工作频率和总的尺寸约束条件。一般情况下，理想的频率范围在200kHz至

2012-12-09 22:51:43

深入理解计算机系统之虚拟存储器讲解

深入理解计算机系统第9章虚拟存储器

2019-06-25 09:49:40

深入理解计算机网络硬件知识

前言《图解网络硬件》本书作者三轮贤一是硅谷网络设备公司日本分部资深系统工程师，重点讲述了在实际网络建设工程中真实使用的网络硬件设备及其相关背景知识，能够帮助读者深入理解计算机网络在工程实践中某些容易

2021-07-27 06:40:35

FPGA的时序优化高级研修班

FPGA的时序优化高级研修班通知通过设立四大专题，帮助工程师更加深入理解FPGA时序，并掌握时序约束和优化的方法。1.FPGA静态时序分析2.FPGA异步电路处理方法3.FPGA时序约束方法4.FPGA时序优化方法

2013-03-27 15:20:27

TCP/UDP通信原理看完你就懂了

深入理解TCP/UDP通信原理

2021-03-30 06:14:42

TIM，systick，GPIO，USART，NVIC深入理解

本文是我在知乎上的一篇回答，有兴趣的朋友可以参考下面的链接，不过两篇文章是一样的。本文适用于初学者。硬件功能方面，十分建议学习好TIM，systick，GPIO，USART，NVIC这几个东西，最好能深入理解，因为这几个东西常常是出现在很多个项目当中的，非常重要的东西。一，环境的...

2021-08-23 08:28:27

《深入理解FFmpeg阅读体验》+ 书收到了，崭新的开篇

今天收到了《深入理解FFmpeg》崭新的书，一个在2022年较近距离接触过却尚未深入研究的领域图像处理。最近刚好在作这方面的研究，希望自己可以把握这次机会，好好学习下 FFMpeg，相信可以让自己

2024-01-07 18:57:06

《深入理解LINUX内存管理》学习笔记

《深入理解LINUX内存管理》学习笔记1

2016-11-07 10:20:16

《深入理解Linux网络技术内幕》(EN)

《深入理解Linux网络技术内幕》(EN)

2018-02-06 15:17:30

《深入理解微电子电路设计——数字电子技术及其应用》+做芯片的不做芯片的都来看一看！

也陆陆续续看了一些资料，但是在多方权衡之后还是放弃了这种幼稚的想法，还是老老实实做好自己的应用开发，虽然薪资和芯片设计本身相差不少。扯远了，回到书本本身，一起来领略一下《深入理解微电子

2023-05-29 22:24:28

《深入理解微电子电路设计——数字电子技术及应用》+深究数字芯片的内核与要点

吧，与感兴趣的同仁一起来领略一下《深入理解微电子电路设计》吧！《深入理解微电子电路设计》是2020年清华大学出版社出版的图书，由宋延强翻译。原书作者是[美] 理查德 · C.耶格（Richard

2023-07-29 11:59:12

【书籍评测活动NO.25】深入理解FFmpeg，带你FFmpeg从入门到精通

，涵盖音视频基础知识、FFmpeg参数解析、API使用、内部组件的开发定制行业大咖审校，多名业界专家与学者作序推荐详细解读实际应用与开发案例，帮助读者深入理解FFmpeg 大咖推荐我

2023-11-15 14:26:01

【牛逼资料分享】深入理解MOSFET规格书datasheet

【非常牛逼资料分享】深入理解MOSFET规格书datasheet需要原版稳定的朋友，请自行回帖下载。 [hide]https://pan.baidu.com/s/1o85LQWE[/hide] 文章比较长，截了一部分资料的图片如下

2017-10-24 16:45:30

【直播回顾】战码先锋第五期：深入理解OpenHarmony系统启动，轻松踏上设备软件开发之旅

6月14日晚上19点，战"码"先锋第五期直播《深入理解OpenHarmony系统启动，轻松踏上设备软件开发之旅》，在OpenHarmony社群内成功举行。本期课程，由华为

2022-06-15 14:35:25

为什么要深入理解栈

[导读] 从这篇文章开始，将会不定期更新关于嵌入式C语言编程相关的个人认为比较重要的知识点，或者踩过的坑。为什么要深入理解栈？做C语言开发如果栈设置不合理或者使用不对，栈就会溢出，溢出就会遇到无法

2022-02-15 06:09:14

分享高性能Android应用开发超清版PDF

;amp;ckook《深入理解Android：Wi-Fi、nfc和gps卷》Android Studio实战快速高效地构建Android应用Android编程权威指南Android第一行代码

2018-08-13 10:40:22

在深入学习运放之前有没有必要搞精通其内部结构呢

本帖最后由 gk320830 于 2015-3-5 23:05 编辑学习运放有几天了，总觉得问题很多，是不是由于三极管没有深入理解或者运放的内部结构不够理解呢？

2011-04-15 15:06:08

如何深入理解ES6之函数

深入理解ES6之函数

2020-05-22 07:40:56

如何深入理解和运用二极管钳位作用？

二极管钳位作用如何运用？在电路设计过程中很多位置需要用二极管钳位，如何深入理解和运用？

2019-04-03 03:03:34

如何更加深入理解MOSFET开关损耗？

如何更加深入理解MOSFET开关损耗？Coss产生开关损耗与对开关过程有什么影响？

2021-04-07 06:01:07

如何跳过SPL中的ddr训练？

我正在优化启动速度，ddr 训练在 SPL 中需要 360ms，所以我想跳过它。我厌倦了在 ddr 训练后注意 ddrphy_trained_csr[] 和 g_cdd_max[]，注释掉 ddr

2023-06-01 08:16:47

对arm按键中断的深入理解

对arm按键中断还是不太了解深入寄存器去看看使用key_init()就能得到按键按下的值,所以中断函数在key)_init里key_init()分析初始化io口对应的按键使能io口使能RCC寄存器里

2021-08-16 07:05:25

对栈的深入理解

为什么要深入理解栈？做C语言开发如果栈设置不合理或者使用不对，栈就会溢出，溢出就会遇到无法预测乱飞现象。所以对栈的深入理解是非常重要的。注：动画如果看不清楚可以电脑看更清晰啥是栈先来看一段动画：没有

2022-02-15 07:01:00

机器学习基础|深入理解拉格朗日乘子法

拉格朗日乘子法无疑是最优化理论中最重要的一个方法。但是现在网上并没有很好的完整介绍整个方法的文章。所以小编整理了如下文章，希望能博得大家一赞。在求取有约束条件的优化问题时，拉格朗日乘子法

2017-12-13 20:25:12

深入理解计算机系统 (PDF版下载)

深入理解计算机系统本书适用于那些想要写出更快、更可靠程序的程序员。通过掌握程序是如何映射到系统上，以及程序是如何执行的，读者能够更好的理解程序的行为为什么是

2009-10-09 16:43:26

深入理解应用广泛的QMatrix 技术

深入理解应用广泛的QMatrix 技术作者：Hal Philipp 量研集团首席技术官摘要在家电、消费电子和手机应用中，触摸传感控制正在日益取代机电开关。触摸传感的流行获有很强的

2010-02-06 17:08:31

深入理解功率MOSFET数据表

本文不准备写成一篇介绍功率MOSFET的技术大全,只是让读者去了解如何正确的理解功率MOSFET数据表中的常用主要参数,以

2010-12-06 10:52:45

1156

一种DDS的优化设计

，本文将在对DDS的基本原理进行深入理解的基础上，采用多级流水线控制技术对DDS的VHDL语言实现进行优化，把该设计适配到Xilinx公司的最新90nm工艺的Spartan3E系列的FPGA中。

2011-08-22 13:50:58

2129

深入理解SD卡

SD 卡（Secure Digital Memory Card）是一种为满足安全性、容量、性能和使用环境等各方面的需求而设计的一种新型存储器件，SD 卡允许在两种模式下工作，即SD 模式和SPI 模式，本系统采用S

2012-02-27 15:57:46

291

深入理解Linux虚拟内存管理_爱尔兰/戈尔曼著

德赢Vwin官网网站提供《深入理解Linux虚拟内存管理_爱尔兰/戈尔曼著.txt》资料免费下载

2015-02-09 15:19:27

深入理解LINUX内核（中文版）_ 陈莉君/冯锐/牛欣源译

德赢Vwin官网网站提供《深入理解LINUX内核（中文版）_ 陈莉君/冯锐/牛欣源译.txt》资料免费下载

2015-02-11 11:16:33

深入理解三极管

深入理解三极管的相应资料，有需要的可以下载，不喜勿喷

2016-01-14 16:19:11

深入理解OpenCV

这是机器视觉的应用，使用openCV处理图像

2016-03-23 14:54:52

深入理解Android之资源文件

深入理解Android之资源文件

2017-01-22 21:11:02

《深入理解Android》文前

《深入理解Android》文前

2017-03-19 11:23:20

《深入理解Android：卷I》

《深入理解Android：卷I》

2017-03-19 11:23:45

深入理解Android网络编程

深入理解Android网络编程

2017-03-19 11:26:35

开关电源技术saber深入理解和巩固验证基本理论知识指导书

2017-09-15 16:19:30

深入理解WebView

摘要作为Android开发者，我们都知道在手机中内置了一款高性能 webkit 内核浏览器，在 SDK 中封装为一个叫做 WebView 组件。今天就为大家讲讲Android中WebView的详细使用方法。作为Android开发者，我们都知道在手机中内置了一款高性能 webkit 内核浏览器，在 SDK 中封装为一个叫做 WebView 组件。在开发过程中应该注意几点： 1.这是最基本的 AndroidManifest.xml 中必须添加访问网络权限。 2.如果访问的页面中有 Java，则 WebView 必须设置支持 Java。 WebView.getSettings（）.set

2017-10-11 10:16:48

深入理解Linux内核(第三版)中文版

深入理解Linux内核(第三版)中文版

2017-11-28 11:54:15

深入理解Java虚拟机-判断对象存活状态

深入理解Java虚拟机之判断对象是否存活我们知道Java虚拟机中对象的存储位置在堆上，所以GC回收主要也就是在堆上进行的，那么垃圾收集器在进行对象回收的时候肯定不能随便收集，必须要判断对象的状态

2017-11-29 01:06:51

957

深入理解计算机系统(中文版)pdf下载

深入理解计算机系统(中文版)

2018-01-10 16:11:03

关于堆栈的深入理解

这里提了三个概念：堆，栈，以及堆栈。我把栈和堆栈的概念等同了。所以，接下来只要把两个概念弄清楚就可以了：堆和栈。先说由来。由于我的工作大部分是和单片机相关的，因此也是基于嵌入式的这个方面的理解。

2018-03-04 15:57:52

3810

深入理解C指针（C/C++程序员进阶必备，透彻理解指针与内存管理）pdf

深入理解C指针

2018-03-21 09:42:45

116

Softmax如何把CNN的输出转变成概率？交叉熵如何为优化过程提供度量？

这篇小文将告诉你：Softmax是如何把CNN的输出转变成概率，以及交叉熵是如何为优化过程提供度量，为了让读者能够深入理解，我们将会用python一一实现他们。

2018-07-29 11:21:38

20401

专家研讨会：理解高精度Sigma-Delta模拟数字转换器

专家面对面大连站_深入理解高精度sigma-delta型ADC

2019-08-12 03:04:00

2001

带你深入理解51单片机C编程的C51

深入理解并应用C51对标准ANSIC的扩展是学习C51的关键之一。因为大多数扩展功能都是直接针对8051系列CPU硬件的。大致有以下8类：

2019-06-26 17:43:00

完整机器的学习项目的工作流程是什么样的

理解实际业务场景问题是机器学习的第一步，机器学习中特征工程和模型训练都是非常费时的，深入理解要处理的问题，能避免走很多弯路。

2019-07-08 10:19:51

1130

米尔科技深入理解LINUX内核简介

为了透彻理解Linux的工作机理，以及为何它在各种系统上能顺畅运行，你需要深入到内核的心脏。

2019-11-25 09:34:06

1520

深入理解网络编程框架详细关系图合集免费下载

本文档的主要内容详细介绍的是深入理解网络编程框架详细关系原理图合集免费下载。

2019-11-29 15:31:22

深入浅出的理解阻抗匹配

深入浅出理解阻抗匹配

2020-02-03 15:14:39

3645

老司机带你深入理解ST库中的 assert_param 语句

老司机带你深入理解ST库中的assert_param语句

2020-03-14 14:52:50

3374

如何更加深入理解I2C总线、协议及应用

更加深入理解I2C总线、协议及应用

2020-03-20 09:29:21

2999

小米在预训练模型的探索与优化

大家带来小米在预训练模型的探索与优化。 01 预训练简介预训练与词向量的方法一脉相承。词向量是从任务无关和大量的无监督语料中学习到词的分布式表达，即文档中词的向量化表达。在得到词向量之后，一般会输入到下游任务中，进行后续的计

2020-12-31 10:17:11

2217

sparc体系架构的窗口寄存器的深入理解

sparc体系架构的窗口寄存器的深入理解 1.概述 2.窗口寄存器的特性 3.程序的设计 4.sparc设计对于嵌入式编程的优劣 1.概述 sparc这种架构有着特殊的窗口寄存器，使用sparc芯片

2021-01-07 10:39:59

3200

深入理解MOS管电子版资源下载

深入理解MOS管电子版资源下载

2021-07-09 09:43:01

华为开发者大会2021：深入理解用户意图

　如何深入理解用户意图，实现服务精准分发。

2021-10-22 15:41:08

1574

深入理解计算机系统教材

深入理解计算机系统中文版pdf下载

2021-11-11 18:11:26

pycharm 递归栈溢出_STM32编程：是时候深入理解栈了<一>

2021-12-16 16:58:12

pycharm 递归栈溢出_STM32编程：是时候深入理解栈了<一>

2021-12-16 16:58:22

【RTOS的最通俗理解】行业大佬用一篇文章带你快速理解RTOS

电子产品2.2 要深入理解RTOS就必须深入理解CPU架构3. 课程重点系统课程学习 5分钟拿下你的三连，RTOS的最通俗理解！单片机_RTOS_架构1. RTOS的概念1.1 用人来类

2021-12-20 19:08:52

深入理解LED开发过程

不知道你是否想过，一个LED灯点亮过程的本质是什么。当你是一个小白的时候，点亮一个LED灯，IDE都会帮你做好所有的事情，你只需要点击一下编译即可。但是，当你成长到一定程度时，就需要好好想想，一个LED的点亮，其实是对单片机中背后原理机制真正的深入理解。今天我就带你，来深入理解一个LDE点亮的过程。

2021-12-22 19:08:21

STM32编程：是时候深入理解栈了<一>

为什么要深入理解栈？做C语言开发如果栈设置不合理或者使用不对，栈就会溢出，溢出就会遇到无法预测乱飞现象。所以对栈的深入理解是非常...

2022-01-26 17:55:42

深入理解深度学习中的反(转置)卷积

本文首发于 GiantPandaCV ：深入理解神经网络中的反(转置)卷积作者：梁德澎本文主要是把之前在知乎上的回答：反卷积和上采样+卷积的区别...

2022-02-07 11:17:57

一文深入理解操作系统的进程调度

想深入理解操作系统的进程调度，需要先获得一些准备知识，这样后面就不懵圈啦：

2022-03-16 10:58:03

1952

一文深入理解抖频开电源技术

刚接触芯片中集成了这种功能的时候，一时之间到不算太理解这项技术的意义，然后找了一些资料，然后找到两个分析电路进行大致介绍。

2022-03-16 12:45:38

8482

一文深入理解IIC通信基础知识

玩单片机的朋友都知道IIC通信这个工具，但好多人只是会用，内部的原理不求甚解，或是想要了解其原理，但却对抽象的时序描述一头雾水。本文将从实测的IIC波形入手，带你看到真实的IIC样子，进而去理解IIC的通信原理。

2022-06-08 09:06:02

19741

如何通过仿真器理解Verilog语言的思路

要想深入理解Verilog就必须正视Verilog语言同时具备硬件特性和软件特性。

2022-07-07 09:54:48

1124

如何从汇编代码来理解enum

Rust enum 是一个非常强大的特性, 很多人好奇他内部是如何实现的, 这里作者从生成的汇编代码来帮你深入理解 Rust 的 enum. 一些关键结论:

2022-11-15 11:13:55

345

成长计划知识赋能 | 第九期：渐进式深入理解OpenHarmony系统

系统架构和驱动框架，助力开发者快速上手OpenHarmony系统开发。详情见海报内容，资深软件开发工程师梁开祝老师带你一起学习进步。原文标题：成长计划知识赋能 | 第九期：渐进式深入理解

2023-03-25 04:25:02

253

深入浅出解析JVM中的Safepoint

最早接触JVM中的安全点概念是在读《深入理解Java虚拟机》那本书垃圾回收器章节的内容时。相信大部分人也一样，都是通过这样的方式第一次对安全点有了初步认识。

2023-06-01 09:25:55

359

在线研讨会 | 就在明天！NVIDIA TAO Toolkit 5.0 助力 OCR 视觉 AI 模型快速训练与优化

技术的应用广泛，但构建和优化 OCR 的 AI 模型并非易事。它需要深厚的计算机科学知识，精细的编程技巧，以及对 AI 模型优化的深入理解。 NVIDIA TAO 是一款强大的 AI 模型训练和优化工具，它旨在帮助开发者快速搭建和训练 AI 模型，无需复杂的编程和算

2023-08-21 21:05:05

267

深入理解redis分布式锁

深入理解redis分布式锁哈喽，大家好，我是指北君。本篇文件我们来介绍如何Redis实现分布式锁的演进过程，以及为什么不能直接用Setnx实现分布式锁。 1、分布式锁简介分布式锁是控制分布式

2023-10-08 14:13:27

492

深入理解TCP

当客户端想和服务端建立 TCP 连接的时候，首先第一个发的就是 SYN 报文，然后进入到 SYN_SENT 状态。在这之后，如果客户端迟迟收不到服务端的 SYN-ACK 报文（第二次握手），就会触发超时重传机制。不同版本的操作系统可能超时时间不同，有的 1 秒的，也有 3 秒的，这个超时时间是写死在内核里的，如果想要更改则需要重新编译内核，比较麻烦。当客户端在 1 秒后没收到服务端的 SYN-ACK 报文后，客户端就会重发 SYN 报文，那到底重发几次呢？在 Linux 里

2023-11-08 16:37:41

190