trainer.po 3.64 KB
Newer Older
yuguo-Jack's avatar
yuguo-Jack committed
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
# SOME DESCRIPTIVE TITLE.
# Copyright (C) 2021, PaddleNLP
# This file is distributed under the same license as the PaddleNLP package.
# FIRST AUTHOR <EMAIL@ADDRESS>, 2022.
#
#, fuzzy
msgid ""
msgstr ""
"Project-Id-Version: PaddleNLP \n"
"Report-Msgid-Bugs-To: \n"
"POT-Creation-Date: 2022-05-19 14:17+0800\n"
"PO-Revision-Date: YEAR-MO-DA HO:MI+ZONE\n"
"Last-Translator: FULL NAME <EMAIL@ADDRESS>\n"
"Language-Team: LANGUAGE <LL@li.org>\n"
"MIME-Version: 1.0\n"
"Content-Type: text/plain; charset=utf-8\n"
"Content-Transfer-Encoding: 8bit\n"
"Generated-By: Babel 2.10.1\n"

#: ../trainer.md:1
msgid "PaddleNLP Trainer API"
msgstr ""

#: ../trainer.md:3
msgid "PaddleNLP提供了Trainer训练API,针对训练过程的通用训练配置做了封装,比如:"
msgstr ""

#: ../trainer.md:5
msgid "优化器、学习率调度等训练配置"
msgstr ""

#: ../trainer.md:6
msgid "多卡,混合精度,梯度累积等功能"
msgstr ""

#: ../trainer.md:7
msgid "checkpoint断点,断点重启(数据集,随机数恢复)"
msgstr ""

#: ../trainer.md:8
msgid "日志显示,loss可视化展示等"
msgstr ""

#: ../trainer.md:10
msgid "用户输入模型,数据集,就可以使用Trainer API高效快速的实现预训练、微调等任务。"
msgstr ""

#: ../trainer.md:13
msgid "Trainer基本使用方法介绍"
msgstr ""

#: ../trainer.md:15
msgid ""
"下面是用户使用 Trainer API进行finetune任务的简单示例,这里以中文情感分类数据集chnsenticorp为例。 "
"更详细的使用可以参考CLUE Trainer版本。"
msgstr ""

#: ../trainer.md:18
msgid "导入需要用到的头文件。"
msgstr ""

#: ../trainer.md:19
msgid "主要是模型、Tokenizer"
msgstr ""

#: ../trainer.md:20
msgid "还有Trainer组件"
msgstr ""

#: ../trainer.md:21
msgid "其中Trainer是训练主要入口,用户传入模型,数据集,即可进行训练"
msgstr ""

#: ../trainer.md:22
msgid "TrainingArguments 包含了用户需要的大部分训练参数。"
msgstr ""

#: ../trainer.md:23
msgid "PdArgumentParser 是用户输出参数的工具"
msgstr ""

#: ../trainer.md:31
msgid "设置好用户参数"
msgstr ""

#: ../trainer.md:32
msgid ""
"PdArgumentParser 可以接受多个类似TrainingArguments的参数。用户可以自定义所需要的ModelArguments, "
"DataArguments为 tuple 传入 PdArgumentParser即可。"
msgstr ""

#: ../trainer.md:33
msgid ""
"这些参数都是通过python xxx.py --dataset xx --max_seq_length "
"xx的方式传入。TrainingArguments的所有可配置参数见后文。"
msgstr ""

#: ../trainer.md:50
msgid "加载模型,tokenizer, 数据集"
msgstr ""

#: ../trainer.md:51
msgid "注意,这里的数据集,需要输出的是一个dict。dict中的key,需要和模型的输入名称对应。"
msgstr ""

#: ../trainer.md:52
msgid "这里的,labels如果模型没有使用到,我们还需要额外定义criterion,计算最后的loss损失。"
msgstr ""

#: ../trainer.md:66
msgid "构造Trainer实例,进行模型训练。"
msgstr ""

#: ../trainer.md:67
msgid "这里传入model,criterion,args,train_dataset,tokenizer这些训练需要的组件,构建了实例化的trainer"
msgstr ""

#: ../trainer.md:68
msgid "使用trainer.train()接口开始训练过程。训练完成后,可以保存模型,保存一些日志。"
msgstr ""

#: ../trainer.md:84
msgid "预训练的使用方式可以参考ERNIE-1.0 Trainer版本。"
msgstr ""

#: ../trainer.md:87
msgid "Trainer 实例化参数介绍"
msgstr ""

#: ../trainer.md:88
msgid "Trainer 是一个简单,但功能完整的 Paddle训练和评估模块,并针对 PaddleNLP 模型进行了优化。"
msgstr ""

#: ../trainer.md:172
msgid "TrainingArguments 参数介绍"
msgstr ""