FAQ.po 21.8 KB
Newer Older
yuguo-Jack's avatar
yuguo-Jack committed
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
# SOME DESCRIPTIVE TITLE.
# Copyright (C) 2021, PaddleNLP
# This file is distributed under the same license as the PaddleNLP package.
# FIRST AUTHOR <EMAIL@ADDRESS>, 2022.
#
#, fuzzy
msgid ""
msgstr ""
"Project-Id-Version: PaddleNLP \n"
"Report-Msgid-Bugs-To: \n"
"POT-Creation-Date: 2022-03-18 21:31+0800\n"
"PO-Revision-Date: YEAR-MO-DA HO:MI+ZONE\n"
"Last-Translator: FULL NAME <EMAIL@ADDRESS>\n"
"Language-Team: LANGUAGE <LL@li.org>\n"
"MIME-Version: 1.0\n"
"Content-Type: text/plain; charset=utf-8\n"
"Content-Transfer-Encoding: 8bit\n"
"Generated-By: Babel 2.9.0\n"

#: ../FAQ.md:1
msgid "PaddleNLP常见问题汇总(持续更新)"
msgstr ""

#: ../FAQ.md:3
msgid "【精选】NLP精选5问"
msgstr ""

#: ../FAQ.md:5 ../FAQ.md:59
msgid "Q1.1 如何加载自己的本地数据集,以便使用PaddleNLP的功能?"
msgstr ""

#: ../FAQ.md:6 ../FAQ.md:88
msgid "Q1.2 PaddleNLP会将内置的数据集、模型下载到默认路径,如何修改路径?"
msgstr ""

#: ../FAQ.md:7 ../FAQ.md:98
msgid "Q1.3 PaddleNLP中如何保存、加载训练好的模型?"
msgstr ""

#: ../FAQ.md:8 ../FAQ.md:134
msgid "Q1.4 当训练样本较少时,有什么推荐的方法能提升模型效果吗?"
msgstr ""

#: ../FAQ.md:9 ../FAQ.md:140
msgid "Q1.5 如何提升模型的性能,提升QPS?"
msgstr ""

#: ../FAQ.md:11
msgid "【理论篇】NLP通用问题"
msgstr ""

#: ../FAQ.md:13 ../FAQ.md:152
msgid "Q2.1 数据类别分布不均衡, 有哪些应对方法?"
msgstr ""

#: ../FAQ.md:14 ../FAQ.md:166
msgid "Q2.2 如果使用预训练模型,一般需要多少条样本?"
msgstr ""

#: ../FAQ.md:16
msgid "【实战篇】PaddleNLP实战问题"
msgstr ""

#: ../FAQ.md:18 ../FAQ.md:177
msgid "数据集和数据处理"
msgstr ""

#: ../FAQ.md:20 ../FAQ.md:181
msgid "Q3.1 使用自己的数据集训练预训练模型时,如何引入额外的词表?"
msgstr ""

#: ../FAQ.md:22 ../FAQ.md:192
msgid "模型训练调优"
msgstr ""

#: ../FAQ.md:24 ../FAQ.md:196
msgid "Q3.2 如何加载自己的预训练模型,进而使用PaddleNLP的功能?"
msgstr ""

#: ../FAQ.md:25 ../FAQ.md:230
msgid "Q3.3 如果训练中断,需要继续热启动训练,如何保证学习率和优化器能从中断地方继续迭代?"
msgstr ""

#: ../FAQ.md:26 ../FAQ.md:252
msgid "Q3.4 如何冻结模型梯度?"
msgstr ""

#: ../FAQ.md:27 ../FAQ.md:313
msgid "Q3.5 如何在eval阶段打印评价指标,在各epoch保存模型参数?"
msgstr ""

#: ../FAQ.md:28 ../FAQ.md:331
msgid "Q3.6 训练过程中,训练程序意外退出或Hang住,应该如何排查?"
msgstr ""

#: ../FAQ.md:30 ../FAQ.md:339
msgid "Q3.7 在模型验证和测试过程中,如何保证每一次的结果是相同的?"
msgstr ""

#: ../FAQ.md:31 ../FAQ.md:351
msgid "Q3.8 ERNIE模型如何返回中间层的输出?"
msgstr ""

#: ../FAQ.md:33 ../FAQ.md:358
msgid "预测部署"
msgstr ""

#: ../FAQ.md:35 ../FAQ.md:362
msgid "Q3.9 PaddleNLP训练好的模型如何部署到服务器 ?"
msgstr ""

#: ../FAQ.md:36 ../FAQ.md:380
msgid "Q3.10 静态图模型如何转换成动态图模型?"
msgstr ""

#: ../FAQ.md:38
msgid "特定模型和应用场景咨询"
msgstr ""

#: ../FAQ.md:39 ../FAQ.md:390
msgid "Q4.1 【词法分析】LAC模型,如何自定义标签label,并继续训练?"
msgstr ""

#: ../FAQ.md:40 ../FAQ.md:398
msgid "Q4.2 信息抽取任务中,是否推荐使用预训练模型+CRF,怎么实现呢?"
msgstr ""

#: ../FAQ.md:41
msgid ""
"Q4.3 "
"【阅读理解】MapDatasets的map()方法中对应的batched=True怎么理解,在阅读理解任务中为什么必须把参数batched设置为True?"
msgstr ""

#: ../FAQ.md:42 ../FAQ.md:410
msgid "Q4.4 【语义匹配】语义索引和语义匹配有什么区别?"
msgstr ""

#: ../FAQ.md:43 ../FAQ.md:416
msgid "Q4.5 【解语】wordtag模型如何自定义添加命名实体及对应词类?"
msgstr ""

#: ../FAQ.md:45
msgid "其他使用咨询"
msgstr ""

#: ../FAQ.md:46 ../FAQ.md:433
msgid "Q5.1 在CUDA11使用PaddlNLP报错?"
msgstr ""

#: ../FAQ.md:47 ../FAQ.md:439
msgid "Q5.2 如何设置parameter?"
msgstr ""

#: ../FAQ.md:48 ../FAQ.md:473
msgid "Q5.3 GPU版的Paddle虽然能在CPU上运行,但是必须要有GPU设备吗?"
msgstr ""

#: ../FAQ.md:49 ../FAQ.md:479
msgid "Q5.4  如何指定用CPU还是GPU训练模型?"
msgstr ""

#: ../FAQ.md:50 ../FAQ.md:487
msgid "Q5.5 动态图模型和静态图模型的预测结果一致吗?"
msgstr ""

#: ../FAQ.md:51 ../FAQ.md:493
msgid "Q5.6 如何可视化acc、loss曲线图、模型网络结构图等?"
msgstr ""

#: ../FAQ.md:53
msgid "<a name=\"NLP精选\"></a>"
msgstr ""

#: ../FAQ.md:55
msgid "⭐️【精选】NLP精选5问"
msgstr ""

#: ../FAQ.md:57
msgid "<a name=\"1-1\"></a>"
msgstr ""

#: ../FAQ.md:61
msgid ""
"A: 通过使用PaddleNLP提供的 load_dataset,  MapDataset 和 IterDataset "
",可以方便的自定义属于自己的数据集哦,也欢迎您贡献数据集到PaddleNLP repo。"
msgstr ""

#: ../FAQ.md:63
msgid ""
"从本地文件创建数据集时,我们 推荐 根据本地数据集的格式给出读取function并传入 load_dataset() 中创建数据集。 "
"以waybill_ie快递单信息抽取任务中的数据为例:"
msgstr ""

#: ../FAQ.md:84
msgid "如果您习惯使用paddle.io.Dataset/IterableDataset来创建数据集也是支持的,您也可以从其他python对象如List对象创建数据集,详细内容可参照官方文档-自定义数据集。"
msgstr ""

#: ../FAQ.md:86
msgid "<a name=\"1-2\"></a>"
msgstr ""

#: ../FAQ.md:90
msgid "A: 内置的数据集、模型默认会下载到$HOME/.paddlenlp/下,通过配置环境变量可下载到指定路径:"
msgstr ""

#: ../FAQ.md:92
msgid "(1)Linux下,设置 export PPNLP_HOME=\"xxxx\",注意不要设置带有中文字符的路径。"
msgstr ""

#: ../FAQ.md:94
msgid "(2)Windows下,同样配置环境变量 PPNLP_HOME 到其他非中文字符路径,重启即可。"
msgstr ""

#: ../FAQ.md:96
msgid "<a name=\"1-3\"></a>"
msgstr ""

#: ../FAQ.md:100
msgid "A:(1)PaddleNLP预训练模型"
msgstr ""

#: ../FAQ.md:102
msgid "​    保存:"
msgstr ""

#: ../FAQ.md:109 ../FAQ.md:125
msgid "​    加载:"
msgstr ""

#: ../FAQ.md:116
msgid "(2)常规模型 保存:"
msgstr ""

#: ../FAQ.md:132
msgid "<a name=\"1-4\"></a>"
msgstr ""

#: ../FAQ.md:136
msgid ""
"A: 增加训练样本带来的效果是最直接的。此外,可以基于我们开源的预训练模型进行热启,再用少量数据集fine-"
"tune模型。此外,针对分类、匹配等场景,小样本学习也能够带来不错的效果。"
msgstr ""

#: ../FAQ.md:138
msgid "<a name=\"1-5\"></a>"
msgstr ""

#: ../FAQ.md:142
msgid ""
"A: 从工程角度,对于服务器端部署可以使用Paddle "
"Inference高性能预测引擎进行预测部署。对于Transformer类模型的GPU预测还可以使用PaddleNLP中提供的FasterTransformer功能来进行快速预测,其集成了NV"
" FasterTransformer并进行了功能增强。"
msgstr ""

#: ../FAQ.md:144
msgid ""
"从模型策略角度,可以使用一些模型小型化技术来进行模型压缩,如模型蒸馏和裁剪,通过小模型来实现加速。PaddleNLP中集成了ERNIE-"
"Tiny这样一些通用小模型供下游任务微调使用。另外PaddleNLP提供了模型压缩示例,实现了DynaBERT、TinyBERT、MiniLM等方法策略,可以参考对自己的模型进行蒸馏压缩。"
msgstr ""

#: ../FAQ.md:146
msgid "<a name=\"NLP通用问题\"></a>"
msgstr ""

#: ../FAQ.md:148
msgid "⭐️【理论篇】NLP通用问题"
msgstr ""

#: ../FAQ.md:150
msgid "<a name=\"2-2\"></a>"
msgstr ""

#: ../FAQ.md:154
msgid "A: 可以采用以下几种方法优化类别分布不均衡问题:"
msgstr ""

#: ../FAQ.md:156
msgid "(1)欠采样:对样本量较多的类别进行欠采样,去除一些样本,使得各类别数目接近。"
msgstr ""

#: ../FAQ.md:158
msgid "(2)过采样:对样本量较少的类别进行过采样,选择样本进行复制,使得各类别数目接近。"
msgstr ""

#: ../FAQ.md:160
msgid "(3)修改分类阈值:直接使用类别分布不均衡的数据训练分类器,会使得模型在预测时更偏向于多数类,所以不再以0.5为分类阈值,而是针对少数类在模型仅有较小把握时就将样本归为少数类。"
msgstr ""

#: ../FAQ.md:162
msgid "(4)代价敏感学习:比如LR算法中设置class_weight参数。"
msgstr ""

#: ../FAQ.md:164
msgid "<a name=\"2-3\"></a>"
msgstr ""

#: ../FAQ.md:168
msgid ""
"A: "
"很难定义具体需要多少条样本,取决于具体的任务以及数据的质量。如果数据质量没问题的话,分类、文本匹配任务所需数据量级在百级别,翻译则需要百万级能够训练出一个比较鲁棒的模型。如果样本量较少,可以考虑数据增强,或小样本学习。"
msgstr ""

#: ../FAQ.md:171
msgid "<a name=\"PaddleNLP实战问题\"></a>"
msgstr ""

#: ../FAQ.md:173
msgid "⭐️【实战篇】PaddleNLP实战问题"
msgstr ""

#: ../FAQ.md:175
msgid "<a name=\"数据问题\"></a>"
msgstr ""

#: ../FAQ.md:179
msgid "<a name=\"3-1\"></a>"
msgstr ""

#: ../FAQ.md:183
msgid ""
"A: "
"预训练模型通常会有配套的tokenzier和词典,对于大多数中文预训练模型,如ERNIE-3.0-Medium-zh,使用的都是字粒度的输入,tokenzier会将句子转换为字粒度的形式,模型无法收到词粒度的输入。如果希望引入额外的词典,需要修改预训练模型的tokenizer和词典,可以参考这里blog,另外注意embedding矩阵也要加上这些新增词的embedding表示。"
msgstr ""

#: ../FAQ.md:185
msgid ""
"另外还有一种方式可以使用这些字典信息,可以将数据中在词典信息中的词进行整体mask进行一个mask language "
"model的二次预训练,这样经过二次训练的模型就包含了对额外字典的表征。可参考 Mask Language Model 数据构建。"
msgstr ""

#: ../FAQ.md:188
msgid "此外还有些词粒度及字词混合粒度的预训练模型,在这些词粒度的模型下引入额外的词表也会容易些,我们也将持续丰富PaddleNLP中的预训练模型。"
msgstr ""

#: ../FAQ.md:190
msgid "<a name=\"训练调优问题\"></a>"
msgstr ""

#: ../FAQ.md:194
msgid "<a name=\"4-1\"></a>"
msgstr ""

#: ../FAQ.md:198
msgid ""
"A: "
"以bert为例,如果是使用PaddleNLP训练,通过save_pretrained()接口保存的模型,可通过from_pretrained()来加载:"
msgstr ""

#: ../FAQ.md:205
msgid "如果不是上述情况,可以使用如下方式加载模型,也欢迎您贡献模型到PaddleNLP repo中。"
msgstr ""

#: ../FAQ.md:207
msgid "(1)加载BertTokenizer和BertModel"
msgstr ""

#: ../FAQ.md:214
msgid ""
"(2)调用save_pretrained()生成 model_config.json、 "
"tokenizer_config.json、model_state.pdparams、  vocab.txt "
"文件,保存到./checkpoint:"
msgstr ""

#: ../FAQ.md:221
msgid ""
"(3)修改model_config.json、 "
"tokenizer_config.json这两个配置文件,指定为自己的模型,之后通过from_pretrained()加载模型。"
msgstr ""

#: ../FAQ.md:228
msgid "<a name=\"4-2\"></a>"
msgstr ""

#: ../FAQ.md:232
msgid "A:"
msgstr ""

#: ../FAQ.md:234
msgid "(1)完全恢复训练状态,可以先将lr、 optimizer、model的参数保存下来:"
msgstr ""

#: ../FAQ.md:242
msgid "(2)加载lr、 optimizer、model参数即可恢复训练:"
msgstr ""

#: ../FAQ.md:250
msgid "<a name=\"4-3\"></a>"
msgstr ""

#: ../FAQ.md:254
msgid "A: 有多种方法可以尝试:"
msgstr ""

#: ../FAQ.md:257
msgid "(1)可以直接修改 PaddleNLP 内部代码实现,在需要冻结梯度的地方用 paddle.no_grad() 包裹一下"
msgstr ""

#: ../FAQ.md:259
msgid "paddle.no_grad() 的使用方式,以对 forward() 进行冻结为例:"
msgstr ""

#: ../FAQ.md:282
msgid "paddle.no_grad() 的使用也不局限于模型内部实现里面,也可以包裹外部的方法,比如:"
msgstr ""

#: ../FAQ.md:296
msgid ""
"(2)第二种方法:以ERNIE为例,将模型输出的 tensor 设置 stop_gradient 为 True。可以使用 "
"register_forward_post_hook 按照如下的方式尝试:"
msgstr ""

#: ../FAQ.md:305
msgid ""
"(3)第三种方法:在 optimizer 上进行处理,model.parameters 是一个 List,可以通过 name "
"进行相应的过滤,更新/不更新某些参数,这种方法需要对网络结构的名字有整体了解,因为网络结构的实体名字决定了参数的名字,这个使用方法有一定的门槛:"
msgstr ""

#: ../FAQ.md:311
msgid "<a name=\"4-4\"></a>"
msgstr ""

#: ../FAQ.md:315
msgid ""
"A: 飞桨主框架提供了两种训练与预测的方法,一种是用 "
"paddle.Model()对模型进行封装,通过高层API如Model.fit()、Model.evaluate()、Model.predict()等完成模型的训练与预测;另一种就是基于基础API常规的训练方式。"
msgstr ""

#: ../FAQ.md:317
msgid "(1)对于第一种方法:"
msgstr ""

#: ../FAQ.md:319
msgid ""
"我们可以设置 paddle.Model.fit()  API中的 eval_data 和 eval_freq "
"参数在训练过程中打印模型评价指标:eval_data 参数是一个可迭代的验证集数据源,eval_freq 参数是评估的频率;当eval_data "
"给定后,eval_freq 的默认值为1,即每一个epoch进行一次评估。注意:在训练前,我们需要在 Model.prepare() "
"接口传入metrics参数才能在eval时打印模型评价指标。"
msgstr ""

#: ../FAQ.md:321
msgid ""
"关于模型保存,我们可以设置 paddle.Model.fit() 中的 save_freq 参数控制模型保存的频率:save_freq "
"的默认值为1,即每一个epoch保存一次模型。"
msgstr ""

#: ../FAQ.md:323
msgid "(2)对于第二种方法:"
msgstr ""

#: ../FAQ.md:325
msgid "我们在PaddleNLP的examples目录下提供了常见任务的训练与预测脚本:如GLUE 和 SQuAD等"
msgstr ""

#: ../FAQ.md:327
msgid "开发者可以参考上述脚本进行自定义训练与预测脚本的开发。"
msgstr ""

#: ../FAQ.md:329
msgid "<a name=\"4-5\"></a>"
msgstr ""

#: ../FAQ.md:333
msgid "A:  一般先考虑内存、显存(使用GPU训练的话)是否不足,可将训练和评估的batch size调小一些。"
msgstr ""

#: ../FAQ.md:335
msgid "需要注意,batch size调小时,学习率learning rate也要调小,一般可按等比例调整。"
msgstr ""

#: ../FAQ.md:337
msgid "<a name=\"4-6\"></a>"
msgstr ""

#: ../FAQ.md:341
msgid "A: 在验证和测试过程中常常出现的结果不一致情况一般有以下几种解决方法:"
msgstr ""

#: ../FAQ.md:343
msgid "(1)确保设置了eval模式,并保证数据相关的seed设置保证数据一致性。"
msgstr ""

#: ../FAQ.md:345
msgid ""
"(2)如果是下游任务模型,查看是否所有模型参数都被导入了,直接使用bert-"
"base这种预训练模型是不包含任务相关参数的,要确认导入的是微调后的模型,否则任务相关参数会随机初始化导致出现随机性。"
msgstr ""

#: ../FAQ.md:347
msgid ""
"(3)部分算子使用CUDNN后端产生的不一致性可以通过环境变量的设置来避免。如果模型中使用了CNN相关算子,可以设置FLAGS_cudnn_deterministic=True。如果模型中使用了RNN相关算子,可以设置CUBLAS_WORKSPACE_CONFIG=:16:8或CUBLAS_WORKSPACE_CONFIG=:4096:2(CUDNN"
" 10.2以上版本可用,参考CUDNN 8 release note)。"
msgstr ""

#: ../FAQ.md:349
msgid "<a name=\"4-7\"></a>"
msgstr ""

#: ../FAQ.md:353
msgid ""
"A: 目前的API设计不保留中间层输出,当然在PaddleNLP里可以很方便地修改源码。 "
"此外,还可以在ErnieModel的__init__函数中通过register_forward_post_hook()为想要保留输出的Layer注册一个forward_post_hook函数,在forward_post_hook函数中把Layer的输出保存到一个全局的List里面。forward_post_hook函数将会在forward函数调用之后被调用,并保存Layer输出到全局的List。详情参考register_forward_post_hook()。"
msgstr ""

#: ../FAQ.md:356
msgid "<a name=\"部署问题\"></a>"
msgstr ""

#: ../FAQ.md:360
msgid "<a name=\"5-1\"></a>"
msgstr ""

#: ../FAQ.md:364
msgid "A: 我们推荐在动态图模式下开发,静态图模式部署。"
msgstr ""

#: ../FAQ.md:366
msgid "(1)动转静"
msgstr ""

#: ../FAQ.md:368
msgid ""
"动转静,即将动态图的模型转为可用于部署的静态图模型。 动态图接口更加易用,python "
"风格的交互式编程体验,对于模型开发更为友好,而静态图相比于动态图在性能方面有更绝对的优势。因此动转静提供了这样的桥梁,同时兼顾开发成本和性能。 "
"可以参考官方文档 动态图转静态图文档,使用 paddle.jit.to_static 完成动转静。 另外,在 PaddleNLP "
"我们也提供了导出静态图模型的例子,可以参考 waybill_ie 模型导出。"
msgstr ""

#: ../FAQ.md:373
msgid "(2)借助Paddle Inference部署"
msgstr ""

#: ../FAQ.md:375
msgid ""
"动转静之后保存下来的模型可以借助Paddle Inference完成高性能推理部署。Paddle Inference内置高性能的CPU/GPU "
"Kernel,结合细粒度OP横向纵向融合等策略,并集成 TensorRT 实现模型推理的性能提升。具体可以参考文档 Paddle "
"Inference 简介。 为便于初次上手的用户更易理解 NLP 模型如何使用Paddle Inference,PaddleNLP "
"也提供了对应的例子以供参考,可以参考 /PaddleNLP/examples 下的deploy目录,如基于ERNIE的命名实体识别模型部署。"
msgstr ""

#: ../FAQ.md:378
msgid "<a name=\"5-2\"></a>"
msgstr ""

#: ../FAQ.md:382
msgid "A: 首先,需要将静态图参数保存成ndarray数据,然后将静态图参数名和对应动态图参数名对应,最后保存成动态图参数即可。详情可参考参数转换脚本。"
msgstr ""

#: ../FAQ.md:384
msgid "<a name=\"NLP应用场景\"></a>"
msgstr ""

#: ../FAQ.md:386
msgid "⭐️特定模型和应用场景咨询"
msgstr ""

#: ../FAQ.md:388
msgid "<a name=\"6-1\"></a>"
msgstr ""

#: ../FAQ.md:392
msgid "A: 更新label文件tag.dict,添加 修改下CRF的标签数即可。"
msgstr ""

#: ../FAQ.md:394
msgid "可参考自定义标签示例,增量训练自定义LABLE示例。"
msgstr ""

#: ../FAQ.md:396
msgid "<a name=\"6-2\"></a>"
msgstr ""

#: ../FAQ.md:400
msgid "A: 预训练模型+CRF是一个通用的序列标注的方法,目前预训练模型对序列信息的表达也是非常强的,也可以尝试直接使用预训练模型对序列标注任务建模。"
msgstr ""

#: ../FAQ.md:402
msgid "<a name=\"6-3\"></a>"
msgstr ""

#: ../FAQ.md:404
msgid "Q4.3.【阅读理解】MapDatasets的map()方法中对应的batched=True怎么理解,在阅读理解任务中为什么必须把参数batched设置为True?"
msgstr ""

#: ../FAQ.md:406
msgid ""
"A: "
"batched=True就是对整个batch(这里不一定是训练中的batch,理解为一组数据就可以)的数据进行map,即map中的trans_func接受一组数据为输入,而非逐条进行map。在阅读理解任务中,根据使用的doc_stride不同,一条样本可能被转换成多条feature,对数据逐条map是行不通的,所以需要设置batched=True。"
msgstr ""

#: ../FAQ.md:408
msgid "<a name=\"6-4\"></a>"
msgstr ""

#: ../FAQ.md:412
msgid ""
"A: 语义索引要解决的核心问题是如何从海量 Doc 中通过 ANN 索引的方式快速、准确地找出与 query "
"相关的文档,语义匹配要解决的核心问题是对 query和文档更精细的语义匹配信息建模。换个角度理解, "
"语义索引是要解决搜索、推荐场景下的召回问题,而语义匹配是要解决排序问题,两者要解决的问题不同,所采用的方案也会有很大不同,但两者间存在一些共通的技术点,可以互相借鉴。"
msgstr ""

#: ../FAQ.md:414
msgid "<a name=\"6-5\"></a>"
msgstr ""

#: ../FAQ.md:418
msgid ""
"A: 其主要依赖于二次构造数据来进行finetune,同时要更新termtree信息。wordtag分为两个步骤: "
"(1)通过BIOES体系进行分词; (2)将分词后的信息和TermTree进行匹配。 因此我们需要: "
"(1)分词正确,这里可能依赖于wordtag的finetune数据,来让分词正确; "
"(2)wordtag里面也需要把分词正确后term打上相应的知识信息。wordtag自定义TermTree的方式将在后续版本提供出来。"
msgstr ""

#: ../FAQ.md:425
msgid "可参考issue。"
msgstr ""

#: ../FAQ.md:427
msgid "<a name=\"使用咨询问题\"></a>"
msgstr ""

#: ../FAQ.md:429
msgid "⭐️其他使用咨询"
msgstr ""

#: ../FAQ.md:431
msgid "<a name=\"7-1\"></a>"
msgstr ""

#: ../FAQ.md:435
msgid "A: 在CUDA11安装,可参考issue,其他CUDA版本安装可参考 官方文档"
msgstr ""

#: ../FAQ.md:437
msgid "<a name=\"7-2\"></a>"
msgstr ""

#: ../FAQ.md:441
msgid "A: 有多种方法: (1)可以通过set_value()来设置parameter,set_value()的参数可以是numpy或者tensor。"
msgstr ""

#: ../FAQ.md:453
msgid "(2)通过create_parameter()设置参数。"
msgstr ""

#: ../FAQ.md:471
msgid "<a name=\"7-3\"></a>"
msgstr ""

#: ../FAQ.md:475
msgid ""
"A: 不支持 GPU 的设备只能安装 CPU 版本的 PaddlePaddle。 GPU 版本的 PaddlePaddle 如果想只在 CPU "
"上运行,可以通过 export CUDA_VISIBLE_DEVICES=-1 来设置。"
msgstr ""

#: ../FAQ.md:477
msgid "<a name=\"7-4\"></a>"
msgstr ""

#: ../FAQ.md:481
msgid "A: 一般我们的训练脚本提供了 --device 选项,用户可以通过 --device 选择需要使用的设备。"
msgstr ""

#: ../FAQ.md:483
msgid ""
"具体而言,在Python文件中,我们可以通过·paddle.device.set_device()·,设置为gpu或者cpu,可参考 "
"set_device文档。"
msgstr ""

#: ../FAQ.md:485
msgid "<a name=\"7-5\"></a>"
msgstr ""

#: ../FAQ.md:489
msgid "A: 正常情况下,预测结果应当是一致的。如果遇到不一致的情况,可以及时反馈给 PaddleNLP 的开发人员,我们进行处理。"
msgstr ""

#: ../FAQ.md:491
msgid "<a name=\"7-6\"></a>"
msgstr ""

#: ../FAQ.md:495
msgid ""
"A: "
"可使用VisualDL进行可视化。其中acc、loss曲线图的可视化可参考Scalar——折线图组件使用指南,模型网络结构的可视化可参考Graph——网络结构组件使用指南。"
msgstr ""