Commit db459047 authored by wanglch's avatar wanglch
Browse files

Update README.md

parent d0ebc7a5
......@@ -40,7 +40,7 @@ BERT用大量的无监督文本通过自监督训练的方式训练,把文本
## 数据集
模型训练的数据集来自Wikipedia 2020/01/01,即一种常用的自然语言处理数据集,它包含了维基百科上的文章和对应的摘要(即第一段内容),可用于各种文本相关的任务,例如文本分类、文本摘要、命名实体识别等。
模型训练的数据集来自[Wikipedia](http://113.200.138.88:18080/aidatasets/wikipedia),即一种常用的自然语言处理数据集,它包含了维基百科上的文章和对应的摘要(即第一段内容),可用于各种文本相关的任务,例如文本分类、文本摘要、命名实体识别等。
下载+预处理数据可按照下述进行,最终获得的输入数据如下图所示:
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment