Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
chenpangpang
transformers
Commits
a9c7849c
Unverified
Commit
a9c7849c
authored
Sep 23, 2020
by
blinovpd
Committed by
GitHub
Sep 22, 2020
Browse files
[model_cards] blinoff/roberta-base-russian-v0 (#7317)
parent
f5518e56
Changes
1
Hide whitespace changes
Inline
Side-by-side
Showing
1 changed file
with
61 additions
and
0 deletions
+61
-0
model_cards/blinoff/roberta-base-russian-v0/README.md
model_cards/blinoff/roberta-base-russian-v0/README.md
+61
-0
No files found.
model_cards/blinoff/roberta-base-russian-v0/README.md
0 → 100644
View file @
a9c7849c
---
language
:
ru
widget
:
-
text
:
"
Мозг
—
это
машина
<mask>,
которая
пытается
снизить
ошибку
в
прогнозе."
---
# RoBERTa-like language model trained on part of part of TAIGA corpus
## Training Details
-
about 60k steps

## Example pipeline
```
python
from
transformers
import
pipeline
from
transformers
import
RobertaTokenizerFast
tokenizer
=
RobertaTokenizerFast
.
from_pretrained
(
'blinoff/roberta-base-russian-v0'
,
max_len
=
512
)
fill_mask
=
pipeline
(
"fill-mask"
,
model
=
"blinoff/roberta-base-russian-v0"
,
tokenizer
=
tokenizer
)
fill_mask
(
"Мозг — это машина <mask>, которая пытается снизить ошибку в прогнозе."
)
# {
# 'sequence': '<s>Мозг — это машина города, которая пытается снизить ошибку в прогнозе.</s>',
# 'score': 0.012859329581260681,
# 'token': 2144,
# 'token_str': 'ĠгоÑĢода'
# },
# {
# 'sequence': '<s>Мозг — это машина человека, которая пытается снизить ошибку в прогнозе.</s>',
# 'score': 0.01185101643204689,
# 'token': 1470,
# 'token_str': 'ĠÑĩеловека'
# },
# {
# 'sequence': '<s>Мозг — это машина дома, которая пытается снизить ошибку в прогнозе.</s>',
# 'score': 0.009940559044480324,
# 'token': 1411,
# 'token_str': 'Ġдома'
# },
# {
# 'sequence': '<s>Мозг — это машина женщина, которая пытается снизить ошибку в прогнозе.</s>',
# 'score': 0.007794599514454603,
# 'token': 2707,
# 'token_str': 'ĠженÑīина'
# },
# {
# 'sequence': '<s>Мозг — это машина женщины, которая пытается снизить ошибку в прогнозе.</s>',
# 'score': 0.007725382689386606,
# 'token': 3546,
# 'token_str': 'ĠженÑīинÑĭ'
# }
```
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment