"SEQ2SEQ"
Необходимо реализовать собственную систему encoder-decoder для генерации текста на естественном языке в Google Colab.
Вы можете выбрать каким образом и какой объем вы генерируете, тем самым определив для себя сложность и максимальную оценку (варианты и оценки ниже на скрине). При генерации предложений модель должна генерировать знаки препинания.
Дополнительный балл дается за рандомизацию вывода при одинаковом инпуте. Без объяснения принципа работы вашего способа рандомизации и ссылки на источник при ее наличии усложнение не засчитывается.
Разрешено генерировать на следующих языках: ru, en, fr, de Вы можете использовать любой датасет, позже пришлю вам что-нибудь для английского. Если попросите, то могу что-то для русского еще поискать.
Запрещено применять предобученные языковые модели для всего, кроме предобработки и получения эмбеддингов. Ближе к дедлайну я пришлю небольшой файл с предложениями, которые нужно будет попробовать для генерации в вашей модели
Дедлайн: 15.03 включительно
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |